엔비디아는 2025년 12월 15일에, 특화형 에이전트 AI 개발 강화, AI 업계 전체의 투명성, 효율성을 목적으로 설계된 오픈 AI 모델, 데이터, 라이브러리의 "Nemotron 3" 패밀리를 발표, Nemotron 3는 필요한 부분만을 활성화시킴으로써, 멀티 에이전트를 효율적으로 가동시키면서 비용을 절감할 수 있도록 되어 있다는 것.
Nemotron 3 시리즈는 여러 전문 에이전트를 조합한 MoE 모델로, 300억 파라미터의 소형 모델 'Nemotron 3 Nano', 약 1000억 파라미터를 갖추고 토큰당 최대 100억 파라미터를 활성화할 수 있는 고정밀 추론 모델 'Nemotron 3 Super', 약 5000억 파라미터로 토큰당 최대 500억 파라미터를 활성화할 수 있는 대규모 추론 엔진 'Nemotron 3 Ultra'의 3가지 사이즈를 전개하고 있다.
Nemotron 패밀리는, 대규모 멀티 환경의 동시 훈련을 가능하게 하는 고급 강화 학습 기술을 통해, 뛰어난 정확도를 실현하는 동시에, 획기적인 하이브리드 MoE 아키텍처를 통해, 대규모 멀티 에이전트 시스템 용도에 있어 클래스 최고 수준의 매우 높은 토큰 생성 기능을 발휘한다. NVIDIA에 의하면, Nemotron 3 Nano는, 2025년 8월의 「Nemotron Nano 2」와 비교해 4배 높은 스루풋을 실현하고 있다고 한다.
https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models/?ncid=so-twit-561360
AI 모델을 분석하는 Artificial Analysis는, Nemotron 3 Nano를 "동급에서 가장 개방적이고 효율적인 모델"로 평가하고 코딩, 추론, 에이전트 벤치마크 전체에서 정상급 정확도를 달성했음을 보고했으며, 또한 출시 전에 실시한 테스트에서는 초당 약 380개 토큰의 출력 속도를 기록하며 "인텔리전스뿐만 아니라 효율성에도 중점을 두어 속도와 성능의 매력적인 트레이드오프를 실현하고 있습니다"라고 Artificial Analysis는 말한다.
또한, Nemotron 3 Super 및 Ultra는, 메모리 요구 사항을 대폭 절감하여 훈련을 고속화하는 효율성을 갖추고 있고, 이를 통해 고정밀 포맷과 비교하여 정확도를 희생하지 않고, 기존 인프라 상에서 보다 대규모 모델을 훈련할 수 있다. Nemotron 3 Super와 Ultra는 NVIDIA의 Blackwell 아키텍처 상에서 작동하며, NVFP4 트레이닝 포맷을 채택함으로써, 메모리 요구 사항을 줄이고 기존 인프라에서의 대규모 학습을 가능하게 하고 있다.
Nemotron은, 엔비디아의 보다 광범위한 AI 노력을 지원하고 있으며, 전 세계 조직이 자체 데이터, 규제, 가치관에 따른 AI 시스템을 구축할 수 있는 개방적이고 투명하며 효율적인 모델을 채택하고 있다. 젠슨 황 엔비디아 CEO는 "오픈 이노베이션은 AI 진보의 기반입니다. 네모트론에 의해 우리는 고도의 AI를 오픈 플랫폼으로 변혁하고 개발자가 대규모 에이전트 시스템을 구축하는 데 필요한 투명성과 효율성을 제공할 것입니다"라고 말하고 있다.
Nemotron 3 Nano는, Hugging Face 등 여러 플랫폼에서 다운로드할 수 있고, 또한 Nemotron용으로 공개된 데이터셋에는, 3조 토큰 규모의 프리 트레이닝 데이터, 포스트 트레이닝 데이터, 강화 학습 데이터가 포함되어 있으며, 라이브러리도 오픈소스로 제공되고 있다. Nemotron 3 Super와 Ultra는 2026년 상반기에 출시될 예정.


