엔비디아가 기업과 개발자가 독립적으로 작동하는 AI 에이전트를 구축할 수 있도록 돕는 새로운 오픈 추론 모델 패밀리, 엘라 네모트론(LLama Nemotron) 추론 모델을 공개했어요. 이번 모델은 기존 엘라(Llama) 모델을 기반으로 포스트 트레이닝을 통해 수학, 코딩, 복잡한 의사결정 등 다단계 추론 작업에서 최대 20% 향상된 정확도와 5배 빠른 추론 속도를 자랑합니다.
새로운 모델 패밀리는 Nano, Super, Ultra 세 가지 크기로 제공되어 PC와 엣지 디바이스, 단일 GPU, 멀티 GPU 서버 등 각기 다른 환경에 최적화되어 있어요. 엔비디아는 자사 DGX 클라우드(DGX Cloud)를 활용해 고품질 합성 데이터와 다양한 큐레이션 데이터를 사용하여 모델 성능을 극대화했답니다.
또한, 개발자와 기업이 직접 커스텀 추론 모델을 구축할 수 있도록 도구, 데이터셋, 최적화 기법을 오픈소스로 공개할 예정이에요. Microsoft, SAP, ServiceNow, Accenture, Deloitte 등 글로벌 기업들이 이미 이 모델을 활용해 AI 에이전트를 강화하고 있으며, Microsoft는 Azure AI 파운드리와, SAP는 Business AI 솔루션 및 AI 코파일럿 Joule 등에 통합하는 등 다양한 협업이 진행되고 있어요.
엔비디아는 AI-Q 블루프린트(AI-Q Blueprint), AI Data Platform, NIM 마이크로서비스, NeMo 마이크로서비스 등 최신 에이전틱 AI 도구들을 통해, AI 에이전트 구축과 지속적인 학습 환경을 지원하고 있답니다. 이번 출시로 기업들은 복잡한 업무를 보다 효율적으로 처리할 AI 에이전트를 저렴한 비용으로 구축할 수 있게 되어, AI 기술의 다양성 보편화에 한 걸음 더 다가갈 전망이에요! |