
세계 최대 인공지능(AI) 반도체 기업인 엔비디아가 AI 에이전트에 최적화된 새로운 오픈소스 모델을 공개했다. 동시에 AI 클라우드 기업에 대한 대규모 투자도 발표하며 AI 생태계 확대에 나섰다.
11일(현지시간) 블룸버그통신에 따르면 엔비디아는 매개변수 1200억 개 규모의 개방형 모델인 ‘네모트론 3 슈퍼’를 출시한다고 밝혔다. 해당 모델은 인간의 직접적인 개입 없이 스스로 판단하고 외부 도구를 활용해 복잡한 업무를 수행하는 AI 에이전트 운영에 초점을 맞춰 설계됐다.
일반 챗봇이 질문에 답하는 데 주력하는 것과 달리, AI 에이전트는 목표 달성을 위해 여러 단계의 추론을 반복하고 필요한 외부 시스템을 호출하는 방식으로 작동한다. 이 과정에서 동일한 정보와 맥락을 여러 차례 읽고 처리해야 하기 때문에 데이터 처리량이 일반 챗봇보다 최대 15배까지 증가한다.
네모트론3 슈퍼는 이러한 문제를 해결하기 위해 ‘혼합 전문가’ 구조를 채택했다. 전체 1200억 개의 파라미터 가운데 상황에 따라 최소 120억 개만 활성화해 연산 효율을 높이고 비용을 낮추는 방식이다.
엔비디아는 이 모델이 동급 모델 가운데 높은 정확도를 보이는 것은 물론 최신 ‘블랙웰’ 칩을 이용해 구동하면 이전 세대 칩 대비 추론 속도가 최대 4배 빠르다고 밝혔다.
한편 엔비디아는 이날 네덜란드에 본사를 둔 AI 클라우드 기업 네비우스와 전략적 협력 관계를 맺고 20억달러(약 2조9600억원)를 투자한다는 소식도 발표했다.
이번 협력에 따라 양사는 AI 데이터센터 설계와 추론 및 에이전트 기술 최적화, 차세대 엔비디아 칩의 조기 도입 등 다양한 분야에서 협력할 예정이다. 네비우스는 2030년까지 5기가와트(GW) 이상의 엔비디아 기반 AI 시스템을 구축할 계획이다.




