엔비디아, AI 에이전트용 모델 '네모트론 3 슈퍼' 공개…속도 5배↑ 비용은 줄였다

엔비디아(NVIDIA)가 스스로 판단하고 행동하는 AI, 즉 ‘AI 에이전트’ 전용 언어 모델 ‘네모트론 3 슈퍼(Nemotron 3 Super)’를 공개했다. 복잡한 작업을 자동으로 처리하는 AI 시스템의 속도와 비용 문제를 동시에 해결하겠다는 목표다.

네모트론 3 슈퍼는 1,200억 개의 파라미터(AI 모델의 두뇌 역할을 하는 연산 단위)를 갖추고 있지만, 실제 작동할 때는 그 중 120억 개만 골라서 쓴다. 필요한 부분만 켜고 나머지는 꺼두는 방식이라 성능은 유지하면서 전기요금처럼 드는 연산 비용을 크게 줄일 수 있다.

기존 모델과 비교해 처리 속도는 최대 5배, 정확도는 최대 2배 높아졌다. 특히 여러 AI가 팀처럼 협력해 일을 나눠 처리하는 ‘멀티 에이전트’ 환경에서 두드러진다. 이런 시스템은 단순 챗봇보다 최대 15배 많은 데이터를 주고받기 때문에, 빠르고 저렴하게 처리하는 게 무엇보다 중요하다.

이 모델이 풀려는 문제는 두 가지다. 하나는 AI가 긴 작업을 하다가 처음 목표를 잊어버리는 현상이고, 다른 하나는 판단이 필요할 때마다 무거운 모델을 돌려야 해서 비용이 급격히 올라가는 문제다. 네모트론 3 슈퍼는 AI가 한 번에 기억할 수 있는 정보의 양을 최대 100만 토큰(단어나 문장 조각 단위)으로 늘려 작업 도중 목표를 잃지 않도록 설계됐다.

엔비디아 창업자 겸 최고경영자 젠슨 황은 “개방형 혁신이 AI 발전의 토대”라며 “네모트론을 통해 개발자들이 투명하고 효율적인 AI 에이전트 시스템을 직접 만들 수 있도록 하겠다”고 말했다.

이 모델은 소프트웨어 개발, 금융 분석, 사이버 보안 등 다양한 분야에 쓸 수 있으며, AI 검색 서비스 퍼플렉시티(Perplexity), 코드 리뷰 도구 코드래빗(CodeRabbit) 등 여러 기업이 이미 도입 중이다. 구글(Google) 클라우드, 오라클(Oracle) 클라우드에서 사용 가능하며, 아마존(Amazon) 웹 서비스와 마이크로소프트(Microsoft) 애저에도 곧 추가될 예정이다. 모델 구조와 학습 데이터를 모두 공개해 개발자들이 자유롭게 가져다 쓰고 고칠 수 있다.

자세한 내용은 엔비디아 공식 블로그에서 확인할 수 있다.

이미지 출처: 엔비디아