Search

NVIDIA, GPT-4 능가하는 ‘네모트론 70B’ 조용히 출시… AI 업계 판도 변화 예고

nVDIA
이미지 출처: nVDIA

엔비디아(NVIDIA)가 최근 새로운 인공지능(AI) 모델 ‘네모트론 70B(Nemotron 70B)’를 조용히 출시했다. 이 모델은 오픈AI(OpenAI)의 GPT-4를 여러 벤치마크에서 앞선 것으로 나타났다.

네모트론 70B는 라마 3.1(Llama 3.1) 계열의 대규모 언어 모델(LLM)로, 기존 생성형 AI 모델들이 직면한 견고성, 정확도, 효율성, 비용 등의 문제를 해결하고자 개발됐다. 이 모델은 다양한 AI 애플리케이션에 실용적으로 적용 가능한 정확한 출력을 제공하는 것이 특징이다.

네모트론 70B의 기술적 특징

네모트론 70B는 700억 개의 매개변수를 가진 구조를 자랑한다. 이 모델은 향상된 다중 쿼리 주의(multi-query attention) 메커니즘과 최적화된 트랜스포머 설계를 활용해 정확도를 유지하면서도 더 빠른 연산을 가능케 한다.

라마 3.1 계열의 이번 모델은 이전 모델들에 비해 더 발전된 학습 메커니즘을 특징으로 한다. 이를 통해 네모트론 70B는 적은 리소스로도 향상된 결과를 얻을 수 있다. 또한, 강력한 미세 조정 기능을 갖추고 있어 사용자들이 특정 산업과 작업에 맞게 모델을 커스터마이징할 수 있다.

GPT-4를 뛰어넘는 성능

네모트론 70B의 중요성은 진화하는 생성형 AI 환경에서 더욱 두드러진다. 이 모델은 주요 자연어 이해 테스트에서 오픈AI의 GPT-4를 능가하는 정확도를 보여주며 새로운 성능 기준을 제시했다.

허깅 페이스(Hugging Face)와 같은 플랫폼에서 공유된 최근 평가에 따르면, 이 모델은 문맥 이해와 다국어 기능에서 탁월한 성능을 보여 금융, 의료, 고객 서비스 등 실제 애플리케이션에 매우 적합한 것으로 나타났다.

엔비디아에 따르면 네모트론 70B는 종합적인 언어 이해 작업에서 이전 모델들보다 최대 15% 향상된 성능을 보였다. 이는 의미 있고 맥락을 이해하는 응답을 제공할 수 있는 모델의 강력한 성능을 반영한다.

AI 혁신과 채택의 게임 체인저 될까?

네모트론 70B는 대규모 언어 모델의 지형을 재정의할 준비가 되어 있다. 이 모델은 효율성, 정확성, 에너지 소비 측면에서 중요한 격차를 해소하고 있다.

엔비디아는 생성형 AI에서 가능한 경계를 넓힘으로써 현재 사용 가능한 가장 진보된 모델들과 경쟁할 뿐만 아니라 GPT-4를 포함한 일부 모델을 능가하는 도구를 만들어냈다.

낮은 에너지 사용량, 인상적인 성능, 다양한 적용 범위를 갖춘 네모트론 70B는 생성 모델이 어떻게 작동하고 다양한 산업에 기여할 수 있는지에 대한 새로운 기준을 제시하고 있다.

기사에 인용된 리포트 원문은 링크에서 확인할 수 있다.




NVIDIA, GPT-4 능가하는 ‘네모트론 70B’ 조용히 출시… AI 업계 판도 변화 예고 – AI 매터스 l AI Matters