Search

엔비디아, 피지컬 AI 첫 완전 개방형 옴니모델 ‘코스모스 3’ 공개…로봇·자율주행 학습 주기 ‘수개월→수일’

엔비디아, 피지컬 AI 첫 완전 개방형 옴니모델 '코스모스 3' 공개…로봇·자율주행 학습 주기 '수개월→수일'
엔비디아, 피지컬 AI 첫 완전 개방형 옴니모델 '코스모스 3' 공개…로봇·자율주행 학습 주기 '수개월→수일'

엔비디아(NVIDIA)가 6월 1일 컴퓨텍스 2026(Computex 2026) GTC 타이베이 무대에서 피지컬 AI(Physical AI) 전용 완전 개방형 옴니모델 ‘코스모스 3(Cosmos 3)’를 공식 발표했다. 텍스트·이미지·동영상·주변 음향·행동을 한 모델 안에서 이해하고 생성해, 로봇과 자율주행차의 학습·평가 주기를 수개월에서 수일로 단축한다는 목표를 내세웠다.

엔비디아 발표에 따르면 코스모스 3는 비전 추론, 월드 제너레이션(world generation), 행동 예측을 단일 시스템에 묶은 ‘믹스처 오브 트랜스포머(Mixture-of-Transformers)’ 구조를 채택한다. 같은 모델이 시각 정보를 해석하고, 가상 환경을 생성하고, 다음 행동을 예측한다는 점이 기존 분리형 파이프라인과 다른 지점이다.

라인업은 세 종이다. 640억 개 파라미터(64B)의 코스모스 3 슈퍼(Super)는 대규모 합성 데이터 생성과 연구용으로 즉시 공개됐다. 160억 개 파라미터(16B)의 코스모스 3 나노(Nano)는 RTX PRO 6000 GPU 같은 워크스테이션급 환경에서 동작하며 효율 추론에 최적화됐다. 실시간 추론용 코스모스 3 엣지(Edge)는 출시 임박 단계다.

엔비디아는 동시에 ‘엔비디아 코스모스 코얼리션(Cosmos Coalition)’ 출범도 알렸다. 애자일 로봇(Agile Robots), 블랙 포레스트 랩스(Black Forest Labs), 제너럴리스트(Generalist), LTX, 런웨이(Runway), 스킬드 AI(Skild AI) 등 로보틱스·생성형 영상 분야 선도 기업들이 차세대 오픈 월드 모델을 함께 개발한다는 구상이다.

악시오스(Axios) 보도에 따르면 코스모스 3는 가중치(weights)가 허깅페이스(Hugging Face)에 그대로 공개되는 ‘오픈 웨이트’ 모델이다. 메타(Meta)의 라마(Llama) 시리즈가 LLM 영역에서 오픈 가중치 흐름을 이끌었다면, 엔비디아는 피지컬 AI·로보틱스 영역에서 같은 전략을 선언한 것으로 풀이된다.

국내 영향도 작지 않을 전망이다. 현대차 메타플랜트와 LG전자 로봇사업부, 두산로보틱스 등 자체 휴머노이드·산업 로봇 라인업을 갖춘 한국 기업들이 코스모스 3 기반 합성 데이터 생성과 정책 학습을 빠르게 끌어다 쓸 수 있는 환경이 마련됐기 때문이다. 같은 날 황젠슨(Jensen Huang) 엔비디아 CEO가 한국 6대 기업과 만찬을 가진 일정과 맞물려, 한·미·대만 피지컬 AI 협업 축이 한층 굳어지는 분위기다.

자세한 내용은 엔비디아 뉴스룸(NVIDIA Newsroom)에서 확인할 수 있다.

이미지 출처: 이디오그램 생성