Search

[엔비디아 GTC 2026 몰아보기 #1] 베라루빈 NVL72 공식 공개…학습 3.5배·추론 5배 상승

[엔비디아 GTC 몰아보기 #1] 베라루빈 NVL72 공식 공개…학습 3.5배·추론 5배
[엔비디아 GTC 몰아보기 #1] 베라루빈 NVL72 공식 공개…학습 3.5배·추론 5배

젠슨 황 엔비디아 CEO가 6월 1일 GTC 타이베이 키노트에서 차세대 AI 슈퍼컴퓨터 ‘베라루빈(Vera Rubin) NVL72’를 공식 발표했다. 한 랙에 Rubin GPU 72개와 Vera CPU 36개가 NVLink 6, ConnectX-9 SuperNIC, BlueField-4 DPU로 묶이는 구조로, 직전 블랙웰 대비 학습 성능 3.5배·추론 성능 5배를 낸다. 토큰당 비용은 10분의 1 수준으로 떨어진다.

Vera CPU는 88코어 ARM 기반 신규 설계로, NVIDIA가 자체적으로 첫 출시하는 데이터센터 CPU다. Rubin GPU는 HBM4 메모리 288GB(GPU당)에 4.8TB/s 대역폭을 지원하며, NVLink 6는 GPU 간 통신 대역폭이 직전 세대 대비 두 배로 늘었다. 핵심은 ‘MoE(Mixture-of-Experts) 학습 최적화’다. 동일 규모 MoE 모델을 학습할 때 필요한 GPU 수가 블랙웰 대비 4분의 1로 줄어든다.

한 시스템에 부품 약 200만 개·타이완 생태계 파트너 150곳이 들어가며, 황 CEO는 “타이완 역사상 가장 큰 단일 제품 출시”라고 표현했다. SK하이닉스가 HBM4 물량의 약 3분의 2를 공급하는 것으로 알려졌고, 삼성전자 HBM4E 추격까지 더해지면서 한국 메모리 빅2가 베라루빈 가치사슬의 핵심 축으로 자리 잡는 흐름이다. 2026년 하반기부터 AWS·구글 클라우드·마이크로소프트·OCI에 더해 CoreWeave·Lambda·Nebius·Nscale 같은 NVIDIA 클라우드 파트너가 베라루빈 인스턴스를 가동한다.

엔비디아는 베라루빈 후속 ‘Rubin Ultra’와 더 큰 랙 형태인 ‘NVL576’ 로드맵도 함께 공개했다. 2027~2028년 가동 목표로, GPU 144개·CPU 72개를 한 랙에 묶고 HBM4E를 본격 채택한다. 경쟁 진영도 같은 시점을 노린다. AMD는 6월 2일 컴퓨텍스 키노트에서 MI400X 양산 일정을 다룰 예정이고, 구글은 자체 TPU v7, 인텔은 Gaudi 3+를 같은 분기에 풀어 놓는다. 베라루빈이 시장을 선점하면 향후 24개월간 ‘AI 인프라 OS’ 경쟁 구도가 사실상 굳어진다.

한국 시장 시사점은 두 갈래다. 첫째, 메모리 측에서는 SK하이닉스 4분기 HBM4 양산 안정성이 베라루빈 시장 점유율과 직결된다. 삼성전자 HBM4E 12단 적층 첫 출하(5/29)는 후속 ‘Rubin Ultra’ 공급권을 잡으려는 포석이다. 둘째, 국내 클라우드 사업자(네이버 클라우드·KT 클라우드·NHN 클라우드) 입장에서는 베라루빈 인스턴스 도입 시점이 1년 이내 결정적 변수다. 글로벌 클라우드 4사가 2026년 하반기에 가동하는 만큼, 국내 사업자도 24개월 안에 도입하지 않으면 LLM 서비스 경쟁력이 빠르게 벌어진다.

자세한 내용은 NVIDIA Newsroom에서 확인할 수 있다.

이미지 출처: 엔비디아