Search

메타, AI 슈퍼컴 규모 확대…라마4 개발에 10만대 이상 GPU 투입

Llama
이미지출처: 메타

세계 최대 AI 훈련 클러스터 구축

메타(Meta)가 차세대 AI 모델 ‘라마4(Llama 4)’ 개발을 위해 세계 최대 규모의 GPU 클러스터를 구축하며 AI 경쟁에서 주도권을 잡으려 하고 있다. 미국 IT매체 위어드에 따르면, 마크 주커버그(Mark Zuckerberg) 메타 CEO는 3분기 실적발표에서 “라마4 모델을 10만대 이상의 H100 GPU로 구성된 클러스터에서 훈련하고 있다”며 “이는 현재 보고된 어떤 AI 훈련 시설보다 큰 규모”라고 밝혔다. 이는 지난 3월 라마3 개발에 사용된 2만5천대 규모에서 4배 이상 증가한 수치다.

이러한 대규모 AI 훈련 클러스터 구축 경쟁은 업계 전반에 걸쳐 치열하게 전개되고 있다. 일론 머스크(Elon Musk)는 지난 7월 자신의 AI 기업 xAI가 10만대의 H100 GPU를 설치했다고 발표한 바 있다. 하지만 메타의 이번 발표로 AI 훈련을 위한 컴퓨팅 파워 경쟁에서 선두 자리를 차지하게 됐다.

차세대 라마4 성능 개선 기대

주커버그 CEO는 라마4의 구체적인 성능은 공개하지 않았지만, “새로운 모드”, “강화된 추론 능력”, “더 빠른 속도”를 갖출 것이라고 언급했다. 라마4는 2024년 초 출시될 예정이며, 우선 소형 모델부터 공개될 전망이다.

현재 AI 시장의 선두주자로 평가받는 오픈AI(OpenAI)도 GPT-5 개발을 진행 중이다. 샘 알트만(Sam Altman) 오픈AI CEO는 GPT-5가 이전 모델 대비 “상당한 도약”이 될 것이라고 예고했지만, 구체적인 개발 규모는 공개하지 않고 있다.

오픈소스 전략으로 AI 생태계 확장

메타는 경쟁사들과 달리 라마 모델을 무료로 공개하는 오픈소스 전략을 유지하고 있다. 주커버그 CEO는 “오픈소스가 개발자들에게 가장 비용 효율적이고, 커스터마이징이 가능하며, 신뢰할 수 있는 옵션”이라며 “라마가 이 분야를 선도하고 있다는 것이 자랑스럽다”고 강조했다. 이러한 개방형 접근은 AI 생태계 확장에 기여하고 있지만, 일각에서는 우려의 목소리도 나온다. AI 전문가들은 강력한 AI 모델이 무료로 공개될 경우, 사이버 공격이나 위험한 용도로 악용될 수 있다고 지적하고 있다.

AI 개발 위한 대규모 투자

10만대의 H100 GPU 클러스터 운영에는 약 150메가와트의 전력이 필요할 것으로 추정된다. 이는 미국 최대 규모의 국립연구소 슈퍼컴퓨터인 엘 캐피탄(El Capitan)의 전력 소비량(30메가와트)의 5배에 달하는 수준이다.

메타는 올해 데이터센터 등 인프라 구축에 400억 달러를 투자할 예정이며, 이는 전년 대비 42% 증가한 규모다. 회사는 내년에는 이보다 더 큰 규모의 투자가 이뤄질 것으로 전망했다.

AI 서비스 수익화 전략

메타의 AI 어시스턴트인 ‘메타 AI’는 현재 월간 5억명 이상의 사용자를 확보하고 있다. 수잔 리(Susan Li) 메타 CFO는 “시간이 지남에 따라 AI 서비스를 통한 수익 창출 기회가 늘어날 것”이라며 광고 수익 모델 도입 가능성을 시사했다.

실제로 메타의 총 운영비용은 올해 약 9% 증가했지만, 전체 매출은 22% 이상 급증했다. 이를 통해 회사는 라마 개발에 대규모 투자를 진행하면서도 수익성을 개선하는데 성공했다. 반면 경쟁사인 오픈AI는 개발자들에게 API 사용료를 부과하고 있음에도 현금 소진 속도가 빠른 것으로 알려졌다. 이는 메타의 오픈소스 전략과 광고 수익 모델이 AI 개발의 지속가능성 측면에서 경쟁력을 가질 수 있음을 시사한다.

기사에 인용된 위드의 뉴스는 링크에서 확인할 수 있다.




메타, AI 슈퍼컴 규모 확대…라마4 개발에 10만대 이상 GPU 투입 – AI 매터스 l AI Matters