‘AI 추론 모델’ 등장으로 판 바뀐 2025년 AI 순위… 알파센스 분석 결과

The Future of AI: A Midyear Review of Leaders, Opportunities, and Threats
이미지 출처: 알파센스

The Future of AI: A Midyear Review of Leaders, Opportunities, and Threats


AI 기반 시장 정보 검색 및 분석 플랫폼 알파센스(AlphaSense)가 발표한 리포트에 따르면, 2025년 상반기 생성형 AI 업계는 추론 능력(reasoning capabilities)과 멀티모달 기능의 혁신으로 경쟁 구도가 크게 재편되었다. 오픈AI(OpenAI)는 3월에 복잡한 프롬프트를 정확히 따르는 새로운 텍스트-이미지 생성기를 출시하며 사용자들을 깜짝 놀라게 했고, 같은 달 민간 기술 기업 사상 최대 규모인 400억 달러 펀딩을 유치했다.

하지만 모든 것이 계획대로 진행된 것은 아니었다. 오픈AI는 2월 말 예상했던 GPT-5 대신 오리온 모델을 GPT-4.5로 출시했고, 4월에는 “아첨을 자주 하고 성가신” 성격으로 인해 GPT-4o 업데이트를 철회해야 했다. 구글(Google)은 3월 제미나이 2.5 프로(Gemini 2.5 Pro)를 출시하여 코딩, 수학, 추론 벤치마크에서 다른 모델들과 대등한 성과를 보였다.

앤트로픽 업계 최초 하이브리드 모델 출시, 하지만 시장점유율 10% 급락

앤트로픽(Anthropic)은 2월 클로드 3.7 소넷(Claude 3.7 Sonnet)을 선보이며 업계 최초로 하이브리드 추론 모델을 도입했다. 이 혁신적 기술은 사용자가 모든 질의에 대해 표준 응답 또는 추론 응답을 선택할 수 있게 하여 모델 유연성의 새로운 표준을 제시했다. 5월에는 클로드 4 시리즈의 첫 번째 모델들을 공개했는데, 클로드 4 오퍼스(Claude 4 Opus)가 코딩에 가장 뛰어나다고 발표했다.

중국 AI 스타트업 딥시크(DeepSeek)는 1월 오픈소스 R1 대형 언어 모델로 화제를 모았다. 이 모델은 600만 달러 미만의 훈련 비용으로 유사한 모델들의 일부 비용만으로도 업계 벤치마크에서 선도적인 LLM들과 대등한 성능을 보였다. 하지만 5월 보고서에 따르면 딥시크 R1의 쿼리 수는 2월 중순 7%에서 4월 말 3%로 감소했다.

600만 달러로 훈련된 딥시크 모델의 파급효과

딥시크의 등장은 심각한 경쟁자로서 시장 역학을 뒤흔들었다. 혁신적인 엔지니어링 접근법은 1월 말 미국 AI 관련 주식의 급격한 매도를 포함한 시장 반응을 불러일으켰다. 업계 전문가들은 “DS-R1의 핵심 의미는 제한된 컴퓨팅 자원으로 훈련된 강력한 LLM이라는 점으로, 이는 소규모 LLM 회사와 애플리케이션 개발자들의 진입 장벽을 낮출 수 있다”고 평가했다.

딥리서치와 에이전틱 AI도 주목할 만한 발전을 보였다. 2025년 상반기 구글, 오픈AI, 퍼플렉시티(Perplexity), 마이크로소프트(Microsoft), 알파센스(AlphaSense) 등이 단일 프롬프트에서 구조화된 소스 기반 보고서를 생성하는 딥리서치 역량을 공개했다. 1월 오픈AI는 자체 브라우저를 사용해 작업을 수행할 수 있는 에이전트 오퍼레이터(Operator)를 소개했고, 3월 아마존은 유사한 범용 AI 에이전트 노바 액트(Nova Act)를 출시했다.

오픈AI 5000억·메타 650억·MS 800억 달러… 천문학적 AI 인프라 투자 경쟁

생성형 AI의 급속한 성장으로 인프라가 핵심 경쟁 전장이 되었다. 1월 오픈AI는 향후 4년간 미국 내 AI 인프라 구축에 5,000억 달러를 투자할 계획인 스타게이트 프로젝트(Stargate Project)를 발표했다. 이러한 대규모 투자는 모델 품질뿐만 아니라 컴퓨팅 가용성이 생성형 AI의 미래를 좌우할 수 있다는 인식이 커지고 있음을 반영한다.

메타(Meta)도 1월 2025년 말까지 AI 인프라 확장에 최대 650억 달러를 지출할 계획을 발표했다. 같은 달 마이크로소프트는 AI용 데이터센터에 800억 달러를 투자한다고 발표했다. 사티아 나델라 마이크로소프트 CEO는 회사가 구축하고 있는 데이터센터 네트워크가 “유연한 플릿”이라고 설명했다.

한편, 코어위브(CoreWeave), 람다 랩스(Lambda Labs), 볼티지 파크(Voltage Park) 등 GPU 집약적이고 AI 최적화된 인프라를 전문으로 하는 새로운 AI 네이티브 인프라 제공업체들이 등장했다. 3월 코어위브는 2021년 이후 미국 기업의 벤처 지원 기술 IPO 중 최대 규모로 상장되어 시장 신뢰와 AI 스택에서 이 새로운 계층의 전략적 중요성을 보여주는 이정표를 세웠다.

FAQ

Q: 하이브리드 추론 모델이란 무엇이며 기존 모델과 어떤 차이가 있나요?

A: 하이브리드 추론 모델은 사용자가 질의에 대해 표준 응답 또는 추론 응답을 선택할 수 있는 기능을 제공합니다. 앤트로픽의 클로드 3.7 소넷이 업계 최초로 도입한 이 기술은 모델의 유연성을 크게 향상시켜 사용자의 필요에 따라 빠른 답변 또는 깊이 있는 분석을 선택할 수 있게 합니다.

Q: 딥시크의 600만 달러 훈련 비용이 업계에 미친 영향은 무엇인가요?

A: 딥시크의 저비용 고성능 모델은 AI 개발의 진입 장벽을 크게 낮췄습니다. 기존 대기업들이 수억 달러를 투자해 개발한 모델과 비슷한 성능을 단돈 600만 달러로 달성함으로써 소규모 기업과 스타트업들도 경쟁력 있는 AI 모델을 개발할 수 있는 가능성을 열었습니다.

Q: AI 에이전트가 일반 사용자에게 실질적으로 도움이 되는 분야는 어디인가요?

A: AI 에이전트는 현재 웹 브라우징을 통한 정보 검색, 온라인 쇼핑, 여행 예약, 일정 관리 등 반복적인 온라인 작업을 자동화하는 데 활용되고 있습니다. 넷플릭스의 자연어 콘텐츠 검색이나 챗GPT의 개인 맞춤형 쇼핑 기능 등이 대표적인 실용 사례입니다.

해당 기사에 인용된 리포트 원문은 알파센스에서 확인 가능하다.

이미지 출처: 알파센스

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




‘AI 추론 모델’ 등장으로 판 바뀐 2025년 AI 순위… 알파센스 분석 결과 – AI 매터스 l AI Matters