일론 머스크가 이끄는 인공지능(AI) 스타트업 xAI가 비용 효율성을 극대화한 새로운 AI 모델 ‘그록 4 패스트’를 공개했다. 이 모델은 기존 그록 4와 비슷한 성능을 유지하면서도 토큰 비용을 대폭 절감해 업계에 새로운 기준을 제시했다. xAI는 19일(현지 시각) 공식 웹사이트를 통해 그록 4 Fast의 출시를 발표했다. 회사 측에 따르면 이 모델은 대규모 강화 학습을 활용해 ‘지능 밀도(Intelligence Density)’를 최대화했으며, 그록 4 대비 평균 40% 적은 사고 토큰(Thinking Token)을 사용하면서도 유사한 성능을 달성했다.
특히 주목할 점은 가격 대비 성능이다. xAI는 토큰 효율성 40% 향상과 토큰당 가격 인하를 결합해 그록 4와 동일한 성능을 구현하는 데 드는 비용을 98% 절감했다고 밝혔다. 독립 분석 기관인 아티피셜 어낼리시스(Artificial Analysis)의 검증 결과, 그록 4 Fast는 공개된 다른 모델들과 비교해 최고 수준의 가격 대비 지능 비율을 보였다. 성능 면에서도 개선이 있었다. 그록 4 Fast는 여러 벤치마크에서 기존 그록 3 Mini를 크게 앞섰다.
웹 검색과 X(구 트위터) 검색 기능도 강화됐다. 그록 4 Fast는 실시간 데이터를 활용해 쿼리를 보강하며, 링크를 따라가고 이미지와 영상을 분석한 뒤 결과를 빠르게 종합한다. 또한 그록 4 Fast는 추론 모드와 비추론 모드를 하나의 모델로 통합했다. 기존에는 모드마다 별도 모델이 필요했지만, 이제는 시스템 프롬프트만으로 모드를 전환할 수 있어 지연 시간과 토큰 비용이 줄었다.
LMArena의 검색 부문에서 그록 4 Fast는 1위를 차지하며 1,163점의 엘로 점수를 기록했다. 이는 2위 모델보다 17점 높은 수치다. 텍스트 부문에서도 8위에 올라 동급 모델들을 크게 앞섰다. 가격 정책도 공개됐다. xAI API를 통해 제공되는 그록 4 패스트는 입력 토큰 100만 개당 0.20달러(12만 8000토큰 미만 기준), 출력 토큰 100만 개당 0.50달러로 책정됐다. 캐시된 입력 토큰은 100만 개당 0.05달러다.
xAI는 그록 4 패스트를 모든 사용자에게 제공한다고 밝혔다. 또한 제한된 기간 동안 오픈라우터(OpenRouter)와 버셀 AI 게이트웨이(Vercel AI Gateway)에서 무료로 이용 가능하다.
해당 기사의 원문은 xAI 뉴스룸에서 확인 가능하다.
이미지 출처: xAI