• Home
  • News
  • 그록-2 베타 버전 출시, 챗GPT와 클로드 능가하는 성능 선보여

그록-2 베타 버전 출시, 챗GPT와 클로드 능가하는 성능 선보여

Image

이미지 출처: X 블로그

엑스AI(xAI)가 최신 인공지능 언어 모델인 그록-2(Grok-2)와 그록-2 미니(Grok-2 mini)를 소셜미디어 플랫폼 엑스(𝕏)에서 베타 서비스로 출시했다. 이번에 공개된 그록-2는 채팅, 코딩, 추론 능력에서 이전 모델인 그록-1.5보다 크게 향상된 성능을 보여주고 있다.

엑스AI에 따르면 그록-2의 초기 버전은 ‘sus-column-r’이라는 이름으로 LMSYS 리더보드에 참여해 클로드 3.5 소넷(Claude 3.5 Sonnet)과 GPT-4 터보(GPT-4-Turbo)를 능가하는 성능을 기록했다. 특히 그록-2는 검색된 콘텐츠를 활용한 추론 능력, 누락된 정보 식별, 사건 순서 추론 등의 도구 사용 능력, 그리고 관련 없는 게시물 식별 및 제거 기능 등에서 큰 발전을 이뤘다.

학업 성취도 평가에서도 그록-2는 뛰어난 성적을 거뒀다. 대학원 수준의 과학 지식(GPQA), 일반 상식(MMLU, MMLU-Pro), 수학 경시대회 문제(MATH) 등 다양한 분야에서 최고 수준의 성능을 보였다. 또한 시각적 수학 추론(MathVista)과 문서 기반 질의응답(DocVQA) 분야에서도 최고 수준의 성능을 달성했다.

엑스AI는 그록-2와 그록-2 미니를 엑스 플랫폼의 유료 이용자인 프리미엄 및 프리미엄+ 사용자에게 제공하고 있다. 그록-2는 텍스트와 이미지 이해 능력을 갖춘 최첨단 AI 비서로, 엑스 플랫폼의 실시간 정보를 통합해 제공한다. 반면 그록-2 미니는 속도와 답변 품질의 균형을 갖춘 소형 모델이다.

이달 말에는 기업용 API를 통해 그록-2와 그록-2 미니를 개발자들에게 공개할 예정이다. 새로운 API는 전 세계 여러 지역에 서버를 두고 AI 모델을 실행하는 ‘다중 지역 추론 배포’ 방식을 채택했다. 이를 통해 사용자가 어디에 있든 빠르게 응답받을 수 있다. 예를 들어, 한국 사용자는 한국에 가까운 서버에서, 미국 사용자는 미국 근처 서버에서 AI 서비스를 이용할 수 있어 대기 시간이 줄어든다. 또한 보안을 강화했다. 다중 인증 기능을 의무화해 유비키(Yubikey), 애플 터치ID, 일회용 비밀번호(TOTP) 등을 통해 사용자 계정을 더욱 안전하게 보호한다. 이는 해킹 등의 보안 위협으로부터 API 사용자들의 데이터를 보호하는 데 도움을 준다.

엑스AI는 향후 엑스 플랫폼에서 그록을 활용한 검색 기능 강화, 게시물에 대한 심층 분석, 답글 기능 개선 등을 계획하고 있다. 또한 멀티모달 이해 기능을 그록의 핵심 기능으로 추가할 예정이라고 밝혔다. 이러한 발전을 통해 엑스AI는 인공지능 개발 분야에서 선두 주자로 자리매김하고 있으며, 앞으로도 핵심 추론 능력 향상에 주력할 것으로 보인다.

X의 그록-2 정보는 링크에서 확인할 수 있다.




그록-2 베타 버전 출시, 챗GPT와 클로드 능가하는 성능 선보여 – AI 매터스