xAI가 AI 챗봇 그록(Grok) 4.1을 출시하며 감성지능 부문에서 경쟁 모델들을 제치고 1위에 올랐다. xAI가 18일(현지 시각) 발표한 내용에 따르면, 그록 4.1은 grok.com과 X, iOS 및 안드로이드 앱에서 모든 사용자에게 제공되고 있다. 이번 모델은 창작, 감성, 협업 상호작용에서 뛰어난 성능을 보이며 이전 버전 대비 64.78%의 선호율을 기록했다.
그록 4.1의 가장 큰 특징은 사용자의 감정을 섬세하게 이해하고 공감하는 능력이다. “고양이가 너무 그리워서 아프다”는 사용자의 말에 이전 버전은 “반려동물을 잃는 것은 마음 한 조각을 잃는 것 같을 수 있다”고 형식적으로 답했다. 반면 그록 4.1은 “그 아픔 정말 힘들다. 고양이를 잃는다는 건 매일 당신을 선택해준 작은 가족을 잃는 것과 같으니까”라며 훨씬 더 자연스럽고 구체적인 위로를 건넸다.
감성지능 평가 벤치마크인 EQ-벤치3(EQ-Bench3)에서 그록 4.1 싱킹(Thinking) 모드는 1,586점으로 1위를 차지했다. 일반 모드도 1,585점으로 2위에 올랐다. 구글의 제미나이 2.5 프로는 1,460점, 앤트로픽의 클로드 오푸스(Opus) 4는 1,304점을 받아 그록 4.1에 크게 뒤졌다.
창작 글쓰기 능력도 크게 향상됐다. 크리에이티브 라이팅 v3 벤치마크에서 그록 4.1 싱킹은 1,721.9점으로 2위를, 일반 모드는 1,708.6점으로 3위를 기록했다. 클로드 소네트(Sonnet) 4.5는 1,648.7점에 그쳤다.
정보 정확도도 개선됐다. xAI는 정보 탐색 프롬프트에 대한 환각 감소에 주력해 환각률을 이전 모델의 12.09%에서 4.22%로 대폭 줄였다. 이는 사용자가 여행지 추천이나 실시간 정보를 물었을 때 더 정확한 답변을 받을 수 있다는 의미다.
xAI는 그록 4를 구동했던 대규모 강화학습 인프라를 활용해 모델의 스타일과 성격, 유용성을 최적화했다고 밝혔다.
해당 모델에 대한 자세한 사항은 xAI 뉴스룸에서 확인 가능하다.
이미지 출처: xAI






