Search

그록, 챗GPT 제치고 LLM 성능 1위… 2, 3위는 챗GPT 모델

그록, 챗GPT 제치고 LLM 성능 1위… 2· 3위는…

8월 7, 2025

일론 머스크의 xAI가 개발한 그록(Grok) 모델이 최신 AI 성능 평가에서 68점을 기록하며 1위를 차지했다고 아티피셜 애널리시스(Artificial Analysis)가 발표했다.…

Don't Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning

메타, 기존 통념 뒤집는 연구 결과 공개… “추론…

6월 2, 2025

Don’t Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning 기존 통념을 뒤집는 발견: 짧은 추론이 34.5%…

LLMs Get Lost In Multi-Turn Conversation

AI, 대화가 길어질수록 성능 급락… “답변 한 번…

5월 21, 2025

LLMs Get Lost In Multi-Turn Conversation 대화가 길어질수록 39% 성능 급락: 최신 AI도 피해가지 못하는 ‘대화 길 잃기’…

LLM성능 – AI 매터스 l AI Matters