이스라엘 하이파 대학교의 모란 펠드먼 교수와 시스코 파운데이션 AI의 아민 카르바시 연구원은 대규모 언어 모델이 새롭고 간단한 수학 추측을 증명할 수 있는지 평가하는 ‘괴델…
The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity 최신 AI 추론 모델들, 복잡한 문제에서…
인공지능의 일반 지능을 평가하기 위한 벤치마크를 개발하고 유지하는 비영리 단체 ARC 재단이 25일(현지 시간) 자사 블로그를 통해, 새로운 벤치마크 ‘ARC-AGI-2’와 100만 달러 규모의 ‘ARC…