Search

AI추론한계

Gödel Test: Can Large Language Models Solve Easy Conjectures?

GPT-5, 수학 추측 5개 중 3개 ‘거의’ 성공… 여러 논문 통합 필요한 문제는 실패

9월 29, 2025

이스라엘 하이파 대학교의 모란 펠드먼 교수와 시스코 파운데이션 AI의 아민 카르바시 연구원은 대규모 언어 모델이 새롭고 간단한 수학 추측을 증명할 수 있는지 평가하는 ‘괴델…

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

AI의 ‘생각하는 척’ 들통났다… 애플 “AI, 복잡해지면 오히려 덜 생각해”

6월 10, 2025

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity 최신 AI 추론 모델들, 복잡한 문제에서…

AGI 측정하는 새로운 벤치마크 등장… “인간은 쉽게 풀지만 AI는 여전히 어려운 과제”

AGI 측정하는 새로운 벤치마크 등장… “인간은 쉽게 풀지만 AI는 여전히 어려운 과제”

3월 25, 2025

인공지능의 일반 지능을 평가하기 위한 벤치마크를 개발하고 유지하는 비영리 단체 ARC 재단이 25일(현지 시간) 자사 블로그를 통해, 새로운 벤치마크 ‘ARC-AGI-2’와 100만 달러 규모의 ‘ARC…

AI추론한계 - AI매터스