AI추론한계 - AI매터스

AI추론한계

Gödel Test: Can Large Language Models Solve Easy Conjectures?

GPT-5, 수학 추측 5개 중 3개 ‘거의’ 성공… 여러 논문 통합 필요한 문제는 실패

9월 29, 2025

이스라엘 하이파 대학교의 모란 펠드먼 교수와 시스코 파운데이션 AI의 아민 카르바시 연구원은 대규모 언어 모델이 새롭고 간단한 수학 추측을 증명할 수 있는지 평가하는 ‘괴델…

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

AI의 ‘생각하는 척’ 들통났다… 애플 “AI, 복잡해지면 오히려 덜 생각해”

6월 10, 2025

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity 최신 AI 추론 모델들, 복잡한 문제에서…

AGI 측정하는 새로운 벤치마크 등장… “인간은 쉽게 풀지만 AI는 여전히 어려운 과제”

AGI 측정하는 새로운 벤치마크 등장… “인간은 쉽게 풀지만 AI는 여전히 어려운 과제”

3월 25, 2025

인공지능의 일반 지능을 평가하기 위한 벤치마크를 개발하고 유지하는 비영리 단체 ARC 재단이 25일(현지 시간) 자사 블로그를 통해, 새로운 벤치마크 ‘ARC-AGI-2’와 100만 달러 규모의 ‘ARC…

1
2
3

Trending

챗GPT 프로, '90% 할인'… 카카오 선물하기 깜짝 특가

챗GPT 프로, ‘90% 할인’… 카카오 선물하기 깜짝…

권나혜 에디터 2월 13, 2026

오픈클로 창시자, “앱의 80%가 사라질 것”

오픈클로 창시자, “앱의 80%가 사라질 것”

권나혜 에디터 2월 10, 2026

카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안 공포 확산

카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안…

권나혜 에디터 2월 9, 2026

AI추론한계 - AI매터스