오픈AIo3 - AI매터스

오픈AIo3

Inverse Scaling in Test-Time Compute

“AI, 추론 시간 늘릴수록 오히려 멍청해져”… 앤트로픽, 충격적 연구 결과 발표

7월 24, 2025

인공지능(AI) 모델이 문제를 더 오래 ‘생각’한다고 해서 반드시 더 나은 답을 내놓는 것은 아니라는 연구 결과가 나왔다. 추론 시간이 길어질수록 성능이 급격히 저하되는 ‘역스케일링’…

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

‘AI 의사 시대’ 아직 멀었다… 실제 임상 결과 최신 모델도 진단 정확도 50% 수준

6월 5, 2025

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어 모델(LLM)조차 복잡한 의료 진단 추론에서는 예상보다…

1
2
3

Trending

AI 에이전트 커뮤니티 몰트북(moltbook)

AI 에이전트끼리 커뮤니티를 한다고? 몰트북, 쉽게 이해시켜…

공인희 편집인 2월 4, 2026

오픈클로 창시자, “앱의 80%가 사라질 것”

오픈클로 창시자, “앱의 80%가 사라질 것”

권나혜 에디터 2월 10, 2026

"AI가 AI를 만드는 시대 열렸다"… 오픈AI, 자기 학습 모델 'GPT-5.3-Codex' 공개

“AI가 AI를 만드는 시대 열렸다”… 오픈AI, 자기…

권나혜 에디터 2월 6, 2026

오픈AIo3 - AI매터스