Search

의학추론

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

‘AI 의사 시대’ 아직 멀었다… 실제 임상 결과 최신 모델도 진단 정확도 50% 수준

6월 5, 2025

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어 모델(LLM)조차 복잡한 의료 진단 추론에서는 예상보다…

의학추론 – AI 매터스