DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어…
A systematic review and meta-analysis of diagnostic performance comparison between generative AI and physicians 83개 연구 메타분석, 생성형…