Search

AI모델검증

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

‘AI 의사 시대’ 아직 멀었다… 실제 임상 결과 최신 모델도 진단 정확도 50% 수준

6월 5, 2025

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어 모델(LLM)조차 복잡한 의료 진단 추론에서는 예상보다…

오픈AI, 저작권 콘텐츠 '암기' 의혹… 새 연구 발표로 논란 확산

오픈AI, 저작권 콘텐츠 ‘암기’ 의혹… 새 연구 발표로 논란 확산

4월 7, 2025

오픈AI(OpenAI)의 인공지능 모델이 저작권이 있는 콘텐츠를 학습 데이터로 사용했다는 주장에 신빙성을 더하는 새로운 연구가 발표됐다. 테크크런치가 4일(현지 시간) 보도한 내용에 따르면, 워싱턴대학교, 코펜하겐대학교, 스탠퍼드대학교…

AI모델검증 – AI 매터스