AI모델검증 - AI매터스

AI모델검증

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

‘AI 의사 시대’ 아직 멀었다… 실제 임상 결과 최신 모델도 진단 정확도 50% 수준

6월 5, 2025

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어 모델(LLM)조차 복잡한 의료 진단 추론에서는 예상보다…

오픈AI, 저작권 콘텐츠 '암기' 의혹… 새 연구 발표로 논란 확산

오픈AI, 저작권 콘텐츠 ‘암기’ 의혹… 새 연구 발표로 논란 확산

4월 7, 2025

오픈AI(OpenAI)의 인공지능 모델이 저작권이 있는 콘텐츠를 학습 데이터로 사용했다는 주장에 신빙성을 더하는 새로운 연구가 발표됐다. 테크크런치가 4일(현지 시간) 보도한 내용에 따르면, 워싱턴대학교, 코펜하겐대학교, 스탠퍼드대학교…

1
2
3

Trending

AI 에이전트 커뮤니티 몰트북(moltbook)

AI 에이전트끼리 커뮤니티를 한다고? 몰트북, 쉽게 이해시켜…

공인희 편집인 2월 4, 2026

오픈클로 창시자, “앱의 80%가 사라질 것”

오픈클로 창시자, “앱의 80%가 사라질 것”

권나혜 에디터 2월 10, 2026

"AI가 AI를 만드는 시대 열렸다"… 오픈AI, 자기 학습 모델 'GPT-5.3-Codex' 공개

“AI가 AI를 만드는 시대 열렸다”… 오픈AI, 자기…

권나혜 에디터 2월 6, 2026

AI모델검증 - AI매터스