AI모델성능비교 - AI매터스

AI모델성능비교

드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약

드론 AI, 혼자 날 땐 천재인데 협력은 바보… 최신 모델도 ‘팀워크’ 취약

11월 19, 2025

아랍에미리트 연방대학교 연구팀이 자율비행 드론의 판단 능력을 체계적으로 평가할 수 있는 대규모 테스트 자료 ‘UAVBench’를 공개했다. 이 자료는 AI가 만든 5만 개의 검증된 비행…

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

‘AI 의사 시대’ 아직 멀었다… 실제 임상 결과 최신 모델도 진단 정확도 50% 수준

6월 5, 2025

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어 모델(LLM)조차 복잡한 의료 진단 추론에서는 예상보다…

1
2
3

Trending

AI 에이전트 커뮤니티 몰트북(moltbook)

AI 에이전트끼리 커뮤니티를 한다고? 몰트북, 쉽게 이해시켜…

공인희 편집인 2월 4, 2026

오픈클로 창시자, “앱의 80%가 사라질 것”

오픈클로 창시자, “앱의 80%가 사라질 것”

권나혜 에디터 2월 10, 2026

"AI가 AI를 만드는 시대 열렸다"… 오픈AI, 자기 학습 모델 'GPT-5.3-Codex' 공개

“AI가 AI를 만드는 시대 열렸다”… 오픈AI, 자기…

권나혜 에디터 2월 6, 2026

AI모델성능비교 - AI매터스