Search

  • Home
  • AI모델성능비교

AI모델성능비교

드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약

드론 AI, 혼자 날 땐 천재인데 협력은 바보… 최신 모델도 ‘팀워크’ 취약

11월 19, 2025

아랍에미리트 연방대학교 연구팀이 자율비행 드론의 판단 능력을 체계적으로 평가할 수 있는 대규모 테스트 자료 ‘UAVBench’를 공개했다. 이 자료는 AI가 만든 5만 개의 검증된 비행…

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

‘AI 의사 시대’ 아직 멀었다… 실제 임상 결과 최신 모델도 진단 정확도 50% 수준

6월 5, 2025

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어 모델(LLM)조차 복잡한 의료 진단 추론에서는 예상보다…

AI모델성능비교 – AI 매터스