HealthBench: Evaluating Large Language Models Towards Improved Human Health 전 세계 60개국 262명 의사 참여, 5,000개 실제 의료…
ETH 취리히와 INSAIT 소피아 대학 연구진이 EU AI법을 기술적으로 해석하고 이를 평가할 수 있는 최초의 종합적인 프레임워크 ‘COMPL-AI’를…
인공지능(AI) 기술이 급속도로 발전하면서 대규모 언어 모델(LLM)의 정확성과 신뢰성이 중요한 이슈로 떠올랐다. 최근 코넬대학교, 워싱턴대학교, 앨런 인공지능 연구소…