마이크로소프트(Microsoft) 연구팀이 개발한 작은 AI 모델이 훨씬 큰 AI 모델을 이기는 놀라운 결과를 만들어냈다. 마이크로소프트 연구소의 닝 샹(Ning Shang), 이페이 리우(Yifei Liu), 이 주(Yi…
일론 머스크의 xAI가 개발한 그록(Grok) 모델이 최신 AI 성능 평가에서 68점을 기록하며 1위를 차지했다고 아티피셜 애널리시스(Artificial Analysis)가 발표했다. 아티피셜 애널리시스 인텔리전스 인덱스(Artificial Analysis Intelligence…
한국 초대 AI미래기획수석 하정우 박사가 급변하는 글로벌 AI 지형 속에서 대한민국의 생존 전략을 담은 신간 ‘AI 전쟁 2.0’을 지난달 30일(한국 시간) 출간했다. 이 책은…
Evaluating the Promise and Pitfalls of LLMs in Hiring Decisions 에이트폴드(Eightfold.ai) 연구팀이 GPT-4o, 클로드(Claude), 제미나이(Gemini) 등 주요 생성형 AI 모델들의 채용 과정에서의 정확성과 편향성을…
DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어 모델(LLM)조차 복잡한 의료 진단 추론에서는 예상보다…
xAI는 자사의 X 계정을 통해 그록 3 제품군이 API를 통해 제공된다고 발표했다. 해당 게시물에 따르면, “그록 3 미니는 5배 낮은 비용으로 추론 모델보다 더…