Search

rStar2-Agent: Agentic Reasoning Technical Report

MS, 파이썬 코드로 수학 문제 푸는 AI 모델…

9월 3, 2025

마이크로소프트(Microsoft) 연구팀이 개발한 작은 AI 모델이 훨씬 큰 AI 모델을 이기는 놀라운 결과를 만들어냈다. 마이크로소프트 연구소의 닝 샹(Ning…

그록, 챗GPT 제치고 LLM 성능 1위… 2, 3위는 챗GPT 모델

그록, 챗GPT 제치고 LLM 성능 1위… 2· 3위는…

8월 7, 2025

일론 머스크의 xAI가 개발한 그록(Grok) 모델이 최신 AI 성능 평가에서 68점을 기록하며 1위를 차지했다고 아티피셜 애널리시스(Artificial Analysis)가 발표했다.…

[신간] 하정우·한상기의 ‘AI 전쟁 2.0’ …AI 수석이 진단한 한국 AI의 현주소

[신간] 하정우·한상기의 ‘AI 전쟁 2.0’ …AI 수석이 진단한 한국…

7월 14, 2025

한국 초대 AI미래기획수석 하정우 박사가 급변하는 글로벌 AI 지형 속에서 대한민국의 생존 전략을 담은 신간 ‘AI 전쟁 2.0’을…

AI가 내 이력서를 공정하게 평가할 수 있을까? 편견은…

AI가 내 이력서를 공정하게 평가할 수 있을까? 편견은…

7월 9, 2025

Evaluating the Promise and Pitfalls of LLMs in Hiring Decisions 에이트폴드(Eightfold.ai) 연구팀이 GPT-4o, 클로드(Claude), 제미나이(Gemini) 등 주요 생성형…

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

‘AI 의사 시대’ 아직 멀었다… 실제 임상 결과…

6월 5, 2025

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models 1,113개 실제 의료 사례로 검증한 AI의 한계 최첨단 대규모 언어…

xAI, 그록3 제품군 API 공개… “그록3 미니, 추론 모델보다 5배 저렴한데 성능은 더 높아”

xAI, 그록3 제품군 API 공개… “그록3 미니, 추론…

4월 21, 2025

xAI는 자사의 X 계정을 통해 그록 3 제품군이 API를 통해 제공된다고 발표했다. 해당 게시물에 따르면, “그록 3 미니는…

DeepSeekR1 – AI 매터스 l AI Matters