앤트로픽(Anthropic)이 최신 AI 모델 ‘클로드 오푸스 4.5(Claude Opus 4.5)’를 24일(현지 시각) 공개했다. 코딩과 에이전트, 컴퓨터 활용 분야에서 세계 최고 성능을 기록한 이 모델은 실제…
구글의 제미나이(Gemini)가 3번째 버전 출시로 챗GPT와 다른 경쟁사들을 제치고 업계 벤치마크 테스트에서 가장 우수한 AI 챗봇으로 평가받았다. 월스트리트저널(WSJ)이 22일(현지 시각) 보도한 내용에 따르면, 이번…
자율주행차가 안개 낀 도로에서 멈춰 서고, 드론이 흐린 날씨에 추락하는 이유가 밝혀졌다. 현재 AI 기술의 가장 큰 약점인 ‘시각적 강건성’ 문제를 해결하기 위해 캘리포니아대학교…
테크크런치가 12일(현지 시간) 보도한 내용에 따르면, 오픈AI(OpenAI)는 지난주 GPT-5를 출시하면서 챗GPT 사용자 경험을 단순화하겠다고 발표했다. GPT-5가 사용자 질문에 자동으로 최적화된 답변을 제공하는 라우터 기능을…
일론 머스크(Elon Musk)의 인공지능 기업 xAI가 9일(현지 시간) 라이브스트림을 통해 차세대 AI 모델 그록-4(Grok-4)와 그록-4 헤비(Grok-4 Heavy)를 공개했다. 이번 발표에서 가장 주목받은 것은 그록-4가…
일론 머스크가 설립한 AI 기업 xAI가 최신 인공지능 모델 ‘그록4′(Grok 4)를 공개했다. 머스크는 라이브스트림을 통해 그록4의 성능에 대해 설명하며 기존 AI 모델을 뛰어넘는 능력을…
오픈AI(OpenAI)가 인공지능(AI) 에이전트의 첨단 연구 논문 이해 및 재현 능력을 평가하는 새로운 벤치마크 ‘PaperBench’를 출시했다. 그러나 흥미롭게도 이 평가에서 오픈AI의 자체 모델이 아닌 경쟁사…
구글 제미나이 2.5 프로, IQ 130으로 AI 모델 중 최고 지능 입증 생성형 AI 기술이 빠르게 발전하면서 각 모델의 성능을 객관적으로 평가하는 지표의 중요성이…
AI 서비스 플랫폼 기업 뤼튼테크놀로지스(대표 이세영)가 화제의 AI 모델인 딥시크(DeepSeek) R1의 ‘안전 서비스’를 국내 최초로 선보였다. 4일(한국 시간) 뤼튼은 공식 홈페이지 보도자료를 통해 카카오톡…
최근 구글 딥마인드 연구진이 발표한 ‘Michelangelo’ 평가 방식은 최신 대규모 언어 모델들의 장문 이해 능력을 테스트하는 새로운 기준을 제시했다. 이 평가 방식은 기존의 ‘건초더미…