Search

  • Home
  • AI 성능 비교
머스크 “그록4, 내년에는 새로운 물리학 발견할 것”… 코딩 전용 모델도 곧 공개

머스크 “그록4, 내년에는 새로운 물리학 발견할 것”… 코딩…

7월 10, 2025

일론 머스크(Elon Musk)의 인공지능 기업 xAI가 9일(현지 시간) 라이브스트림을 통해 차세대 AI 모델 그록-4(Grok-4)와 그록-4 헤비(Grok-4 Heavy)를 공개했다.…

xAI ‘그록4’ 출시… 머스크 “대학원생 대부분보다 똑똑하다” 그럼…

xAI ‘그록4’ 출시… 머스크 “대학원생 대부분보다 똑똑하다” 그럼…

7월 10, 2025

일론 머스크가 설립한 AI 기업 xAI가 최신 인공지능 모델 ‘그록4′(Grok 4)를 공개했다. 머스크는 라이브스트림을 통해 그록4의 성능에 대해…

오픈AI, AI 연구 능력 측정하는 'PaperBench' 출시했지만 자사 AI는 2위에 그쳐

오픈AI, AI 연구 능력 측정하는 ‘PaperBench’ 출시했지만 자사…

4월 3, 2025

오픈AI(OpenAI)가 인공지능(AI) 에이전트의 첨단 연구 논문 이해 및 재현 능력을 평가하는 새로운 벤치마크 ‘PaperBench’를 출시했다. 그러나 흥미롭게도 이…

Tracking AI: Monitoring Artificial Intelligence

AI 모델 IQ 테스트 결과는? 구글 제미나이 2.5…

4월 1, 2025

구글 제미나이 2.5 프로, IQ 130으로 AI 모델 중 최고 지능 입증 생성형 AI 기술이 빠르게 발전하면서 각…

"위험한 AI는 가라"... 뤼튼, 딥시크(DeepSeek) R1 '안전 모드' 무료 서비스 시작

“위험한 AI는 가라”… 뤼튼, 딥시크 R1 ‘안전 모드’…

2월 5, 2025

AI 서비스 플랫폼 기업 뤼튼테크놀로지스(대표 이세영)가 화제의 AI 모델인 딥시크(DeepSeek) R1의 ‘안전 서비스’를 국내 최초로 선보였다. 4일(한국 시간)…

Michelangelo: Long Context Evaluations Beyond Haystacks via Latent Structure Queries

생성형 AI의 장문 이해력 평가: GPT-4와 Claude 3의…

10월 8, 2024

최근 구글 딥마인드 연구진이 발표한 ‘Michelangelo’ 평가 방식은 최신 대규모 언어 모델들의 장문 이해 능력을 테스트하는 새로운 기준을…

AI 성능 비교 – AI 매터스 l AI Matters