• Home
  • AI 성능 비교

AI 성능 비교

오픈AI, AI 연구 능력 측정하는 'PaperBench' 출시했지만 자사 AI는 2위에 그쳐

오픈AI, AI 연구 능력 측정하는 ‘PaperBench’ 출시했지만 자사…

4월 3, 2025

오픈AI(OpenAI)가 인공지능(AI) 에이전트의 첨단 연구 논문 이해 및 재현 능력을 평가하는 새로운 벤치마크 ‘PaperBench’를 출시했다. 그러나 흥미롭게도 이…

Tracking AI: Monitoring Artificial Intelligence

AI 모델 IQ 테스트 결과는? 구글 제미나이 2.5…

4월 1, 2025

구글 제미나이 2.5 프로, IQ 130으로 AI 모델 중 최고 지능 입증 생성형 AI 기술이 빠르게 발전하면서 각…

"위험한 AI는 가라"... 뤼튼, 딥시크(DeepSeek) R1 '안전 모드' 무료 서비스 시작

“위험한 AI는 가라”… 뤼튼, 딥시크 R1 ‘안전 모드’…

2월 5, 2025

AI 서비스 플랫폼 기업 뤼튼테크놀로지스(대표 이세영)가 화제의 AI 모델인 딥시크(DeepSeek) R1의 ‘안전 서비스’를 국내 최초로 선보였다. 4일(한국 시간)…

Michelangelo: Long Context Evaluations Beyond Haystacks via Latent Structure Queries

생성형 AI의 장문 이해력 평가: GPT-4와 Claude 3의…

10월 8, 2024

최근 구글 딥마인드 연구진이 발표한 ‘Michelangelo’ 평가 방식은 최신 대규모 언어 모델들의 장문 이해 능력을 테스트하는 새로운 기준을…

AI 성능 비교 – AI 매터스