AI 성능비교 – AI 매터스 l AI Matters

뉴스레터 구독

AI 성능비교

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents

AI에게 자판기 운영 시켜봤더니… 클로드 3.5 소넷, 인간보다…

5월 13, 2025

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents3 2천만 토큰 넘는 장기 실험, AI 에이전트의 일관성 측정하는…

Large language models surpass human experts in predicting neuroscience results

대규모 언어모델, 뇌과학 실험 결과 예측에서 전문가 능력…

2월 18, 2025

Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던…

1
2
3

Trending

중국이 AI 협력기구 제안을? GPU 때문 아닐까요?

[AI 매터스 뉴스레터 #99] 중국이 AI 협력기구 제안을?…

이종철 수석 에디터7월 30, 2025

[리얼 캠페인 탐구] "나무가 직접 말한다" 현대차 AI 캠페인이 칸 라이언즈 석권한 이유

[리얼 캠페인 탐구] “나무가 직접 말한다” 현대차…

김은영 에디터7월 30, 2025

[AI 트렌드] “잘 봐, 냥이들 싸움이다” AI 패러디의 정점 ‘스트릿 큐트 파이터’

[AI 트렌드] “잘 봐, 냥이들 싸움이다” AI…

김은영 에디터7월 30, 2025

AI 성능비교 – AI 매터스 l AI Matters