Gemini 1.5 Pro - AI매터스

Gemini 1.5 Pro

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents

AI에게 자판기 운영 시켜봤더니… 클로드 3.5 소넷, 인간보다 185만원 더 벌어

5월 13, 2025

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents3 2천만 토큰 넘는 장기 실험, AI 에이전트의 일관성 측정하는 ‘벤딩-벤치’ 개발 대형 언어 모델(LLM)은 짧은…

MEGA-BENCH : SCALING MULTIMODAL EVALUATION TO OVER 500 REAL-WORLD TASKS

MEGA-BENCH, AI 모델 평가의 새 지평을 열다

10월 16, 2024

일리노이 대학교 어바나-샴페인과 마이크로소프트 연구소가 공동 개발한 MEGA-BENCH가 AI 모델 평가 방식에 혁신을 가져올 것으로 기대를 모으고 있다. MEGA-BENCH는 500개 이상의 다양한 실제 작업을…

1
2
3

Trending

"돈은 관심 없다"…오픈클로 개발자, 저커버그 제안 거절하고 알트만 택한 이유

“돈은 관심 없다”…오픈클로 개발자, 저커버그 제안 거절하고…

이종철 수석 에디터 2월 20, 2026

구글, 제미나이 3.1 Pro 출시…추론 성능 전작 대비 2배 이상 향상

구글, 제미나이 3.1 Pro 출시…추론 성능 전작…

이종철 수석 에디터 2월 20, 2026

구글(Google) 제미나이(Gemini) 앱, AI 음악 생성 기능 품었다…"텍스트 한 줄이나 폰 앨범 동영상으로 30초 트랙을”

구글(Google) 제미나이(Gemini) 앱, AI 음악 생성 기능…

이종철 수석 에디터 2월 20, 2026

Gemini 1.5 Pro - AI매터스