AI 벤치마크

"AGI는 없다"... 오픈AI CEO, X발 AGI 출시설 일축

“AGI는 없다”… 오픈AI CEO, X발 AGI 출시설 일축

1월 22, 2025

테크 미디어 CIO 코리아에 따르면, 오픈AI(OpenAI)의 샘 알트만(Sam Altman) CEO가 인공일반지능(AGI) 개발 여부를 두고 상반된 발언을 해 혼선이…

Generative AI and WMD Nonproliferation: A Practical Primer for Policymakers and Diplomats

AI 기술로 무기 개발 조기 탐지 가능해진 반면,…

12월 5, 2024

생성형 인공지능(Generative AI)은 텍스트, 이미지, 영상, 오디오 등 새로운 콘텐츠를 생성하는 기술로, 최근 몇 년간 급격한 발전을 이루며…

o1-프리뷰, 97점으로 수능 국어 1등급 달성... 한국어 언어모델 성능 평가 리더보드 공개

o1-프리뷰, 97점으로 수능 국어 1등급 달성… 한국어 언어모델…

11월 22, 2024

인공지능 대형언어모델의 한국어 능력을 평가하는 ‘수능 국어 LLM 리더보드’가 공개됐다. 평가 결과 ‘o1-프리뷰’ 모델이 97점으로 1등급을 기록하며 주목받고…

MEGA-BENCH : SCALING MULTIMODAL EVALUATION TO OVER 500 REAL-WORLD TASKS

MEGA-BENCH, AI 모델 평가의 새 지평을 열다

10월 16, 2024

일리노이 대학교 어바나-샴페인과 마이크로소프트 연구소가 공동 개발한 MEGA-BENCH가 AI 모델 평가 방식에 혁신을 가져올 것으로 기대를 모으고 있다.…

AFLOW: AUTOMATING AGENTIC WORKFLOW GENERATION

일리노이대, AI 기반 작업 흐름 자동화하는 “AFLOW” 개발

10월 15, 2024

일리노이 대학교 어바나-샴페인과 몬트리올 대학교 연구진이 개발한 AFLOW(Automating Agentic Workflow Generation)가 대규모 언어 모델(LLM)의 활용 방식을 혁신적으로 개선할…

AI 벤치마크 – 페이지 2 – AI 매터스 l AI Matters