AI벤치마크

xAI, '그록3’ 추론-미니 추론 2가지 버전 공개... 1주일 후 음성 모드 추가

xAI, ‘그록3’ 추론-미니 추론 2가지 버전 공개… 1주일…

2월 18, 2025

테크크런치(TechCrunch)가 19일(현지 시간) 보도한 내용에 따르면 일론 머스크의 인공지능 기업 엑스AI(xAI)가 17일(현지시간) 새로운 AI 모델 ‘그록3(Grok 3)’을 공개했다.…

퍼플렉시티, AI 전문 리서치 도구 '딥 리서치' 무료 출시... 전문가급 분석을 3분 이내로

퍼플렉시티, AI 전문 리서치 도구 ‘딥 리서치’ 무료…

2월 17, 2025

AI 검색 기업 퍼플렉시티(Perplexity)가 심층 연구·분석 서비스 ‘딥 리서치(Deep Research)’를 무료로 선보였다. 퍼플렉시티는 14일 공식 블로그를 통해 “수…

Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations

“대화가 정답이다”…의료 AI의 진단 정확도 9.64% 향상시킨 새로운…

2월 3, 2025

Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations 워싱턴대학교와 노스캐롤라이나대학교 연구진의 논문에 따르면, 현재의 의료…

구글, 제미나이 성능 개선에 경쟁사 클로드 활용…앤트로픽 승인 여부는 '미궁'

구글, 제미나이 성능 개선에 경쟁사 클로드 활용…앤트로픽 승인…

12월 27, 2024

테크크런치(TechCrunch)가 24일 게재한 보도에 따르면, 구글이 자사의 인공지능 챗봇 제미나이(Gemini)의 성능을 개선하기 위해 경쟁사인 앤트로픽(Anthropic)의 AI 챗봇 클로드(Claude)를…

GAIA: a benchmark for General AI Assistants

‘AI vs 인간’ 지능 격차 좁혀진다…AI 지능 측정해보니…

12월 26, 2024

GAIA: a benchmark for General AI Assistants 작년보다 6배 성능 향상…AI 지능 진화 속도 가속 엔드투엔드(End-to-End) 생성형AI 솔루션…

nVDIA

NVIDIA, GPT-4 능가하는 ‘네모트론 70B’ 조용히 출시… AI…

10월 18, 2024

엔비디아(NVIDIA)가 최근 새로운 인공지능(AI) 모델 ‘네모트론 70B(Nemotron 70B)’를 조용히 출시했다. 이 모델은 오픈AI(OpenAI)의 GPT-4를 여러 벤치마크에서 앞선 것으로…

AI벤치마크 – 페이지 2 – AI 매터스