Search

SHADE-Arena: Evaluating sabotage and monitoring in LLM agents

AI 거짓말 대회 해보니… 클로드가 1등, 인간 감시관은…

6월 17, 2025

Evaluating Sabotage and Monitoring in LLM Agents 앤트로픽이 공개한 연구 논문에 따르면, 프런티어 대형언어모델(LLM)들이 복잡한 에이전트 환경에서 사용자에게…

메타, Llama 3.3 출시…매개변수 70B로 첨단 성능 발휘하면서 비용은 8분의 1 이하

“저작권? 상관없다”…저커버그, 라마 AI에 불법 데이터로 학습 지시

1월 10, 2025

테크크런치(TechCrunch)는 9일(현지시간) 메타(Meta)의 마크 저커버그(Mark Zuckerberg) CEO가 인공지능 모델 라마(Llama) 개발을 위해 불법 복제된 전자책과 논문을 학습 데이터로…

AI Matters 기사 썸네일_Marco 01

알리바바, 추론 능력 강화한 대규모 언어모델 ‘마르코-o1’ 공개

12월 2, 2024

알리바바(Alibaba)는 기존 문제 해결과 개방형 문제 해결이 모두 가능한 대규모 언어모델(LLM) ‘마르코-o1(Marco-o1)’을 발표했다. 알리바바의 마르코폴로(MarcoPolo) 팀이 개발한 마르코-o1은…

데이터셋 – AI 매터스 l AI Matters