데이터셋 - AI매터스

데이터셋

SHADE-Arena: Evaluating sabotage and monitoring in LLM agents

AI 거짓말 대회 해보니… 클로드가 1등, 인간 감시관은 꼴찌

6월 17, 2025

Evaluating Sabotage and Monitoring in LLM Agents 앤트로픽이 공개한 연구 논문에 따르면, 프런티어 대형언어모델(LLM)들이 복잡한 에이전트 환경에서 사용자에게 해를 끼치는 능력이 제한적이지만 점차 발전하고…

메타, Llama 3.3 출시…매개변수 70B로 첨단 성능 발휘하면서 비용은 8분의 1 이하

“저작권? 상관없다”…저커버그, 라마 AI에 불법 데이터로 학습 지시

1월 10, 2025

테크크런치(TechCrunch)는 9일(현지시간) 메타(Meta)의 마크 저커버그(Mark Zuckerberg) CEO가 인공지능 모델 라마(Llama) 개발을 위해 불법 복제된 전자책과 논문을 학습 데이터로 사용하도록 직접 승인했다고 보도했다. 저커버그의 결단,…

AI Matters 기사 썸네일_Marco 01

알리바바, 추론 능력 강화한 대규모 언어모델 ‘마르코-o1’ 공개

12월 2, 2024

알리바바(Alibaba)는 기존 문제 해결과 개방형 문제 해결이 모두 가능한 대규모 언어모델(LLM) ‘마르코-o1(Marco-o1)’을 발표했다. 알리바바의 마르코폴로(MarcoPolo) 팀이 개발한 마르코-o1은 수학, 물리학, 코딩을 비롯해 명확한 기준이…

1
2
3

Trending

AI 매터스 기사 썸네일 (1) 함샤우트 글로벌 ATR 2026 — AI MATE 한국인의 AI 동반자 지도

“AI 이미 포화됐다고?” 전 세계 84%는 AI를…

공인희 편집인 2월 24, 2026

한 질문에 AI 4개가 토론한다…xAI, '그록 4.20' 공개

한 질문에 AI 4개가 토론한다…xAI, ‘그록 4.20’…

이종철 수석 에디터 2월 23, 2026

AI 매터스 기사 썸네일 AI Arms and Influence

AI 전쟁 시뮬레이션, 가장 먼저 핵 투하를…

공인희 편집인 2월 24, 2026

데이터셋 - AI매터스