AUC - AI매터스

AUC

SHADE-Arena: Evaluating sabotage and monitoring in LLM agents

AI 거짓말 대회 해보니… 클로드가 1등, 인간 감시관은 꼴찌

6월 17, 2025

Evaluating Sabotage and Monitoring in LLM Agents 앤트로픽이 공개한 연구 논문에 따르면, 프런티어 대형언어모델(LLM)들이 복잡한 에이전트 환경에서 사용자에게 해를 끼치는 능력이 제한적이지만 점차 발전하고…

1
2
3

Trending

"네이버 시대 끝나나"… 챗GPT 이용률 54% 돌파, 10대는 이미 이동

“네이버 시대 끝나나”… 챗GPT 이용률 54% 돌파,…

권나혜 에디터 1월 27, 2026

엑셀에 클로드 들어왔다… "복잡한 재무제표, 이제 AI한테 물어보세요"

엑셀에 클로드 들어왔다… “복잡한 재무제표, 이제 AI한테…

권나혜 에디터 1월 28, 2026

"AI 100명이 동시에 일한다"… 중국 AI 신기술 공개

“AI 100명이 동시에 일한다”… 중국 AI 신기술…

권나혜 에디터 1월 28, 2026

AUC - AI매터스