벤치마크 - AI매터스

벤치마크

SHADE-Arena: Evaluating sabotage and monitoring in LLM agents

AI 거짓말 대회 해보니… 클로드가 1등, 인간 감시관은 꼴찌

6월 17, 2025

Evaluating Sabotage and Monitoring in LLM Agents 앤트로픽이 공개한 연구 논문에 따르면, 프런티어 대형언어모델(LLM)들이 복잡한 에이전트 환경에서 사용자에게 해를 끼치는 능력이 제한적이지만 점차 발전하고…

Spurious Rewards: Rethinking Training Signals in RLVR

“정답 몰라도 괜찮다”… AI 강화학습의 상식을 뒤엎은 워싱턴대 연구

6월 2, 2025

Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습 분야에서 놀라운 연구 결과가 발표됐다. 워싱턴대학교와…

1
2
3

Trending

"네이버 시대 끝나나"… 챗GPT 이용률 54% 돌파, 10대는 이미 이동

“네이버 시대 끝나나”… 챗GPT 이용률 54% 돌파,…

권나혜 에디터 1월 27, 2026

엑셀에 클로드 들어왔다… "복잡한 재무제표, 이제 AI한테 물어보세요"

엑셀에 클로드 들어왔다… “복잡한 재무제표, 이제 AI한테…

권나혜 에디터 1월 28, 2026

"AI 100명이 동시에 일한다"… 중국 AI 신기술 공개

“AI 100명이 동시에 일한다”… 중국 AI 신기술…

권나혜 에디터 1월 28, 2026

벤치마크 - AI매터스