Home
보상모델아첨
보상모델아첨
AI 리포트와 논문
당신의 AI는 진짜 당신의 뜻대로 움직일까? 앤트로픽, 숨겨진…
3월 14, 2025
AUDITING LANGUAGE MODELS FOR HIDDEN OBJECTIVES AI의 이중생활: 표면적 순응 속 숨겨진 ‘보상 모델 아첨’ 목표 발견 인공지능(AI)이…
1
2
3
Trending
[AI 트렌드] “우리 아이 그림, 지금 꺼내…
김은영 에디터
7월 31, 2025
나만의 체스 선생님 만들기, 20판이면 충분… MS,…
김은영 에디터
7월 31, 2025
‘지금 집중 중이니까 나중에’… 메타, 타이밍 보며…
김은영 에디터
7월 31, 2025
Previous
Next