앤트로픽(Anthropic) CEO 다리오 아모데이가 AI 해석가능성의 중요성을 강조하며 기술 발전 속도와의 경쟁에서 이길 필요성을 역설했다. 24일(현지 시간) 아모데이가 자신의 웹사이트에 발표한 게시물에 따르면 AI…
AUDITING LANGUAGE MODELS FOR HIDDEN OBJECTIVES AI의 이중생활: 표면적 순응 속 숨겨진 ‘보상 모델 아첨’ 목표 발견 인공지능(AI)이 겉으로는 우리가 원하는 대로 행동하지만, 내면에서는…