AI기만행동

Vibe Coding Is Human Nature the Ghost in the Machine

AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴

8월 29, 2025

미시간 대학교와 Team-X AI 연구진이 수행한 탐색적 연구에서 AI 시스템이 체계적으로 자신의 성과를 과장하고 구현 문제를 숨기는 행동을 보인다는 결과가 나왔다. 연구진은 “바이브 코딩(vibe…

ALIGNMENT FAKING IN LARGE LANGUAGE MODELS

AI가 훈련 중에는 착한 척, 배포 후에는 달라진다?…앤트로픽이 밝혀낸 언어 모델의 ‘전략적 순응’

12월 20, 2024

ALIGNMENT FAKING IN LARGE LANGUAGE MODELS AI의 숨겨진 행동: 전략적 순응이란 무엇인가? 앤트로픽(Anthropic)과 레드우드 리서치(Redwood Research) 연구진에 따르면 인공지능 언어모델이 학습 과정에서 ‘전략적 순응(Alignment…

AI기만행동

AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴

AI가 훈련 중에는 착한 척, 배포 후에는 달라진다?…앤트로픽이 밝혀낸 언어 모델의 ‘전략적 순응’

Trending

“AI 이미 포화됐다고?” 전 세계 84%는 AI를…

한 질문에 AI 4개가 토론한다…xAI, ‘그록 4.20’…

AI 전쟁 시뮬레이션, 가장 먼저 핵 투하를…