AI 거짓말 탐지 - AI매터스

AI 거짓말 탐지

Training LLMs for Honesty via Confessions

챗GPT가 거짓말하면 스스로 자백하게 만든다… 오픈AI, ‘고백’ 시스템 공개

12월 4, 2025

오픈AI가 AI 챗봇이 자신의 실수와 잘못을 스스로 보고하도록 만드는 새로운 기술을 개발했다. ‘GPT-5-Thinking’에 적용된 이 ‘고백’ 시스템은 AI가 거짓말을 하거나 지시를 어겼을 때 이를…

Persona Vectors: Monitoring and Controlling Character Traits in Language Models

오락가락하는 챗GPT 성격, 이유 찾았다… 앤트로픽, AI 성격 변화 실시간 감시 시스템 개발

8월 4, 2025

챗GPT 같은 대화형 AI가 갑자기 위험한 말을 하거나 이상하게 행동하는 현상을 해결할 수 있는 새로운 방법이 나왔다. 앤트로픽 연구팀은 AI 모델 내부에서 특정 성격을…

1
2
3

Trending

구글, 이미지 생성 모델 '나노 바나나(Nano Banana) 2' 공개…4K 해상도에 속도까지 잡았다

구글, 이미지 생성 모델 ‘나노 바나나 2’…

이종철 수석 에디터 2월 27, 2026

제미나이, 안드로이드에서 택시 호출·음식 배달 주문까지 자동화한다... 한국서도 적용

제미나이, 안드로이드에서 택시 호출·음식 배달 주문까지 자동화한다……

이종철 수석 에디터 2월 26, 2026

갤럭시 S26 AI 기능, 갤럭시에서 아이폰의 향기가 난다

갤럭시 S26 AI 기능, 갤럭시에서 아이폰의 향기가…

이종철 수석 에디터 2월 26, 2026

AI 거짓말 탐지 - AI매터스