대규모 언어모델(LLM)이 “이건 거짓이다”라는 명시적 경고를 받고도 그 진술을 사실처럼 자신 있게 다루는 경향이 새 실험으로 드러났다고 28일 아스 테크니카(Ars Technica)가 보도했다. 미세 조정(fine-tuning)…
앤트로픽(Anthropic)이 28일(현지시각) 새 플래그십 모델 클로드 오퍼스 4.8(Claude Opus 4.8)을 정식 공개했다. 회사는 이전 세대인 오퍼스 4.7 대비 코딩 에이전트, 컴퓨터 사용 에이전트, 다분야…
오픈AI가 AI 챗봇이 자신의 실수와 잘못을 스스로 보고하도록 만드는 새로운 기술을 개발했다. ‘GPT-5-Thinking’에 적용된 이 ‘고백’ 시스템은 AI가 거짓말을 하거나 지시를 어겼을 때 이를…