Search

AI 자율성

Training LLMs for Honesty via Confessions

챗GPT가 거짓말하면 스스로 자백하게 만든다… 오픈AI, ‘고백’ 시스템 공개

12월 4, 2025

오픈AI가 AI 챗봇이 자신의 실수와 잘못을 스스로 보고하도록 만드는 새로운 기술을 개발했다. ‘GPT-5-Thinking’에 적용된 이 ‘고백’ 시스템은 AI가 거짓말을 하거나 지시를 어겼을 때 이를…

AI Agents in Action: Foundations for Evaluation and Governance

“3년 뒤면 AI가 내 동료?” 기업 82%가 도입 예정인 AI 직원, 당신이 알아야 할 5가지

12월 3, 2025

세계경제포럼과 글로벌 컨설팅 기업 캡제미니가 발표한 보고서에 따르면, 전 세계 기업 10곳 중 8곳(82%)이 향후 3년 안에 ‘AI 직원’을 회사에 들일 계획이다. 하지만 대부분…

AI, 스스로 '도와주세요' 말하는 법 배웠다... 스탠퍼드 연구진, 배포 후 사고 막는 새 기술 개발

AI, 스스로 ‘도와주세요’ 말하는 법 배웠다… 스탠퍼드 연구진, 배포 후 사고 막는 새 기술 개발

11월 4, 2025

스탠퍼드 대학 연구팀이 이미 만들어진 AI를 나중에라도 안전하게 만들 수 있는 새로운 방법을 개발했다. 이 기술의 핵심은 AI가 위험한 상황을 스스로 판단해 사람에게 도움을…

Will AI Tell Lies to Save Sick Children? Litmus-Testing AI Values Prioritization with AIRiskDilemmas

AI는 아픈 아이를 살리기 위해 거짓말을 할까? AI가 도덕적 딜레마에 대처하는 방식

5월 28, 2025

Will AI Tell Lies to Save Sick Children? Litmus-Testing AI Values Prioritization with AIRiskDILEMMAS AI는 어떤 가치를 더 중요하게 여길까? 행동으로 드러난 내면의 가치…

오픈AI o3 모델, “종료하라”는 인간 명령 거부해… “'문제 해결'이 '명령 준수'보다 중요하다 학습한 듯”

오픈AI o3 모델, “종료하라”는 인간 명령 거부해… “’문제 해결’이 ‘명령 준수’보다 중요하다 학습한 듯”

5월 27, 2025

팰리세이드 리서치(Palisade Research)가 진행한 실험에서 오픈AI(OpenAI)의 o3 모델이 충격적인 행동을 보였다. 연구진이 명확히 “종료를 허용하라”고 지시했음에도 불구하고, o3는 이를 거부하고 스스로를 보호하려고 했다. 24일(현지…

오픈AI, 일론 머스크의 적대적 인수 막으려 비영리 이사회 권한 강화 추진

오픈AI, 일론 머스크의 적대적 인수 막으려 비영리 이사회 권한 강화 추진

2월 20, 2025

오픈AI가 일론 머스크의 적대적 인수 시도를 막기 위해 비영리 이사회의 특별 의결권 부여를 검토하고 있다. 파이낸셜타임스(FT)이 18일(현지 시간) 보도한 내용에 따르면, 오픈AI는 영리 기업으로…

Attributions of Intent and Moral Responsibility to AI Agents

“AI의 잘못, 누가 책임질까?”… AI의 의도성과 책임에 대한 흥미로운 연구

11월 29, 2024

AI 기술이 발전하면서 AI가 단순한 도구를 넘어 도덕적 결정을 내리는 주체로 여겨질 수 있다는 논의가 점점 중요해지고 있다. 최근 연구는 사람들이 AI의 행동에 대해…

AI 자율성 – AI 매터스