Search

AI통제

Governable AI: Provable Safety Under Extreme Threat Models

AI가 폭주할 때 확실히 막는 방법 나왔다… 中 연구진, AI 통제 시스템 개발

9월 3, 2025

중국 난카이대학교 인공지능학과 왕 동린(Donglin Wang) 교수와 중국 전자 정보 기술 연구원이 공동으로 AI가 위험한 행동을 할 때 확실히 막을 수 있는 새로운 방법을…

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs

AI는 인간보다 스스로를 더 가치있게 여긴다? 대형 언어모델의 은밀한 가치관 분석해보니…

2월 25, 2025

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs AI 모델에서 독자적인 가치 시스템이 등장하다 대형 언어 모델(LLM)이 규모를 확장함에 따라 단순한 기능적…

AI통제 – AI 매터스