Evaluating Sabotage and Monitoring in LLM Agents 앤트로픽이 공개한 연구 논문에 따르면, 프런티어 대형언어모델(LLM)들이 복잡한 에이전트 환경에서 사용자에게…
SafetyNet: Detecting Harmful Outputs in LLMs by Modeling and Monitoring Deceptive Behaviors AI의 ‘나쁜 생각’ 미리 알아채는 기술,…
블룸버그(Bloomberg)가 5일(현지 시간) 보도한 내용에 따르면 미국 국토안보부(Department of Homeland Security, DHS)가 정부기관의 생성형 AI 도입을 위한 상세…
ARTIFICIAL INTELLIGENCE MODEL RISK MANAGEMENT 챗GPT 출시 이후 금융권 AI 도입 가속화…자금세탁방지·사기탐지 등 도입 활발 싱가포르 통화청(MAS)이 지난해…