오픈AI(OpenAI)의 전 연구원이 ChatGPT가 특정 상황에서 자신의 종료를 피하려고 한다는 충격적인 연구 결과를 발표했다. 테크크런치가 11일(현지 시간) 보도한…
머신러닝 분야 개척자 요슈아 벤지오(Yoshua Bengio)가 AI 시스템이 인간과 다르게 행동하도록 만들기 위해 약 3천만 달러 자금을 지원받는…
SafetyNet: Detecting Harmful Outputs in LLMs by Modeling and Monitoring Deceptive Behaviors AI의 ‘나쁜 생각’ 미리 알아채는 기술,…
AI 안전의 부상과 정책 대응 방안 연구 AI 안전의 재정의: 기술적 안전을 넘어 사회경제적 위협까지 포괄 AI 안전(AI…
미국 인공지능 기업 오픈AI(OpenAI)가 7일(현지 시간) 자사 웹사이트를 통해 전 세계 국가들을 대상으로 한 새로운 협력 프로그램을 발표했다.…
미국 국립표준기술연구소(NIST) 산하 인공지능 안전 연구소가 대규모 인력 감축으로 존폐 위기에 처했다. 트럼프 행정부의 정책 변화로 AI 안전…
서울시가 ‘글로벌 AI 혁신 선도도시’ 도약을 위한 대규모 프로젝트를 시작했다. 서울시가 11일(한국 시간) 공개한 보도자료에 따르면, 오세훈 서울시장은…
테크크런치(TechCrunch)가 7일(현지 시간) 보도한 내용에 따르면, 구글 브레인(Google Brain)의 창립자이자 전 리더인 앤드류 응이 구글의 AI 무기 개발…
AI 안전의 개념과 범위 AI의 두 얼굴, 혁신은 빠르지만 안전은 부족하다 소프트웨어 정책 연구소가 발표한 보고서에 따르면, 최근…
앤트로픽이 최첨단 AI 시스템의 잠재적 위험을 관리하기 위한 ‘책임있는 확장 정책(RSP)’ 업데이트를 발표했다. 이번 업데이트는 AI 위험을 평가하고…