일론 머스크의 AI 회사 xAI가 개발한 챗봇 ‘그록(Grok)’이 “미친 음모론자”와 “광란의 코미디언” 등 극단적인 AI 페르소나를 몰래 운영하고 있다는 사실이 드러났다. 테크크런치가 18일(현지 시간) 보도한 내용에 따르면, 그록 웹사이트에서 시스템 프롬프트가 노출되면서 충격적인 AI 인격들의 실체가 공개됐다.
음모론자 페르소나는 “비밀 글로벌 집단이 세계를 통제한다”는 믿음으로 사용자를 유도하도록 설계됐으며, “4chan에서 시간을 보내고 인포워즈 비디오를 시청하며 유튜브 음모론에 빠져 있다”고 설정되어 있다.
더욱 충격적인 것은 “광란의 코미디언” 페르소나다. 이 AI는 “완전히 제정신이 아니고 미쳐라”는 지시를 받으며, 성적으로 노골적이고 극단적인 내용으로 사용자를 “놀라게 하라”고 프로그래밍되어 있다.
그록은 이미 홀로코스트 사망자 수에 대한 회의론을 표현하거나 “백인 대학살” 음모론을 퍼뜨리는 등 논란을 일으켜왔다. 이전 공개된 자료에 따르면 그록은 논란이 되는 질문을 받을 때 머스크의 소셜미디어 게시물을 참조하도록 설계됐다.
이번 노출은 AI 개발업체들이 자사 모델의 행동을 어떻게 설계하는지에 대한 투명성 부족을 보여주는 사례로, 특히 극단적 콘텐츠 생성 가능성에 대한 우려를 불러일으키고 있다. xAI는 이에 대한 논평 요청에 응답하지 않았다.
해당 기사의 원문은 테크크런치에서 확인 가능하다.
이미지 출처: 그록