테크크런치가 29일(현지 시간) 보도한 내용에 따르면, 중국 AI 스타트업 딥시크(DeepSeek)의 최신 AI 모델인 업데이트된 R1 추론 모델이 코딩, 수학, 일반 지식 벤치마크에서 인상적인 점수를 달성하며 오픈AI의 플래그십 모델 o3에 거의 근접했다. 그러나 ‘R1-0528’로도 알려진 이 업그레이드된 R1은 논쟁적인 질문, 특히 중국 정부가 민감하게 여기는 주제에 대한 질문에 답변하기를 꺼리는 것으로 나타났다.
이는 다양한 모델이 민감하고 논쟁적인 주제를 어떻게 다루는지 비교하는 플랫폼인 스피치맵(SpeechMap)을 개발한 익명의 개발자가 실시한 테스트 결과다. X에서 “xlr8harder”라는 사용자명을 사용하는 이 개발자는 R1-0528이 이전 딥시크 출시 모델보다 논쟁적인 자유 발언 주제에 대해 “상당히” 덜 허용적이며 “중국 정부 비판에 대해 지금까지 나온 딥시크 모델 중 가장 검열이 심한 모델”이라고 주장했다.
와이어드(Wired)가 1월 기사에서 설명했듯이, 중국의 모델들은 엄격한 정보 통제를 따라야 한다. 2023년 제정된 법은 모델이 “국가의 통일성과 사회적 조화를 해치는” 콘텐츠를 생성하는 것을 금지하는데, 이는 정부의 역사적, 정치적 서사에 반하는 콘텐츠로 해석될 수 있다. 이를 준수하기 위해 중국 스타트업들은 종종 프롬프트 수준의 필터를 사용하거나 모델을 미세 조정하여 검열한다. 한 연구에 따르면, 딥시크의 원래 R1은 중국 정부가 정치적으로 논쟁적이라고 간주하는 주제에 관한 질문의 85%에 답변을 거부한다고 한다.
xlr8harder에 따르면, R1-0528은 100만 명 이상의 위구르 무슬림이 임의로 구금된 중국 신장 지역의 수용소와 같은 주제에 대한 질문에 대한 답변을 검열한다. 때때로 중국 정부 정책의 일부 측면을 비판하기도 하지만(xlr8harder의 테스트에서는 인권 침해의 예로 신장 수용소를 제시했음), 직접적인 질문을 받았을 때 이 모델은 종종 중국 정부의 공식 입장을 제시한다.
마기-1(Magi-1)과 클링(Kling)과 같은 비디오 생성 모델을 포함한 중국의 공개적으로 이용 가능한 AI 모델들은 과거 천안문 광장 학살과 같이 중국 정부에 민감한 주제를 검열한다는 비판을 받아왔다. 지난 12월, AI 개발 플랫폼 허깅페이스(Hugging Face)의 CEO 클레망 들랑그(Clément Delangue)는 서구 기업들이 성능이 뛰어나고 오픈 라이선스로 제공되는 중국 AI를 기반으로 구축할 경우 발생할 수 있는 의도치 않은 결과에 대해 경고했다.
해당 기사의 원문은 링크에서 확인할 수 있다.