구글, AI 생성 콘텐츠 '지문' 기술 공개...텍스트·이미지·음악 '진위 구별' 가능해졌다

구글(Google)이 AI 생성 콘텐츠를 식별할 수 있는 기술인 ‘신시아이디(SynthID)’를 공개했다. 이 기술은 AI가 생성한 텍스트, 이미지, 오디오, 비디오에 육안으로는 보이지 않는 디지털 워터마크를 삽입해 AI 생성 여부를 확인할 수 있게 했다.

구글에 따르면 신시아이디는 대규모 언어모델(LLM)이 텍스트를 생성할 때 각 토큰의 확률 점수를 미세하게 조정해 워터마크를 삽입한다. 이 기술은 최소 3문장 이상의 텍스트에서 적용 가능하며, 텍스트 길이가 길어질수록 식별 정확도가 높아진다.

구글은 2024년 10월 이 기술을 네이처(Nature)지에 발표했으며, ‘구글 책임있는 생성형 AI 툴킷(Google Responsible Generative AI Toolkit)’을 통해 오픈소스로 공개했다. 현재 허깅페이스(Hugging Face)와 협력해 개발자들이 이 기술을 자유롭게 활용할 수 있도록 했다.

신시아이디는 AI가 생성한 이미지나 비디오의 픽셀에 직접 디지털 워터마크를 삽입한다. 이미지를 자르거나 필터를 적용하고, 색상을 변경하거나 압축해도 워터마크가 남아있어 식별이 가능하다.

구글 버텍스 AI(Vertex AI) 고객들은 이미지 생성 모델인 이마젠 2와 3(Imagen 2, 3)을 통해 이 기술을 사용할 수 있으며, 이미지FX(ImageFX)와 비디오FX(VideoFX)에서도 워터마크 기능이 적용됐다.

구글의 AI 음악 생성 모델인 리리아(Lyria)에도 신시아이디가 적용됐다. 음성 파형을 스펙트로그램으로 변환한 뒤 디지털 워터마크를 삽입하는 방식이다. 노이즈 추가, MP3 압축, 재생 속도 변경 등의 수정에도 워터마크가 유지된다.

구글 관계자는 “AI 생성 콘텐츠를 식별하는 것은 정보에 대한 신뢰를 높이는 데 매우 중요하다”며 “허위정보나 잘못된 귀속 문제를 완전히 해결할 순 없지만, 이는 AI 안전성 문제를 해결하기 위한 유망한 기술적 해결책”이라고 설명했다.

신시아이디에 대한 더 자세한 정보는 구글홈페이지에서 확인할 수 있다.