오픈AI(OpenAI)가 사용자들의 챗GPT 대화 내용이 구글(Google) 등 검색엔진에 색인되는 실험을 중단했다고 발표했다. 테크크런치(TechCrunch)가 지난달 31일(현지 시간) 보도한 내용에 따르면, 사용자들이 챗GPT에서 공유 버튼을 클릭해 만든 대화 링크들이 구글, 빙(Bing) 등 주요 검색엔진에서 검색됐다. 이 과정에서 개인정보가 의도치 않게 노출되는 사례들이 발견됐다.
검색 결과에는 화장실 리모델링 도움을 요청하거나 천체물리학 설명을 구하는 등 일상적인 질문부터, 특정 채용공고에 맞춰 이력서 작성을 요청하는 개인적인 내용까지 다양한 대화들이 포함됐다. 심지어 한 사용자의 경우 대화 내용을 통해 링크드인(LinkedIn) 프로필까지 추적할 수 있었다.
챗GPT는 기본적으로 대화를 공개하지 않는다. 사용자가 직접 ‘공유’ 버튼을 클릭하고 ‘링크 생성’ 버튼을 한 번 더 눌러야만 “/share” URL이 만들어진다. 이 과정에서 사용자 이름, 맞춤 지침, 공유 후 추가된 메시지는 비공개로 유지된다고 명시돼 있다. 링크를 만든 후에는 검색 가능 여부를 설정할 수 있다.
하지만 많은 사용자들이 자신의 공유 링크가 다른 검색엔진에 색인될 수 있다는 점을 예상하지 못했다. 오픈AI 대변인은 테크크런치에 “챗GPT 대화는 사용자가 공유를 선택하지 않는 한 공개되지 않는다”며 “우리는 사용자가 통제권을 유지하면서 유용한 대화를 더 쉽게 공유할 수 있는 방법을 테스트해왔고, 최근 공유 시 명시적으로 동의한 경우 검색엔진 결과에 대화가 나타나도록 하는 실험을 종료했다”고 밝혔다.
이 기능은 기사가 발행된 몇 시간 후 제거됐다. 오픈AI는 이를 “단기간 실험”이라고 설명하며 “사람들이 의도하지 않은 내용을 실수로 공유할 가능성이 너무 컸다”고 중단 이유를 설명했다. 구글 대변인은 “구글이나 다른 검색엔진은 웹에서 어떤 페이지가 공개되는지 통제하지 않는다”며 “이런 페이지를 만든 사람들이 검색엔진에 색인될지 여부를 완전히 통제한다”고 밝혔다.
이런 방식은 구글이 부분적으로 만든 관례이기도 하다. 사람들이 구글 드라이브(Google Drive)에서 “링크가 있는 사용자는 누구나 볼 수 있음” 설정으로 파일의 공개 링크를 공유하면, 구글이 이를 검색에 색인할 수 있다. 하지만 구글은 일반적으로 웹에 공개적으로 게시되지 않은 드라이브 문서 링크는 표시하지 않는다. 검색엔진은 어떤 콘텐츠를 검색 결과에 보여줄지는 결정할 수 있지만, 애초에 어떤 페이지가 색인될지는 통제할 수 없다는 구조적 한계가 이번 사태의 원인으로 지목된다.
해당 기사의 원문은 테크크런치에서 확인 가능하다.
이미지 출처: 오픈AI