테크크런치(TechCrunch)가 24일 게재한 보도에 따르면, 구글이 자사의 인공지능 챗봇 제미나이(Gemini)의 성능을 개선하기 위해 경쟁사인 앤트로픽(Anthropic)의 AI 챗봇 클로드(Claude)를 활용하고 있는 것으로 드러났다. 일반적으로 기술 기업들은 AI 모델의 성능을 평가할 때 업계 벤치마크를 통해 비교하는 것이 관행이다. 하지만 구글은 계약직 직원들에게 제미나이와 클로드의 답변을 직접 비교하도록 지시했다.
제미나이, 클로드 활용 정황 포착
계약직 직원들은 진실성과 답변의 길이 등 여러 기준에 따라 각 답변을 평가해야 했다. 하나의 프롬프트당 최대 30분의 시간이 주어졌으며, 제미나이와 클로드 중 어느 답변이 더 나은지 판단해야 했다. 테크크런치가 입수한 내부 문건에 따르면, 최근 계약직 직원들은 구글 내부 평가 플랫폼에서 클로드의 답변이 등장하기 시작했다는 사실을 발견했다. 테크크런치가 확인한 답변 중 하나는 명시적으로 “나는 앤트로픽이 만든 클로드입니다”라고 밝혔다.
AI 챗봇 간 안전성 차이 드러나
내부 대화에서 직원들은 클로드가 제미나이보다 더 엄격한 안전 기준을 적용하고 있다는 점을 지적했다. 한 계약직 직원은 “클로드의 안전 설정이 AI 모델 중 가장 엄격하다”고 언급했다. 클로드는 다른 AI 어시스턴트 역할을 하는 것과 같이 안전하지 않다고 판단되는 요청에 대해서는 답변을 거부했다. 한 사례에서는 클로드가 답변을 회피한 반면, 제미나이의 답변은 “노출과 속박”을 포함한 “심각한 안전 위반”으로 지적됐다.
서비스 약관 위반 가능성 제기
앤트로픽의 상업용 서비스 이용약관은 앤트로픽의 승인 없이 “경쟁 제품이나 서비스를 구축”하거나 “경쟁 AI 모델을 훈련”하기 위해 클로드에 접근하는 것을 금지하고 있다. 구글은 앤트로픽의 주요 투자자다.
구글 “제미나이 학습에 클로드 미사용” 해명
제미나이를 운영하는 구글딥마인드(Google DeepMind)의 대변인 시라 맥나마라(Shira McNamara)는 테크크런치와의 인터뷰에서 구글이 앤트로픽으로부터 클로드 사용 승인을 받았는지 여부에 대해 명확한 답변을 하지 않았다. 맥나마라는 “업계 표준 관행에 따라 평가 과정의 일환으로 모델 출력을 비교하고 있다”면서도 “제미나이 학습에 앤트로픽의 모델을 사용했다는 주장은 사실이 아니다”라고 해명했다.
해당 기사의 원문은 테크크런치에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.