• Home
  • News
  • 오픈AI, O’Reilly 유료 도서 무단 활용 의혹 제기돼

오픈AI, O’Reilly 유료 도서 무단 활용 의혹 제기돼

오픈AI, O’Reilly 유료 도서 무단 활용 의혹 제기돼
이미지출처: 이디오그램 생성

4월 1일(현지 시간) 테크크런치는 인공지능 감시 단체 ‘AI 디스클로저 프로젝트’가 발표한 보고서를 인용해 오픈AI(OpenAI)가 자사 최신 모델인 GPT-4o를 훈련시키는 과정에서 라이선스를 체결하지 않은 O’Reilly Media의 유료 서적을 사용했을 가능성이 높다고 보도했다. 해당 연구는 팀 오라일리(Tim O’Reilly), 일란 스트라우스(Ilan Strauss), AI 연구자 스룰리 로젠블랫(Sruly Rosenblat)이 공동 진행했으며, DE-COP이라 불리는 분석 기법으로 공개되지 않은 콘텐츠의 학습 여부를 탐색했다.

이들은 총 34권에 달하는 책 중 발췌된 약 13,962개 문단을 통해 다양한 GPT 기반 모델들을 실험했고 그 결과 GPT-4o가 이전 세대보다 더 높은 빈도로 비공개 도서를 “인지”한다는 점이 확인됐다. 논문은 이는 훈련 데이터로 실제 텍스트가 포함됐다는 정황이라고 주장하지만 증거 수준이 완전하진 않다고 밝혔다.

보고서는 또한 사용자들이 챗GPT(ChatGPT)에 직접 내용을 입력하면서 생긴 간접 노출이나 새롭게 출시된 확장형 모델들(GPT-4.5 등)의 자료 구성까지 고려되지는 않았음을 분명히 했다. 이번 사안과 관련해 오픈AI 측은 별다른 입장을 밝히지 않았다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 오픈AI

기사는 클로드와 챗GPT를 활용해 작성되었습니다. 




오픈AI, O’Reilly 유료 도서 무단 활용 의혹 제기돼 – AI 매터스