AI 학습데이터 저작권 관련 각국 정책 동향 및 시사점
영국 정부가 인공지능(AI) 학습데이터의 저작권 문제 해결을 위해 대규모 공공협의를 진행했다. 2024년 12월부터 2025년 2월까지 약 3개월간 진행된 “Copyright and Artificial Intelligence” 주제의 공공협의에는 13,000건 이상의 의견이 접수되었다. 법무법인 율촌이 공개한 ‘AI 학습데이터 저작권 관련 각국 정책 동향 및 시사점’에 따르면,이번 협의에서 영국 정부는 AI 학습을 위한 상업적 텍스트 및 데이터 마이닝(Text and Data Mining, TDM)에 대한 저작권 예외 조항 도입 방안을 3가지로 제시했다.
영국, 3개월간 공공협의로 AI와 저작권 균형점 모색
영국 정부가 인공지능(AI) 학습데이터의 저작권 문제 해결을 위해 대규모 공공협의를 진행했다. 2024년 12월부터 2025년 2월까지 약 3개월간 진행된 “Copyright and Artificial Intelligence” 주제의 공공협의에는 13,000건 이상의 의견이 접수되었다. 법무법인 율촌이 공개한 ‘AI 학습데이터 저작권 관련 각국 정책 동향 및 시사점’에 따르면,이번 협의에서 영국 정부는 AI 학습을 위한 상업적 텍스트 및 데이터 마이닝(Text and Data Mining, TDM)에 대한 저작권 예외 조항 도입 방안을 3가지로 제시했다.
제1안은 상업적 TDM 수행 시 반드시 저작권자로부터 이용 허락을 받도록 하는 방안이며, 제2안은 상업적 TDM에 대한 전면적인 면책규정을 도입하는 방안이다. 정부가 선호하는 제3안은 상업적 TDM에 대한 면책규정을 도입하되 저작권자가 명시적으로 권리를 유보(opt-out)한 경우에는 면책이 적용되지 않도록 예외를 두고, AI 개발자에게 학습에 사용한 데이터의 출처 및 사용 내역을 공개할 투명성 의무를 부과하는 절충안이다.
AI 개발사와 창작자 단체 간 첨예한 입장 대립
공공협의 과정에서 이해관계자들의 입장은 극명하게 갈렸다. AI 개발사들은 주로 상업적 TDM 면책 규정을 전면적으로 도입하는 제2안에 찬성했다. 이들은 정부가 제시한 제3안에 대해서도 AI 학습에 활용된 데이터를 공개할 의무에 대하여는 기술적인 이행가능성이 낮고 영업비밀이 유출될 가능성이 있다고 우려를 표했다.
반면 창작자 단체들은 정부안이 도입하고자 하는 권리유보 메커니즘은 실효성이 없다고 지적하면서, 주로 현행 저작권법 체계를 유지하거나 제1안을 도입해야 한다는 의견을 제시했다. 학계에서는 주로 정부가 제안한 제3안의 권리유보 메커니즘이 베른 협약 등 국제 협약을 위반할 소지가 있다고 지적하면서, 상업적 목적의 TDM에 대하여는 라이선싱 중심의 체계가 유지되어야 한다는 의견을 제시했다.
일본·싱가포르 vs 유럽연합, 서로 다른 AI 저작권 접근법
각국의 AI 학습데이터 저작권 정책은 다양한 방향으로 전개되고 있다. 일본은 2018년 개정 저작권법 제30조의4를 통해 “저작물에 표현된 사상 또는 감정을 스스로 향수하거나 타인에게 향수시킬 것을 목적으로 하지 않는 경우”에는 저작권자의 이익을 부당하게 침해하지 않는 한 저작물을 복제, 전송, 변형 등의 형태로 자유롭게 이용할 수 있도록 했다.
싱가포르는 2021년 저작권법 개정을 통해 컴퓨팅 데이터 분석(Computational Data Analysis, CDA)을 위한 저작물 사용의 경우에는 저작권을 침해하지 않은 것으로 간주하는 조항을 도입했다. 다만 일본과 달리 이용자가 저작물에 합법적으로 접근해야 한다는 제약을 받는다.
반면 유럽연합은 2019년 디지털단일시장의 저작권 및 저작인접권에 관한 지침(DSM 지침)을 제정하여 TDM에 대한 면책규정을 도입하되 목적에 따라 면책의 범위를 달리 정했다. 특히 연구목적 외의 TDM의 경우에도 면책의 대상으로 하되 권리자가 저작권을 유보(opt-out)한 경우에는 예외적으로 면책이 적용되지 않도록 했다.
미국 법원 판결로 AI 학습데이터 저작권 논란 가열
미국에서는 연방저작권법 제107조의 공정이용(Fair Use) 일반규정을 통해 AI모델 개발을 위한 저작물 이용 문제를 해결하려는 접근이 주류를 이루고 있다. 하지만 지난 2025년 2월 델라웨어 지방법원이 내린 판결이 산업계에 큰 파장을 일으켰다.
톰슨 로이터(Thomson Reuters)가 AI 기반 법률 검색 엔진 서비스를 제공하는 로스 인텔리전스(Ross Intelligence)를 상대로 제기한 저작권 침해 소송에서 법원은 로스 인텔리전스의 공정이용 주장을 받아들이지 않고 저작권 침해를 인정했다. 법원은 로스 인텔리전스의 검색 엔진이 상업적 이익을 목적으로 개발된 점, 웨스트로(Westlaw)의 콘텐츠를 변형하지 않고 사실상 원문에 가까운 형태로 사용한 점, 톰슨 로이터의 잠재적인 시장을 대체하는 효과를 가지는 점 등을 이유로 들었다.
미국 저작권청(US Copyright Office)도 지난 5월 9일 AI모델의 학습데이터와 저작권 문제에 관한 “저작권과 인공지능(Copyright and Artificial Intelligence)” 3차 보고서 초안을 공개하면서 인공지능 모델 학습을 위한 저작물의 대규모 상업적 활용이 공정이용에 해당할 가능성이 낮다는 입장을 표명했다.
FAQ
Q: TDM(텍스트 및 데이터 마이닝) 면책규정이란 무엇인가요?
A: TDM 면책규정은 AI 학습을 위해 대량의 텍스트나 데이터를 수집·분석할 때 저작권자의 별도 허락 없이도 저작물을 사용할 수 있도록 하는 법적 예외 조항입니다. 이는 AI 기술 발전을 촉진하기 위한 목적으로 도입이 검토되고 있습니다.
Q: 영국 정부의 제3안에서 말하는 ‘권리유보(opt-out)’ 시스템은 어떻게 작동하나요?
A: 권리유보 시스템은 저작권자가 자신의 작품이 AI 학습에 사용되는 것을 명시적으로 거부할 수 있는 권리를 의미합니다. 저작권자가 이를 선언하면 해당 작품은 AI 학습 면책 규정의 적용에서 제외되어 무단 사용 시 저작권 침해가 됩니다.
Q: 각국의 AI 학습데이터 저작권 정책이 국내 AI 산업에 미치는 영향은 무엇인가요?
A: 각국의 정책 차이는 AI 기업들의 글로벌 경쟁력에 직접적인 영향을 미칩니다. 면책 규정이 관대한 국가는 AI 개발이 용이하지만, 엄격한 국가는 라이선싱 비용 부담이 증가할 수 있습니다. 우리나라도 AI 산업 경쟁력과 창작자 권리 보호 간의 균형점을 찾는 정책 마련이 시급한 상황입니다.
해당 기사에 인용한 리포트 원문은 법무법인 율촌에서 확인 가능하다.
해당 기사는 챗GPT와 클로드를 활용해 작성했습니다.
이미지 출처: 이디오그램 생성