인공지능이 저작권 있는 책들로 학습한 뒤 생성한 글을, 독자들이 전문 작가가 쓴 글보다 더 선호한다는 충격적인 연구 결과가 나왔다. 미국 스토니브룩대학교, 컬럼비아 로스쿨, 미시간대학교 공동 연구팀은 최고 수준의 창작 글쓰기 석사(MFA) 과정 학생들과 챗GPT, 클로드, 제미나이 등 최신 AI 모델을 직접 대결시켰다. 결과는 창작계에 경종을 울리기에 충분했다.
전문가도 속았다…파인튜닝된 AI 글의 압도적 승리
연구진은 한강, 살만 루시디, 마거릿 애트우드 등 노벨상과 부커상 수상 작가를 포함한 50명의 저명한 작가 스타일을 모방하는 실험을 진행했다. 159명의 독자(전문가 28명, 일반인 131명)가 인간과 AI가 쓴 최대 450단어 분량의 글을 비교 평가했다. 초반 결과는 예상대로였다. 단순히 프롬프트만 입력한 AI의 글은 전문가 독자들에게 압도적으로 외면받았다. 스타일 충실도에서 0.16배, 글쓰기 품질에서 0.13배의 선호도를 받으며 인간 작가에게 6~8배 뒤처졌다.
하지만 게임 체인저가 등장했다. 각 작가의 전체 작품으로 AI를 파인튜닝하자 상황이 완전히 역전됐다. 전문가 독자들은 갑자기 AI가 쓴 글을 스타일 충실도에서 8.16배, 글쓰기 품질에서 1.87배 더 선호하기 시작했다. 일반 독자들도 비슷한 패턴을 보였다. 특히 놀라운 점은 최첨단 AI 탐지기로 검사했을 때 파인튜닝된 AI 글의 97%가 인간이 쓴 것으로 판정됐다는 사실이다. 반면 일반 프롬프트로 생성한 글은 97%가 AI로 적발됐다.

진부한 표현이 AI를 배신했다…파인튜닝으로 해결
왜 이런 극적인 차이가 발생했을까. 연구팀은 AI 탐지 가능성과 독자 선호도 사이의 관계를 분석했다. 일반 프롬프트 방식에서는 AI 탐지 점수가 높을수록 독자 선호도가 급격히 떨어졌다. 전문가들은 진부한 표현, 과장된 문체, 불필요한 설명 같은 ‘AI 특유의 흔적’을 민감하게 포착했다. 매개 분석 결과 이러한 효과의 16.4%가 진부한 표현 밀도로 설명됐다.
그런데 파인튜닝 후에는 이 관계가 완전히 사라졌다. AI 탐지 점수와 선호도 사이의 부정적 상관관계가 통계적으로 유의미하지 않은 수준으로 감소했고, 진부한 표현이 매개하는 효과도 1.3%로 급감했다. 파인튜닝이 AI 특유의 문체적 흔적을 단순히 가린 것이 아니라 근본적으로 제거했다는 의미다. 작가별로는 30명 중 27명이 스타일 충실도에서, 23명이 글쓰기 품질에서 인간 작가를 앞섰다. 흥미롭게도 학습 데이터 양(89만~1,090만 토큰)과 성과 사이에는 상관관계가 없었다. 적은 작품을 쓴 신예 작가도 다작 작가만큼 효과적으로 모방됐다.

10만 단어에 평균 11만원…작가 수입의 0.3% 비용으로 대체 가능
경제적 충격은 더욱 가혹하다. 연구에 따르면 작가당 파인튜닝과 추론 비용의 중앙값은 81달러(약 11만원)였다. 10만 단어 소설 분량 원고를 생성하는 총비용은 25달러에서 최대 $276달러 수준이다. 반면 이 연구에 참여한 전문 작가들은 같은 분량에 2만5000달러(약 3,400만원)를 청구했다. AI가 인간 작가 비용의 단 0.3%로 더 선호되는 결과물을 만들어낸 셈이다. 물론 이 비용은 순수한 생성 비용만을 반영한 것이다. AI가 만든 원고를 응집력 있는 출판 가능한 작품으로 다듬는 데 필요한 인간의 추가 작업은 고려하지 않았다. 하지만 대부분의 작가에서 성과가 학습 데이터 양이나 비용과 무관했다는 점은 시사하는 바가 크다.
저작권 소송의 핵심 쟁점…”시장 희석 효과” 입증됐다
이 연구는 현재 진행 중인 작가들의 AI 기업 저작권 소송에 직접적인 영향을 미칠 전망이다. 미국 저작권법의 공정 이용(Fair Use) 판단에서 가장 중요한 네 번째 요소는 “원작의 잠재적 시장이나 가치에 미치는 영향”이다. 법원은 이를 AI가 생성한 작품이 원작가의 작품을 시장에서 대체할 수 있는지 여부로 이해한다.
메타를 상대로 한 카드리 소송에서 찹리아 판사는 작가들이 입증해야 할 사항을 명확히 제시했다. AI 시스템이 대체 가능한 책을 생성할 수 있는지, AI 생성 책이 원고의 시장에서 경쟁하는지, 실제 판매에 어떤 영향을 미치는지 등이다. 이번 연구는 이 모든 질문에 실증적 답변을 제공한다. 특히 독자들이 유명 작가의 독특한 문체를 모방한 AI 생성 글을 실제로 선호한다는 사실은, 저명한 작가일수록 대체가 어려울 것이라는 판사의 추측을 정면으로 반박한다.
미국 저작권청도 이미 “시장 희석” 개념을 인정한 바 있다. 저작권청은 “AI 시스템이 콘텐츠를 생성하는 속도와 규모는 훈련 데이터와 같은 종류의 작품 시장을 희석시킬 심각한 위험을 초래한다”며 “수천 개의 AI 생성 로맨스 소설이 시장에 나오면, AI가 훈련받은 인간 작가의 로맨스 소설은 판매가 줄어들 가능성이 높다”고 경고했다. 연구진은 해결책으로 두 가지를 제시한다. 일반 목적 데이터셋에는 저작물 포함을 허용하되, 특정 작가의 비패러디 모방물 생성을 차단하는 ‘가드레일’ 설치를 의무화하는 방안이다. 또는 일반 프롬프트 방식의 공정 이용을 인정하되, AI 생성 사실을 눈에 띄게 공개하도록 강제하는 것이다. 정보를 제공받은 대중이 AI 대체물을 덜 선택할 것이라는 가정에 기반한다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q1. 일반 프롬프트와 파인튜닝의 차이는 무엇인가요?
일반 프롬프트는 AI에게 “헤밍웨이 스타일로 써줘”라고 지시하는 것입니다. 반면 파인튜닝은 헤밍웨이의 전체 작품으로 AI를 추가 학습시켜 그의 문체를 내재화하는 것입니다. 연구에서 일반 프롬프트 AI는 진부한 표현과 과장된 문체로 전문가들에게 외면받았지만, 파인튜닝된 AI는 작가 특유의 어휘, 문장 구조, 리듬까지 자연스럽게 재현해 97%가 인간이 쓴 것으로 오인될 정도였습니다.
Q2. AI가 작가를 완전히 대체할 수 있나요?
현재로서는 아닙니다. 이 연구는 최대 450단어의 짧은 발췌문에 국한됐습니다. AI는 아직 장편 소설 전체를 주제적으로 일관되게 쓰는 능력이 부족합니다. 연구진도 AI 원고를 출판 가능한 작품으로 다듬는 데 필요한 인간의 추가 작업 비용을 고려하지 않았다고 명시했습니다. 하지만 인간과 파인튜닝된 AI가 협업해 경쟁력 있는 장편을 만들 가능성은 충분합니다.
Q3. 이 연구가 창작 산업에 미칠 영향은 무엇인가요?
즉각적인 위협은 신인 작가와 중견 작가들입니다. 연구에서 확립된 작가와 신예 작가의 학습 효과가 비슷했다는 점은, 출판사가 저렴한 AI 생성 콘텐츠로 시장을 포화시킬 수 있음을 의미합니다. 미국 노동통계국에 따르면 창작 글쓰기는 전체 작가 직업의 약 50%를 차지하는데, 이들이 가장 취약한 위치에 놓였습니다. 장기적으로는 저작권법 개정과 AI 투명성 공개 의무화 등 제도적 대응이 필요할 것입니다.
기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다.
리포트명: Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.