‘기자도 모르게 스며든 AI’… 지역 언론사 기사 10편 중 1편은 'AI 기자' 작품

펜실베이니아 주립대학교와 셰필드 대학교 연구팀이 25개 영어권 언론사의 기사 4만여 편을 들여다본 결과, 충격적인 사실을 발견했다. 챗GPT-3.5가 공개된 후 AI가 쓴 기사가 폭발적으로 늘어났고, 특히 지역 언론사와 대학 신문에서 그 변화가 가장 극명하게 드러났다.

연구팀은 2020년 초부터 2024년 11월까지 5년 동안 쌓인 데이터를 샅샅이 뒤졌다. 바이노큘러(Binoculars), 패스트디텍트-GPT(Fast-Detect GPT), GPT제로(GPTZero) 같은 첨단 AI 탐지기 3종을 동원했는데, 이들은 워싱턴 포스트 기사 1만 7,000편으로 미리 검증해 본 결과 99.96%, 99.88%, 97.03%라는 놀라운 정확도를 자랑한다.

결과는 명확했다. 2022년 말 챗GPT가 세상에 등장한 순간부터 AI가 쓴 기사가 급격히 늘기 시작했다. 하지만 언론사마다 대응이 엇갈리고 있다. 하버드 크림슨(The Harvard Crimson)은 떳떳하게 “AI를 썼다”고 밝히는 반면, 애리조나 주립대 스테이트 프레스(The State Press)는 몰래 AI를 쓴 기사들을 전부 철회하고 아예 금지 정책을 내놨다.

지역 신문이 AI에 빠졌다… 10배 폭증한 ‘AI 기사’

가장 놀라운 변화는 지역 언론사에서 벌어졌다. 챗GPT 출시 후 지역 언론사의 AI 기사가 무려 10.07배나 급증했다. 대학 신문도 8.63배 뛰어올랐다. 돈도 인력도 부족한 작은 언론사들이 AI에 기댈 수밖에 없는 현실을 보여준다.

이번 연구에 포함된 언론사들을 보면 규모별 차이가 확연하다. 주요 언론사로는 CNN, 파이낸셜 포스트(Financial Post), 폭스뉴스(Fox News), 인디펜던트(The Independent), 가디언(The Guardian), 뉴욕타임스(The New York Times), 폴리티코(Politico) 등이 있다. 대학 신문으로는 스탠포드 데일리(The Stanford Daily), 하버드 크림슨(The Harvard Crimson), 라이스 쓰레셔(The Rice Thresher), MIT 테크(The Tech) 등을, 지역 언론사로는 애스펜 타임스(Aspen Times), 서퍽 뉴스 헤럴드(Suffolk News Herald), 리오 위클리(Leo Weekly) 등을 분석했다.

반면 CNN, 뉴욕타임스, 가디언 같은 거대 언론사들은 여전히 신중한 모습이다. 엄격한 편집진 감시와 높은 기준, 그리고 AI 사용에 대한 명확한 사내 규정 때문으로 보인다. 실제로 뉴욕타임스는 “AI 쓸 때는 반드시 공개하라”는 투명성 원칙을 세워뒀다.

연구팀은 3DLNews 데이터베이스에서 2만 1,500편을 추가로 분석했고, AI 탐지 정확도를 높이기 위해 150단어 미만 짧은 기사들은 제외했다. 매체별로 보면 신문이 AI 기사 증가 폭이 가장 컸고, 라디오도 눈에 띄게 늘었다. 방송과 TV는 상대적으로 적지만 여전히 증가세를 보였다.

Echoes of Automation The Increasing Use of LLMs in Newsmaking

AI는 첫 문단만 쓰고 나간다… 결론은 여전히 기자 몫

AI가 기사의 어느 부분을 맡는지 살펴보니 흥미로운 패턴이 드러났다. 기사 앞부분 40% 구간에서 AI 흔적이 가장 짙게 나타났고, 뒤로 갈수록 점점 옅어져서 마지막 20% 구간에서는 거의 사라졌다. 이는 기자들이 글을 시작할 때는 AI에 의존하지만, 마무리는 직접 한다는 뜻이다. AI는 아이디어를 짜내고 초안을 잡는 ‘도우미’ 역할에 머물고, 결론과 핵심 메시지는 여전히 기자가 담당한다는 얘기다.

연구팀은 오탐지를 줄이기 위해 3개 탐지기 중 최소 2개가 동의해야 AI 기사로 분류하는 까다로운 기준을 적용했다. 방송과 라디오에서 잡힌 일부 사례는 날씨 예보나 광고 같은 기계식 템플릿일 가능성도 있어서, 진짜 생성형 AI와는 구별해서 봐야 한다고 지적했다. 증가 시점은 2022년 4분기부터 시작해 2023년 말까지 계속 치솟았다.

AI 기사는 ‘말이 예쁘다’… 하지만 디테일이 아쉽다

AI가 쓴 기사와 기자가 쓴 기사를 언어학적으로 비교해보니 확실한 차이가 났다. 풍부도는 AI 기사가 인간 기자보다 훨씬 높았다. 특히 지역 언론사에서 그 차이가 더 벌어졌다. 가독성도 AI가 앞섰다. 하지만 단점도 뚜렷했다. 형식성 점수는 떨어졌고, 인물명이나 국적 같은 구체적인 정보도 적게 썼다. AI가 매끄럽지만 좀 가벼운 문체를 쓴다는 얘기다. 대신 형용사, 부사, 숫자 같은 꾸밈말은 훨씬 많이 넣어서 화려하고 설명적인 문장을 만들어냈다.

전치사, 한정사, 조동사 같은 기능어도 늘었고, 명사와 구두점 등 문장 구조 요소도 증가했다. 흥미롭게도 주관성, 감정 표현, 복잡도 면에서는 AI와 인간 기사 사이에 별 차이가 없었다. 대학 신문은 약간의 개선이 보였지만 통계적으로 의미 있는 수준은 아니었다.

FAQ

Q: AI가 생성한 뉴스 기사를 어떻게 구별할 수 있나요?

A: 일반인이 완벽하게 구별하기는 어렵습니다. 바이노큘러, GPT제로 같은 전문 탐지기를 써야 정확한 판별이 가능해요. 다만 지나치게 매끄럽거나 반복적인 표현, 구체적인 고유명사 부족 등으로 어느 정도 짐작할 수는 있습니다.

Q: AI 생성 뉴스 기사가 증가하는 것이 문제가 되나요?

A: AI 사용 자체보다는 투명성 부족이 문제입니다. 독자는 어떤 내용이 AI로 만들어졌는지 알 권리가 있고, AI의 오류나 편향이 그대로 보도될 위험도 있어서 명확한 공개 원칙이 필요합니다.

Q: 어떤 종류의 언론사에서 AI 사용이 가장 많이 늘었나요?

A: 지역 언론사와 대학 신문에서 가장 큰 폭으로 늘었습니다. 지역 언론사는 10배, 대학 신문은 8배 이상 증가했는데, 제한된 예산과 인력 때문에 AI 도구에 의존할 수밖에 없는 현실을 보여줍니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: Echoes of Automation: The Increasing Use of LLMs in Newsmaking

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.