• Home
  • AI Report
  • “이 그림, 사람이 그렸을까?” 눈으로는 구별 못해도 AI는 안다, AI 그림 탐지기술 정확도 98% 육박

“이 그림, 사람이 그렸을까?” 눈으로는 구별 못해도 AI는 안다, AI 그림 탐지기술 정확도 98% 육박

Detecting AI-generated Artwork
이미지 출처: 이디오그램 생성

Detecting AI-generated Artwork


생성형 AI 예술작품, 인간 예술가에게 미친 영향과 저작권 문제

생성형 인공지능(AI) 기술이 급속도로 발전하면서 AI가 만든 예술작품과 인간이 만든 예술작품을 구별하는 일이 점점 어려워지고 있다. 샌호세 주립대학교 컴퓨터 과학과의 메이언 리(Meien Li)와 마크 스탬프(Mark Stamp) 연구진이 발표한 논문에 따르면, 챗봇과 이미지 생성기 같은 대화형 AI 모델이 대중에게 널리 알려지면서 생성형 AI의 개념이 보편화되었다.

그러나 이러한 발전은 인간 예술가들에게 큰 우려를 낳고 있다. 인간이 만든 예술작품이 저작권자의 허락이나 보상 없이 AI 모델 훈련에 사용되고 있으며, 최근에는 X(구 트위터)와 같은 소셜 미디어 플랫폼들이 AI 모델 훈련을 위해 게시된 예술작품을 사용할 수 있도록 서비스 약관을 업데이트하기도 했다. 이러한 상황에서 AI 생성 예술작품을 탐지하는 새로운 접근 방식을 연구하는 것이 중요해졌다.

바로크, 큐비즘, 표현주의 3가지 스타일로 AI 탐지 연구 진행

이 연구에서는 다양한 유형의 기계학습(ML) 모델과 딥러닝(DL) 모델을 사용하여 인간이 만든 예술작품과 AI가 만든 예술작품을 구별할 수 있는 가능성을 탐색했다. 연구진은 구별하기 어려운 세 가지 예술 스타일인 바로크(baroque), 큐비즘(cubism), 표현주의(expressionism)에 초점을 맞추었다.

바로크는 “모양이 불규칙한 진주”에서 유래된 단어로, 현실과 허구의 혼합에 초점을 맞추고 색상, 빛, 그림자의 극적인 대비가 특징이다. 큐비즘은 전통적인 미학 개념을 깨는 실험적 예술의 한 예로, 관찰에서 요소를 추출하고 규칙적인 물체를 분해한 후 재배열하고 결합하는 특징을 가진다. 표현주의는 큐비즘과 마찬가지로 실험적 예술 스타일이지만, 자연을 왜곡하는 데 중점을 둔다.

연구팀은 로지스틱 회귀(Logistic Regression, LR), 서포트 벡터 머신(Support Vector Machine, SVM), 다층 퍼셉트론(Multilayer Perceptron, MLP), 그리고 합성곱 신경망(Convolutional Neural Network, CNN)이라는 네 가지 학습 모델을 테스트했다.

Detecting AI-generated Artwork



6,000개 이미지 샘플로 39개 특징 추출, 밝기·색상·질감·형태·노이즈 분석

연구에 사용된 데이터셋은 위키아트(WikiArt)와 AI-ArtBench를 결합하여 구성했다. 인간이 만든 예술의 예로는 바로크 스타일의 엘 그레코(El Greco)의 ‘라오콘(Laocoon)’, 큐비즘 스타일의 페르낭 레제(Fernand Léger)의 ‘세 여인(Three Women)’, 표현주의 스타일의 오스카 코코슈카(Oskar Kokoschka)의 ‘바람의 신부(The Bride of the Wind)’와 같은 작품들이 포함되었다.

AI 생성 작품은 바로크와 표현주의 스타일은 AI-ArtBench 잠재 확산(Latent Diffusion, LD) 데이터셋에서 가져왔으며, 큐비즘 스타일은 DeepAI 이미지 생성기로 만들었다. 각 카테고리별로 1,000개씩, 총 6,000개의 이미지 샘플이 연구에 활용되었다.

이미지 데이터셋에서는 총 39개의 특징을 추출했으며, 이 특징들은 밝기(brightness), 색상(color), 질감(texture), 형태(shape), 그리고 노이즈(noise)로 분류된다. 밝기 특징으로는 평균과 엔트로피를 사용했고, 색상 특징의 경우 RGB 및 HSV 히스토그램을 분석했다. 질감 특징을 정량화하기 위해 지역 이진 패턴(Local Binary Pattern, LBP)과 그레이 레벨 동시발생 행렬(Gray Level Co-Occurrence Matrix, GLCM)을 사용했다. 형태 특징으로는 방향 그래디언트 히스토그램(Histogram of Oriented Gradients, HOG)과 모서리 길이(edgelen)가 활용되었으며, 노이즈 특징으로는 노이즈의 엔트로피와 신호 대 잡음비(Signal to Noise Ratio, SNR)를 고려했다.

SVM 모델 정확도 97.92%, 인간 예술보다 AI 예술 감지에 더 효과적

연구진은 이진 분류(인간 생성과 AI 생성 예술 구별)와 다중 클래스 분류(데이터셋의 여섯 클래스 구별)를 모두 수행했다. 모든 특징을 사용한 로지스틱 회귀(LR) 모델은 이진 분류에서 92.75%, 다중 클래스에서 77.25%의 정확도를 달성했다. 서포트 벡터 머신(SVM) 모델은 이진 분류에서 97.42%, 다중 클래스에서 80.41%의 정확도를 보였다. 다층 퍼셉트론(MLP) 모델은 이진 분류에서 97.58%, 다중 클래스에서 81.25%의 정확도를 달성했다.

재귀적 특징 제거(Recursive Feature Elimination, RFE) 기법을 적용한 후, SVM 모델은 33개 특징을 사용하여 이진 분류에서 가장 높은 97.92%의 정확도를 달성했다. 다중 클래스 분류에서는 MLP 모델이 34개 특징으로 82.08%의 가장 높은 정확도를 기록했다.

혼동 행렬(confusion matrix) 분석 결과, 모든 모델에서 인간이 만든 클래스들 간의 구별이 주요 오류 소스로 나타났다. 흥미롭게도 AI 생성 샘플은 인간이 만든 예술과 구별하기 상대적으로 쉬운 것으로 나타났으며, 다른 스타일의 AI 생성 예술 간의 구별도 비교적 용이했다.

AI 예술 탐지 기술의 향후 전망과 한계점

연구 결과, 학습 모델이 인간이 만든 예술작품과 AI가 만든 예술작품을 구별하는 데 매우 효과적이라는 것이 명확하게 드러났다. 이진 분류에서 97% 이상의 정확도를 달성했으며, 더 어려운 다중 클래스 분류에서도 82% 이상의 정확도를 보였다.

그러나 인간이 만든 예술의 스타일을 구별하는 데는 상대적으로 덜 효과적이라는 한계점도 드러났다. 이는 생성형 AI 모델의 품질이 사람들이 인간이 만든 작품과 AI가 만든 작품을 육안으로 구별하기 어려울 정도로 향상되었음에도 불구하고, 기계학습 모델은 여전히 높은 정확도로 그 차이를 감지할 수 있다는 점을 시사한다.

FAQ

Q: 생성형 AI란 무엇이며 어떻게 예술 작품을 만드나요?
A: 생성형 AI는 새로운 콘텐츠를 창작할 수 있는 인공지능 기술입니다. 예술 작품의 경우, DALL-E나 Stable Diffusion과 같은 모델이 텍스트 설명만으로 이미지를 생성합니다. 사용자가 ‘프롬프트 아티스트’가 되어 원하는 예술의 간단한 텍스트 설명을 입력하면 AI가 그에 맞는 작품을 만들어냅니다.

Q: AI 생성 예술작품과 관련된 주요 윤리적 문제는 무엇인가요?
A: 가장 큰 문제는 저작권과 소유권입니다. AI 모델 훈련에 사용된 인간 예술가의 작품에 대한 허락이나 보상 없이 사용되는 점이 논란이 되고 있습니다. 또한 AI가 생성한 작품의 소유권이 AI 모델, 모델 설계자, 모델 사용자, 또는 훈련에 사용된 작품의 예술가에게 있는지 여부도 논쟁거리입니다.

Q: 인간과 AI 예술 작품을 구별하는 기술이 왜 중요한가요?
A: 최근 생성형 AI의 발전으로 AI 생성 예술의 품질이 크게 향상되어 사람들이 인간이 만든 작품과 AI가 만든 작품을 구별하기 어려워졌습니다. 이는 예술 시장의 진정성, 저작권 보호, 예술가의 노동 가치 인정 등에 영향을 미치므로, 구별 기술 개발이 예술 생태계 보호에 중요합니다.

해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

이미지 출처: 이디오그램 생성

기사는 클로드와 챗GPT를 활용해 작성되었습니다. 




“이 그림, 사람이 그렸을까?” 눈으로는 구별 못해도 AI는 안다, AI 그림 탐지기술 정확도 98% 육박 – AI 매터스