Search

‘I’m not a robot’, 캡차와 AI의 창과 방패 싸움

Image

출처: 직접 캡쳐

미국 데이튼대학(University of Dayton) 컴퓨터 사이언스 전공의 탐 응옌(Tam Nguyen) 교수는 웹사이트에 로그인 할 때 사용자가 봇이 아닌 실제 인간임을 증명하는 데 사용되고 있는 캡차(CAPTCHA)가 새로운 도전에 직면했다고 더컨버세이션(The Conversation) 을 통해 설명했다.

웹사이트와 모바일 앱은 오랫동안 대규모 봇 공격에 시달려 왔다. 이러한 악의적인 봇들은 자동으로 대량의 컴퓨팅 자원을 소비하고, 스팸 메시지를 게시하며, 웹사이트에서 데이터를 수집하고 심지어 사용자 인증을 수행하도록 프로그래밍이 되어 있다. 이러한 상황으로 인해 캡차가 도입되었다. 캡차는 ‘컴퓨터와 인간을 구별하기 위한 완전히 자동화된 공개 튜링 테스트'(Completely Automated Public Turing test to tell Computers and Humans Apart)의 약자다.

캡차는 웹사이트가 자동화된 공격을 방지하고, 사이버 보안을 강화하며, 사용자 경험을 개선하는 효과적인 방패다. 예를 들어, 서비스 거부 공격은 병목 현상을 만들어 웹 서버가 과부하 되게 만든다. 캡차는 자동화된 봇의 서비스 거부 공격하는 것을 막고, 스팸 메시지 전송이나 가짜 계정 생성과 같은 부정행위를 방지한다.

금융 기관들은 고객 데이터를 훔치려는 봇으로부터 사이트를 보호하기 위해서 캡차에 의존할 수 밖에 없다. CAPTCHA는 또한 온라인 투표와 여론 조사의 신뢰성을 높이는 데도 활용된다. 자동화된 봇이 결과를 조작하는 것을 막아 투표의 무결성을 보장하는 역할을 하는 것이다.

CAPTCHA의 역사. 출처: www.youtube.com/@Vox 

캡차의 작동 원리

캡차는 사람은 쉽게 풀 수 있지만 컴퓨터 프로그램은 해결하기 어려운 문제를 제시하도록 만들어졌다. 캡차의 유형에는 텍스트 기반, 이미지 기반, 오디오 기반, 행동 기반 등 여러 유형이 있는데, 각각의 특징과 한계점이 있다.

텍스트 기반 캡차는 인터넷 초창기부터 사용되어왔다. 이 유형의 캡차는 사용자에게 왜곡되고 복잡한 텍스트 이미지를 읽고 그 답을 입력창에 쓰도록 하며, “18+5″나 “23-7” 같은 간단한 수학 문제를 푸는 방식도 있다. 그러나 최근 딥러닝 AI의 확산으로 광학 문자 인식(OCR) 알고리즘 성능이 향상되면서 이런 캡차가 쉽게 뚫리는 일이 많아졌다. 문제는 봇이 읽지 못하게 텍스트를 더 복잡하게 만들면, 오히려 실제 사람들도 정답을 알아보기 어려워진다는 점이다.

오디오 캡차는 사람이나 기계가 말하는 숫자나 글자를 짧게 들려주고, 사용자는 이 소리를 듣고 들은 내용을 입력창에 적는다. 입력한 답이 맞는지 확인해서 사용자가 진짜 사람인지 판단하는데, 글자를 보여주는 캡차처럼 오디오 캡차도 문제가 있다. 배경 잡음이 섞이거나, 음질이 나쁘거나, 소리가 많이 찌그러지거나, 발음이 이상하면 사람도 알아듣기 힘들 수 있다.

이미지 캡차는 봇이 더 어렵게 풀도록 만들어졌으며, 사용자는 이미지에서 특정 물체를 찾아야 한다. 예를 들어 여러 사진 중에서 신호등이 있는 사진만 고르는 식인데, 이런 방식은 대부분의 컴퓨터 프로그램보다 사람의 눈이 아직 더 뛰어나다는 점을 이용한 것이다. 하지만 이런 종류의 캡차도 많은 경우에 사람들을 헷갈리게 한다.

행동 캡차는 사용자가 마우스를 움직이거나 키보드를 치는 방식을 살펴본다. 많이 쓰이는 행동 캡차인 리캡차는 “나는 로봇이 아닙니다”라는 상자에 체크하라고 하는데, 이때 리캡차는 마우스 움직임과 클릭하는 방식을 분석해서 사람인지 봇인지 구분한다. 보통 사람은 행동이 다양하고 예측하기 어려운 반면, 봇은 대체로 정확하고 일정한 패턴으로 움직이는 특성을 이용한 것이다.

AI vs 인간

캡차는 AI와 인간 간의 지속적인 경쟁 영역 중 하나다. 최근 AI는 딥러닝과 컴퓨터 비전과 같은 최신 기술을 활용하여 캡차를 해독하고 있다. 예컨대, 문자 인식 기술의 발전으로 텍스트 기반 캡차의 효과가 크게 감소했으며, 음성 캡차 역시 발전된 음성 인식 기술로 인해 취약해질 수 있다. 마찬가지로, 방대한 이미지 데이터로 학습한 AI는 이미지 캡차를 높은 정확도로 해결할 수 있게 되었다.

한편, 캡차 개발자들은 더욱 정교한 기술을 개발하고 있다. 리캡차와 같은 시스템은 사용자의 행동 패턴을 분석하여 인간일 확률을 산출한다. 흥미롭게도, 인간들이 AI의 복잡한 캡차 해결을 간접적으로 돕고 있는 상황이다. 일례로, ‘클릭 농장'(Click farm)이라 불리는 곳에서는 저임금 노동자를 대규모로 고용하여 광고 클릭, SNS 팔로우, 허위 리뷰 작성, 심지어 캡차 해결까지 수행하게 한다. 이러한 활동들이 AI가 캡차와 기타 사기 방지 메커니즘을 우회하여 인간처럼 행동하는 데 기여하고 있다.

캡차의 미래

응옌 교수는 AI의 발전이 캡차의 미래를 크게 바꿀 것으로 전망했다. 그에 따르면, 기존 캡차의 효과가 점차 감소하고 있어 앞으로는 사람들이 웹사이트와 상호작용하는 방식 등 행동을 분석하는 데 초점을 맞출 가능성이 높다. 그는 이러한 접근 방식은 봇이 사람처럼 행동하기를 더욱 어렵게 만들 것이라고 설명했다.

웹사이트들은 얼굴이나 지문을 인식하는 생체 인식 캡차를 도입할 수도 있지만, 이는 개인정보 보호 문제를 야기할 수 있다고 지적했다. 대안으로, 캡차 대신 블록체인을 활용해 사용자를 확인하는 방법이나, 신뢰할 수 있는 기관에서 발급한 디지털 신분증을 스마트폰에 저장해 사용하는 방식도 제안했다. 이러한 방법들은 실제 사람이 접속한다는 것을 보다 확실히 보장할 수 있다고 덧붙였다.

미래의 캡차는 AI와 실시간으로 협력하며 지속적으로 변화하고 발전할 것으로 예상된다고 말했다. 이를 통해 캡차 기술이 자동화된 공격보다 항상 한 발 앞서 나갈 수 있을 것이라고 전망했다.

자세한 내용은 더컨버세이션에서 확인할 수 있다.




‘I’m not a robot’, 캡차와 AI의 창과 방패 싸움 – AI 매터스 l AI Matters