자율주행차가 안개 낀 도로에서 멈춰 서고, 드론이 흐린 날씨에 추락하는 이유가 밝혀졌다. 현재 AI 기술의 가장 큰 약점인 ‘시각적 강건성’ 문제를 해결하기 위해 캘리포니아대학교 연구팀은 실제 쥐의 뇌 활동을 분석해 AI의 시각 인식 능력을 평가하는 새로운 방법을 개발했다. 이는 AI가 현실 세계의 다양한 환경 변화에 적응할 수 있는 핵심 기술 개발로 이어질 수 있어 주목받고 있다.
자율주행차도 못 푸는 안개 속 길 찾기, 쥐는 금세 해결한다
현재 AI 시각 시스템은 깨끗한 환경에서 훈련받으면 그런 상황에서만 잘 작동한다. 하지만 안개가 끼거나 조명이 바뀌고 주변에 방해물이 생기면 제대로 작동하지 않는다. 이 때문에 자율주행차, 드론, 집안 로봇 같은 기계들이 실제 환경에서 사용하기 어렵다.
반면 쥐 같은 동물들은 시각적으로 어려운 상황에서도 잘 적응한다. 쥐는 조금만 경험해봐도 시야가 나쁜 상황에서 복잡한 곳을 돌아다니며 눈으로 목표를 찾아갈 수 있다. 흥미로운 점은 쥐의 눈이 최신 카메라보다 화질이 떨어진다는 것이다. 그런데도 쥐가 더 잘하는 이유는 뇌에서 시각 정보를 처리하는 방식이 다르기 때문이다. 쥐의 뇌는 변화에도 흔들리지 않고 일관된 판단을 내리는 특별한 처리 방법을 사용한다.
쥐 뇌 속 1만 9천 개 뉴런이 밝혀낸 AI의 치명적 약점
이번 연구의 핵심은 실제 쥐가 게임하는 동안 뇌 속에서 일어나는 일을 자세히 기록한 것이다. 연구진은 쥐의 머리를 고정하고 가상현실 화면을 보여주면서 목표물을 찾아가는 게임을 시키면서, 특수 현미경을 사용해 뇌의 시각 담당 부위에서 뉴런들이 어떻게 활동하는지 실시간으로 관찰했다.
검증용 데이터는 쥐 3마리에서 총 1만 9,746개 뉴런의 활동을 담고 있다. 실제 테스트용으로는 8개 시각 뇌 영역에서 5만 개가 넘는 뉴런을 기록한 추가 실험 데이터도 준비했다. 기존 연구들이 쥐에게 단순히 영상만 보여주며 뇌 활동을 기록한 것과 달리, 이번에는 쥐가 실제로 움직이고 판단하면서 목표를 달성하는 상황에서 데이터를 모았다. 이렇게 하면 눈으로 본 정보가 실제 행동과 목표 달성으로 어떻게 연결되는지 분석할 수 있다.

성공률 70% 쥐 vs 실패하는 AI, 두 가지 기준으로 정면 대결
연구진은 AI를 두 가지 방법으로 평가한다. 첫 번째는 ‘강건성’ 테스트다. AI는 정상 환경과 안개 환경에서 훈련받은 후, 5가지 다른 시각 환경(정상, 안개, 그리고 미리 공개하지 않은 3가지 방해 상황)에서 각각 500번씩 게임을 한다. 점수는 모든 환경에서의 평균 성공률과 가장 어려운 환경에서의 성공률을 반반씩 합쳐서 매긴다.
두 번째는 ‘뇌 활동 유사성’ 테스트다. AI가 게임을 배운 후, 쥐가 실제 게임을 할 때 본 화면을 AI에게도 보여준다. 그때 AI 내부에서 일어나는 반응을 추출해서 실제 쥐의 뇌 활동과 얼마나 비슷한지 비교한다. 수학적 계산을 통해 AI의 반응으로 쥐의 뇌 활동을 예측해보고, 예측값과 실제값이 얼마나 일치하는지 측정해서 점수를 매긴다.
무료 공개된 실험 환경
연구진은 다른 연구자들도 쉽게 참여할 수 있도록 필요한 도구들을 모두 무료로 공개했다. Unity라는 게임 엔진으로 만든 실험 환경, 이미 훈련된 AI 프로그램들, 쥐의 행동과 뇌 활동 데이터를 분석하는 도구들, 그리고 처음부터 끝까지 실험을 따라 할 수 있는 가이드까지 모두 포함되어 있다.
제공되는 AI 프로그램들은 간단한 것부터 복잡한 것까지 다양하다. 단순한 연결형, 3층짜리 시각 인식 네트워크, ResNet-18이라는 유명한 구조, 그리고 이전에 쥐의 뇌 활동을 잘 예측했던 특별한 구조까지 있다. 실험에 참여한 쥐들은 평균 13번의 훈련을 통해 게임을 배웠고, 잘 훈련된 쥐들은 200-300번의 시도 중 70% 이상 성공했다. 한 번의 실험은 약 20분 정도 지속되었다.
생체 모방형 AI 연구, 현실 환경 적용을 위한 새로운 평가 기준 제시
이번 연구의 핵심 가치는 AI의 시각적 강건성을 평가하는 새로운 방법론을 제시했다는 점이다. 기존 ImageNet 같은 정적 데이터셋 기반 평가와 달리, 실제 행동 맥락에서 환경 변화에 대한 적응력을 측정할 수 있는 기준을 만들었다.
특히 연구진이 모든 실험 도구를 오픈소스로 공개한 점은 주목할 만하다. Unity 환경부터 평가 도구까지 무료로 제공함으로써 전 세계 연구자들이 동일한 기준으로 AI 모델의 강건성을 비교 검증할 수 있는 토대를 마련했다.
다만 이 벤치마크가 실제 산업 현장의 AI 시스템 개발에 직접적으로 적용되기까지는 추가 연구가 필요할 것으로 보인다. 쥐의 뇌 활동 데이터와의 유사성이 곧 실용적 성능 향상을 보장하지는 않기 때문이다. 하지만 생물학적 시각 처리 원리를 AI 개발에 접목하려는 시도 자체는 현재 AI 시스템의 한계를 극복하는 중요한 연구 방향을 제시한다고 볼 수 있다.
FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q: 왜 하필 쥐를 AI와 비교하나요?
A: 쥐는 시야가 나빠져도 조금만 경험하면 빠르게 적응해서 목표를 잘 찾아갑니다. 현재 AI는 깨끗한 환경에서는 잘 작동하지만 현실의 변화에 약합니다. 쥐의 뇌가 변화에 흔들리지 않고 일관된 판단을 내리는 방법을 이해하면, 더 튼튼한 AI를 만드는 데 중요한 힌트를 얻을 수 있습니다.
Q: 뇌 활동 유사성은 어떻게 측정하나요?
A: AI가 게임을 배운 후, 쥐가 실제 게임할 때 본 화면을 AI에게도 보여줍니다. 그때 AI 내부에서 일어나는 반응을 뽑아내서, 수학적 계산을 통해 이 반응으로 실제 쥐의 뇌 활동을 예측해봅니다. 예측한 값과 실제 쥐의 뇌 활동이 얼마나 일치하는지 숫자로 계산해서 AI가 쥐의 뇌와 얼마나 비슷하게 작동하는지 알아봅니다.
Q: 이 연구가 실제 생활에 어떤 도움이 되나요?
A: 자율주행차가 안개 낀 도로에서도 안전하게 운전하고, 드론이 흐린 날씨에도 추락하지 않으며, 집안 로봇이 조명이 바뀌어도 제대로 작동할 수 있게 하는 AI 기술 개발에 도움이 됩니다. 특히 동물의 뇌를 참고해서 현실 변화에 더 잘 적응하는 AI 시스템을 만드는 새로운 방향을 제시합니다.
해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.
논문명: Mouse vs. AI: A Neuroethological Benchmark for Visual Robustness and Neural Alignment
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.