Search

알츠하이머 진단의 정확도 높이는 생성형 AI, 통계적 검증으로 신뢰성 입증

Statistical Testing on Generative AI Anomaly Detection Tools in Alzheimer's Disease Diagnosis
이미지출처: 이디오그램

Statistical Testing on Generative AI Anomaly Detection Tools in Alzheimer’s Disease Diagnosis

알츠하이머 진단을 위한 생성형 AI 도구 개발

알츠하이머 질환의 조기 진단이 어려운 이유는 질병의 메커니즘에 대한 이해가 제한적이고, 환자마다 증상과 진행 양상이 매우 다양하게 나타나기 때문이다. 캘리포니아 로스앤젤레스 대학(UCLA)과 나고야대학 공동 연구팀은 생성형 AI를 활용해 알츠하이머 환자의 뇌 MRI 영상에서 나타나는 이상 징후를 탐지하는 새로운 방법을 개발했다.

연구팀은 시간 경과에 따른 MRI 영상의 변화를 추적함으로써 뇌 조직의 퇴행성 변화를 분석했다. 의료 영상 분야에서 생성형 AI는 이상 징후 탐지와 질병 분류 작업에 활용되어 왔다. 그러나 이러한 데이터 기반 방식의 신뢰성을 검증하는 것은 쉽지 않은 과제였다. 특히 ‘double dipping’이라 불리는 문제, 즉 동일한 데이터셋으로 가설을 설정하고 검증하는 과정에서 발생하는 통계적 편향이 존재했다.

체계적인 데이터 수집과 전처리 과정

연구팀은 알츠하이머병 신경영상 계획(ADNI)의 1, 2, 3차 연구와 개방형 영상 연구(OASIS-3) 데이터베이스에서 최소 1년 이상의 간격으로 2회 이상 뇌 MRI 촬영을 한 환자들의 데이터를 수집했다. 환자들은 인지기능에 따라 세부적으로 분류됐다. ADNI는 정상, 주관적 기억 장애, 초기 경도인지장애, 경도인지장애, 후기 경도인지장애, 알츠하이머로 구분했고, OASIS는 정상, 인지장애, 알츠하이머로 분류했다. 연구의 일관성을 위해 두 데이터베이스의 분류 체계를 통합했으며, 최종적으로 정상인 888명과 알츠하이머 환자 110명의 데이터가 분석에 사용됐다.

혁신적인 분석 방법론과 모델 구조

연구팀은 조건부 변분 오토인코더(CVAE)를 활용했다. CVAE는 고차원 데이터의 특징을 저차원 공간에서 표현하고 학습할 수 있는 심층학습 모델이다. 연구팀은 정상인의 MRI 데이터로만 모델을 학습시킨 뒤, 알츠하이머 환자의 MRI에서 나타나는 비정상적인 패턴을 탐지하는 방식을 채택했다.

알츠하이머병 신경영상 계획(ADNI)과 개방형 영상 연구(OASIS) 데이터베이스에서 수집한 총 998명(정상인 888명, 알츠하이머 환자 110명)의 MRI 데이터가 분석에 사용됐다. 각 환자당 최소 1년 이상의 간격으로 촬영된 2개의 MRI 영상을 비교했으며, 시간에 따른 뇌 조직의 변화는 광학 흐름 추정(optical flow estimation) 기법으로 분석했다.

선택적 추론을 통한 통계적 검증

기존의 통계적 검증 방식으로는 AI 모델의 신뢰성을 정확하게 평가하기 어려웠다. 전통적인 통계 검정은 가설이 데이터와 독립적으로 설정되어 있다는 가정에 기반한다. 그러나 AI 모델의 경우 같은 데이터셋으로 학습과 검증을 수행하기 때문에 이러한 가정이 성립하지 않았다.

연구팀은 이를 해결하기 위해 ‘선택적 추론(Selective Inference)’ 기법을 도입했다. 분석 결과, 선택적 추론은 기존의 단순 통계 검정이나 본페로니 교정(Bonferroni correction)보다 우수한 성능을 보였다. 선택적 추론은 설정한 유의수준(α)에 맞춰 오탐지율을 효과적으로 통제했으며, 본페로니 교정에 비해 실제 이상 징후 탐지 능력도 더 높았다.

향후 과제

이번 연구는 하나의 데이터셋으로 AI 모델의 신뢰성을 정량적으로 평가할 수 있는 방법론을 제시했다. 그러나 임상 현장 도입을 위해서는 몇 가지 과제가 남아있다. 현재 모델은 계산 자원의 한계로 3차원 MRI 영상 중 2차원 단면만을 분석하고 있다. 또한 광학 흐름 추정 기법이 장기간의 변화 추적에 최적화되어 있지 않아, 더 효과적인 영상 비교 방법이 필요하다. AI 모델의 탐지력(power) 개선을 위해 데이터 전처리 방식과 모델 파라미터의 최적화도 필요하다.

연구팀은 “이번 연구가 신뢰할 수 있는 AI 기반 임상 진료 시스템 개발을 위한 시발점이 되기를 희망한다”며, “앞으로 3차원 영상 분석 기능 추가와 더 많은 임상 데이터를 통한 검증을 진행할 계획”이라고 밝혔다.

기사에 인용된 리포트 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




알츠하이머 진단의 정확도 높이는 생성형 AI, 통계적 검증으로 신뢰성 입증 – AI 매터스 l AI Matters