• Home
  • AI Report
  • “당신의 4년 후 건강 상태를 알려드립니다” … AI가 혈당 패턴으로 건강 예측한다

“당신의 4년 후 건강 상태를 알려드립니다” … AI가 혈당 패턴으로 건강 예측한다

Generating Physically-Consistent Satellite Imagery for Climate Visualizations
이미지출처: 엔비디아 블로그

From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis

자기지도학습 기반의 혁신적 의료 AI 모델

최근 자기지도학습(Self-supervised Learning) 기술의 발전으로 기초 모델(Foundation Model)이라 불리는 새로운 의료 AI 모델이 등장하고 있다. 와이즈만 과학연구소와 엔비디아(NVIDIA) 연구진이 개발한 ‘글루포머(GluFormer)’는 연속혈당측정(CGM) 데이터를 분석하여 다양한 건강 지표를 예측하는 생성형 기초 모델이다.

트랜스포머(Transformer) 아키텍처를 기반으로 한 이 모델은 1만 812명의 비당뇨병 환자로부터 수집한 1,000만 건 이상의 혈당 측정 데이터로 학습되었다.

당뇨병 관리의 새로운 전환점

2021년 기준 전 세계 당뇨병 환자는 5억 명을 넘어섰으며, 연간 의료비 지출이 9,000억 달러를 상회한다. 당뇨병은 심혈관 질환, 간 질환, 폐 질환, 암, 만성 신장 질환, 정신 건강 문제 등 다양한 합병증의 주요 위험 요인이다. 이러한 상황에서 CGM은 전통적인 자가 혈당 측정(SMBG)보다 우수한 혈당 관리와 저혈당 예방, 삶의 질 개선 효과를 보여주고 있다. 최근 미국 FDA가 비당뇨병 환자용 일반의약품 CGM 기기를 승인하면서 그 활용 범위가 더욱 확대될 전망이다.

15개 외부 데이터셋에서 검증된 우수한 성능

글루포머는 5개 국가에서 6종류의 CGM 기기를 통해 수집된 15개의 외부 데이터셋에서 뛰어난 일반화 능력을 보였다. 정상 혈당, 당뇨병 전단계, 당뇨병, 임신성 당뇨병, 비만 등 다양한 대사 질환을 가진 4,936명의 데이터를 성공적으로 분석했다. 기존 CGM 분석 도구보다 우수한 성능으로 HbA1c, 간 관련 지표, 혈중 지질, 수면 관련 지표 등 다양한 임상 지표와의 높은 상관관계를 보여주었다.

글루포머는 1,024차원의 공간에서 CGM 샘플을 임베딩하는 방식을 사용한다. 또한 다중모달 버전을 통해 시간 정보와 식이 데이터를 효과적으로 통합하여 분석한다. 미국당뇨병학회(ADA)와 유럽당뇨병학회(EASD)가 임상시험에서 CGM 기반 지표 사용을 권장하는 상황에서, 이러한 기술적 혁신은 더욱 의미가 크다.

미래 건강 상태 예측과 임상시험 결과 예측

글루포머의 가장 주목할 만한 특징은 최대 4년 후의 건강 상태까지 예측할 수 있다는 점이다. 또한 임상시험에서 중재 전 CGM 데이터만으로도 일차 및 이차 결과를 예측하는 데 성공했다. 이는 임상시험 설계와 환자 선별 과정의 효율성을 크게 높일 수 있는 가능성을 보여준다.

식이 데이터 통합으로 한층 강화된 예측 능력

연구팀은 글루포머에 식이 데이터를 추가로 통합하여 모델의 성능을 더욱 향상시켰다. 이를 통해 다음과 같은 세 가지 주요한 기능을 구현했다. 먼저, 식이 섭취 데이터만으로도 CGM 데이터를 정확히 생성했다. 두 번 째로는 식이 중재의 결과를 시뮬레이션 하는 데 성공했다. 마지막으로, 특정 음식에 대한 개인별 반응을 예측했다.

글루포머는 단순한 혈당 분석을 넘어 전반적인 건강 상태를 모니터링하고 예측하는 포괄적인 도구로서의 가능성을 보여준다. 특히 CGM 데이터가 전반적인 건강 상태를 반영하는 고유한 정보를 담고 있다는 점이 확인되었다. 이는 IL-6와 같은 염증 지표와 CGM 파라미터 간의 관계를 보여준 이전 연구 결과와도 일치한다.

모델의 한계와 향후 과제

연구진은 다음과 같은 글루포머의 한계점도 함께 제시했다. 주로 건강한 비당뇨병 환자 데이터로 학습되었기 때문에 희귀 대사질환 환자에 대한 일반화 능력 검증 필요하다는 점과 자가 보고된 식이 기록의 부정확성이 예측 정확도에 영향을 미칠 수 있다는 점이 이번 연구의 한계로 지적됐다. 또한, 각 음식의 영양소 함량 정량화 과정이 복잡하고 시간이 많이 소요된다는 점과 트랜스포머 모델의 특성상 해석이 어려운 ‘블랙박스’ 문제 존재 역시 한계로 제시되었다.

그럼에도 이번 연구는 CGM 데이터 분석을 통해 개인 맞춤형 대사질환 관리와 조기 질병 감지의 새로운 가능성을 제시했다는 점에서 큰 의의가 있다. 특히 정밀 의료와 약물 개발 분야에서 혁신적인 변화를 가져올 것으로 기대된다.

기사에 인용된 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




“당신의 4년 후 건강 상태를 알려드립니다” … AI가 혈당 패턴으로 건강 예측한다 – AI 매터스