• Home
  • AI Economy-Health
  • 말라리아 치료도 AI로… 전문가 없이도 99.5% 정확도로 종 구분 가능

말라리아 치료도 AI로… 전문가 없이도 99.5% 정확도로 종 구분 가능

Deep learning-based malaria parasite detection: convolutional neural networks model for accurate species identification of Plasmodium falciparum and Plasmodium vivax
이미지 출처: Deep learning-based malaria parasite detection: convolutional neural networks model for accurate species identification of Plasmodium falciparum and Plasmodium vivax

Deep learning-based malaria parasite detection: convolutional neural networks model for accurate species identification of Plasmodium falciparum and Plasmodium vivax


말라리아 진단의 혁신, 99.51% 정확도로 전문가 없이도 기생충 종 구분 가능해지다

말라리아는 전 세계적으로 여전히 중요한 공중보건 문제로 남아있다. 2023년 기준 83개 말라리아 풍토병 국가에서 약 2억 6,300만 건의 감염 사례가 발생했으며, 약 597,000명이 사망한 것으로 추산된다. 아프리카 지역이 2억 4,600만 건으로 가장 높은 감염률을 보였고, 동지중해 지역과 동남아시아가 각각 1,000만 건과 400만 건으로 뒤를 이었다.

말라리아 치료를 위해서는 정확한 진단이 필수적인데, 특히 말라리아 기생충 종(Plasmodium species)을 정확히 식별하는 것이 중요하다. 현재까지 표준 진단법은 현미경 검사법이지만, 이 방법은 훈련된 전문 인력이 필요하며 인적 오류 가능성이 높다는 한계가 있다. 베네수엘라 카라카스의 메트로폴리탄 대학교와 시몬 볼리바르 대학교, 중앙대학교 공동 연구진은 이러한 문제를 해결하기 위해 딥러닝 기술, 특히 합성곱 신경망(CNN)을 활용한 말라리아 진단 모델을 개발해 논문을 발표했다.

베네수엘라 공동 연구진이 개발한 CNN 모델은 두꺼운 혈액 도말(thick blood smear)에서 플라스모디움 팔시파룸(P. falciparum), 플라스모디움 비박스(P. vivax) 감염 세포와 비감염 백혈구를 분류할 수 있다. 이 모델은 7채널 입력을 활용해 12,954건 중 12,876건을 정확히 예측했다. 교차 검증 시 5회 반복에서 64,126건 중 63,654건의 정확한 예측을 달성했으며, 정확도 99.51%, 정밀도 99.26%, 재현율 99.26%, 특이도 99.63%, F1 점수 99.26%, 손실률 2.3%라는 뛰어난 성능을 보였다.

7채널 입력 CNN 모델, 12,954건 중 12,876건 정확히 예측하는 획기적 성능 달성

기존의 인공지능 기반 말라리아 진단 모델은 대부분 말라리아 기생충의 존재 여부만 판별하는 이진 분류에 집중했으며, 종 구분에는 어려움을 겪었다. 또한 대부분의 연구가 얇은 혈액 도말(thin smear)을 사용했으나, 이번 연구팀은 두꺼운 혈액 도말에서 직접 종을 구분하는 방식을 택했다.

두꺼운 혈액 도말은 임상 현장에서 말라리아 감염 여부를 확인하는 데 주로 사용되지만, 세포 구조가 명확하지 않아 종 구분이 어렵다는 한계가 있다. 이 연구는 백혈구와 함께 발견되는 기생충을 직접 분석함으로써 이러한 한계를 극복했다. 이는 실제 임상 환경에서 사용되는 검사 방식과 일치하는 방법으로, 현장 적용성이 높은 접근법이다.

연구팀은 현미경 이미지에서 노이즈 제거, 백색 노이즈 기법 적용, 숨겨진 특징 강화, 캐니 에지 감지 알고리즘 등 다양한 이미지 전처리 기술을 적용해 모델의 성능을 향상시켰다. 이러한 전처리 기술들이 점진적으로 추가될수록 모델의 성능이 향상되는 것이 확인되었다.

Deep learning-based malaria parasite detection convolutional neural networks model for accurate species identification of Plasmodium falciparum and Plasmodium vivax


얇은 도말 대신 두꺼운 도말 분석으로 99.71% 특이도 달성한 임상 친화적 접근법

연구팀이 개발한 모델은 Windows 10 64비트, Intel Core i7-10700K CPU, 930GB SSD, 32GB RAM, Nvidia GeForce RTX 3060 GPU가 장착된 시스템에서 개발되었다. 데이터셋은 치타공 의과대학 병원(Chittagong Medical College Hospital)에서 수집한 5,941개의 두꺼운 혈액 도말 이미지를 처리하여 190,399개의 개별 라벨링된 이미지를 얻었다.

CNN 모델은 최대 10개의 주요 레이어를 포함하며, 잔차 연결(residual connections)과 드롭아웃(dropout)과 같은 미세 조정 기술을 통해 모델의 안정성과 정확도를 향상시켰다. 배치 크기 256, 20 에포크(epochs), 학습률 0.0005, Adam 옵티마이저와 교차 엔트로피 손실 함수를 사용했다. 데이터는 훈련 80%, 검증 10%, 테스트 10%로 분할되었으며, K-폴드 교차 검증 방식으로 모델의 일반화 능력을 평가했다.

특히 주목할 만한 점은 모델의 입력 텐서에 이미지 전처리 기술들이 적용된 추가 채널을 포함시켰다는 것이다. 일반적인 RGB 3채널에서 시작해 대비, 채도, 선명도 필터를 적용한 3채널을 추가하고, 캐니 에지 감지 알고리즘을 통한 1채널을 더해 총 7채널 입력 텐서를 구성했다. 이러한 다채널 접근법은 모델이 더 풍부한 특징을 추출할 수 있게 하여 성능을 크게 향상시켰다.

고성능 딥러닝 모델, 기생충 종별 P. falciparum 99.3%, P. vivax 98.29% 정확도 기록

연구팀은 개발한 모델의 효과를 평가하기 위해 기존의 말라리아 탐지용 최첨단 AI 접근법과 비교했다. 라자라만(Rajaraman) 등은 InceptionResNet-V2 아키텍처를 사용하여 99.51%의 정확도를 달성했으며, 무자히드(Mujahid) 등은 EfficientNet-B2로 97.57%의 정확도를 보고했다. 그러나 임상 환경에서 중요한 지표인 특이도는 많은 연구에서 누락되어 있었다.

푸하드(Fuhad) 등은 얇은 도말을 사용하여 99.17%의 특이도를 달성했지만, 이번 연구팀의 모델은 두꺼운 도말만으로 99.71%의 특이도를 달성했다. 이는 임상적으로 더 복잡한 작업인 두꺼운 도말에서의 다중 분류를 수행하면서도 기존 연구들과 비슷하거나 더 높은 성능을 보여주는 것이다.

이 모델은 종별 정확도에서도 인상적인 결과를 보였는데, P. falciparum에 대해 99.3%, P. vivax에 대해 98.29%, 비감염 세포에 대해 99.92%의 정확도를 달성했다. 이는 전문 현미경 검사자의 정확도에 필적하거나 그 이상의 성능을 보여주는 것이다.

모바일 기기용 경량 애플리케이션 개발로 자원 제한 지역에서도 사용 가능

이 연구의 데이터셋은 특정 지역을 반영하므로, 다른 종류의 기생충이 우세한 지역이나 유병률이 다른 지역에 적용하기에는 제한이 있을 수 있다. 연구팀은 모델의 글로벌 적용성을 높이기 위해 P. ovale과 P. malariae와 같은 추가 종을 포함한 다양한 지리적 지역의 데이터셋을 사용하여 모델의 성능을 검증하는 것을 향후 과제로 삼고 있다.

또한 실제 임상 환경에서의 검증이 부족한 점도 한계로 지적됐다. 연구팀은 이 문제를 해결하기 위해 자신들의 지역에서 직접 수집한 이미지로 새로운 데이터셋을 만들고 있다. 이 새로운 데이터셋은 실제 조건에서 모델의 성능을 평가하고, 임상 워크플로우에 통합하며, 개선 가능한 영역을 식별하는 데 도움이 될 것이다.

연구팀은 궁극적으로 모바일 폰이나 기본 노트북과 같은 저전력 기기에서 작동할 수 있는 경량 애플리케이션에 사전 훈련된 모델을 통합하는 방안을 모색하고 있다. 이러한 애플리케이션은 자원이 제한된 지역에서 훈련된 현미경 검사자가 없는 경우에도 신속한 진단을 가능하게 할 것이다.

FAQ

Q: 딥러닝 기반 말라리아 진단 모델이 기존 현미경 검사와 비교하여 어떤 장점이 있나요?

A: 딥러닝 기반 모델은 훈련된 전문가가 부족한 지역에서도 사용 가능하며, 인적 오류 가능성을 줄이고 일관된 결과를 제공합니다. 특히 이번 연구에서 개발된 모델은 99.5% 이상의 정확도로 말라리아 기생충 종까지 구분할 수 있어 적절한 치료 선택에 도움을 줍니다.

Q: 두꺼운 혈액 도말과 얇은 혈액 도말의 차이점은 무엇인가요?

A: 두꺼운 혈액 도말은 말라리아 감염 여부를 확인하는 데 주로 사용되며, 적혈구가 용해되어 기생충이 더 집중된 상태로 관찰됩니다. 얇은 혈액 도말은 기생충 종을 식별하는 데 사용되며 적혈구 형태가 보존됩니다. 이번 연구의 혁신점은 종 식별이 어려운 두꺼운 도말에서도 높은 정확도로 기생충 종을 구분했다는 점입니다.

Q: 이 기술이 실제 현장에서 사용되기까지 어떤 과제가 남아있나요?

A: 다양한 지역에서 수집된 데이터로 모델을 검증하고, 실제 임상 환경에서 테스트하는 과정이 필요합니다. 또한 사용자 친화적인 인터페이스 개발과 저전력 기기에서 작동할 수 있는 경량화 작업이 필요합니다. 연구팀은 현재 스마트폰으로 현미경에서 직접 촬영한 이미지를 업로드하여 분석할 수 있는 시스템을 개발 중입니다.

해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

이미지 출처: Deep learning-based malaria parasite detection: convolutional neural networks model for accurate species identification of Plasmodium falciparum and Plasmodium vivax

기사는 클로드와 챗GPT를 활용해 작성되었습니다. 




말라리아 치료도 AI로… 전문가 없이도 99.5% 정확도로 종 구분 가능 – AI 매터스