SkinEHDLF a hybrid deep learning approach for accurate skin cancer classification in complex systems
98.76% 정확도, 99.8% AUROC – 정확도 향상된 혁신적 AI 피부암 진단 모델
전 세계적으로 매년 수백만 건의 신규 사례가 보고되는 피부암은 가장 흔한 암 중 하나이다. 이런 피부암의 조기 발견과 정확한 진단은 환자의 생존율과 치료 효과를 크게 높일 수 있다. 사우디아라비아의 타이프 대학교 연구진이 발표한 연구 논문에 따르면, 연구진은 피부암 진단의 정확도를 혁신적으로 높인 하이브리드 딥러닝 모델 ‘스킨EHDLF(SkinEHDLF)’를 개발했다.
이 모델은 콘브넥스트(ConvNeXt), 에피션트넷V2(EfficientNetV2), 스윈 트랜스포머(Swin Transformer)와 같은 여러 첨단 모델의 장점을 결합하고, 적응형 주의 기반 특징 융합 메커니즘(adaptive attention-based feature fusion mechanism)을 통합해 획득한 특징의 합성을 향상시켰다. 스킨EHDLF는 3D 전신 사진에서 추출한 401,059개의 피부 병변 이미지로 구성된 ISIC 2024 데이터셋을 사용해 훈련 및 평가되었으며, 이 데이터셋은 흑색종(melanoma), 양성 병변(benign lesions), 비암성 피부 이상(noncancerous skin anomalies)의 세 가지 범주로 나뉘어 있다.
연구 결과에 따르면, 스킨EHDLF 모델은 이진 피부암 분류에서 99.8%의 AUROC와 98.76%의 정확도를, 다중 클래스 분류에서는 98.6%의 정확도, 97.9%의 정밀도, 97.3%의 재현율, 99.7%의 AUROC를 달성했다. 이는 기존의 유명 모델인 레스넷-50(ResNet-50), 에피션트넷-B3(EfficientNet-B3), 비트-B16(ViT-B16) 등을 크게 능가하는 성과이다.

악성-양성 병변 구분, 7.9% 정확도 향상과 28% 오탐지 감소 성과
피부암 진단은 여러 가지 어려움에 직면해 있다. 양성 및 악성 피부암의 시각적 유사성, 피부과 전문 지식에 대한 제한된 접근성, 피부 유형과 영상 조건에 따른 병변 외관의 높은 가변성, 그리고 기존 데이터셋의 불균형 등이 정확한 진단을 방해하는 주요 요인이다.
스킨EHDLF 모델은 이러한 문제를 해결하기 위해 콘브넥스트의 효율적인 특징 추출 능력, 에피션트넷V2의 확장성, 스윈 트랜스포머의 장거리 주의 메커니즘을 결합한 하이브리드 방식을 채택했다. 적응형 주의 메커니즘은 특징 융합을 동적으로 최적화하여 모델이 가장 관련성 높은 정보에 집중하게 함으로써 정확도를 높이고 오탐지(false positive)를 줄인다.
흥미롭게도, 스킨EHDLF는 정확도를 7.9% 향상시키고 오탐지를 28% 감소시켰다. 이는 기존의 주요 모델들보다 더 정확하고 신뢰할 수 있는 자동화된 피부암 탐지 솔루션임을 보여준다.
신체 부위별 정확도: 머리·목 98.2%, 상지 97.8%, 하지 97.5%, 몸통 98.6%
스킨EHDLF 모델의 성능은 다양한 해부학적 부위와 피부 병변 유형에 대해서도 우수한 결과를 보였다. 머리와 목 부위에서 98.2%의 정확도, 상지(팔과 손)에서 97.8%, 하지(다리와 발)에서 97.5%, 몸통에서 98.6%의 정확도를 달성했다. 이는 모델이 신체의 다양한 부위에 나타나는 피부 병변을 일관되게 높은 정확도로 분류할 수 있음을 보여준다.
또한, 모델은 노이즈가 있는 환경에서도 견고한 성능을 유지했다. 가우시안 노이즈(5%)에서도 97.6%의 정확도를, 중간 수준의 노이즈에서도 96.95%의 정확도를 유지했다. 이러한 결과는 실제 임상 환경에서 발생할 수 있는 다양한 이미지 품질에도 모델이 효과적으로 작동할 수 있음을 시사한다.
연령대별 분석에서도 스킨EHDLF는 18세 미만 아동에서 99.1%, 성인(30-60세)에서 98.8%, 노인(60세 이상)에서 98.6%의 정확도를 보였다. 이는 모델이 다양한 연령대의 피부 상태와 병변 특성에도 일관된 성능을 발휘함을 의미한다.
120ms 추론 시간으로 실시간 진단 가능, 경쟁 모델보다 최대 25ms 빠른 처리 속도
스킨EHDLF 모델은 높은 정확도뿐만 아니라 빠른 처리 속도도 갖추고 있다. 추론 시간(inference time)이 120ms로, 이는 비트-B16(145ms)나 다른 하이브리드 모델(138ms)보다 빠르다. 이러한 빠른 처리 속도는 실시간 임상 환경에서의 적용 가능성을 높인다.
데이터 전처리의 중요성도 연구를 통해 확인되었다. 전처리 후 모델의 정확도는 95.8%에서 98.9%로 크게 향상되었다. 이는 딥러닝 모델의 성능 향상에 있어 데이터 전처리가 얼마나 중요한지를 보여준다.
연구진은 K-교차 검증(K-fold cross-validation)을 통해 모델의 일관성과 안정성도 검증했다. 10개 폴드에서 모두 98.6%에서 99.1% 사이의 정확도를 보여, 모델의 성능이 우연이 아닌 일관된 패턴임을 확인했다.
전문의 부족 지역에서도 99% 이상의 정확도로 피부암 조기진단 가능성 열어
이번 연구는 자동화된 피부암 진단에 있어 중요한 진전을 보여준다. 스킨EHDLF 모델의 높은 정확도와 견고성은 의료 전문가들이 더 정확하고 신속한 진단을 내리는 데 도움이 될 수 있으며, 특히 피부과 전문의에 대한 접근이 제한된 지역에서 큰 가치가 있을 것으로 기대된다.
연구팀은 향후 더 다양한 피부 유형과 병변 유형을 포함하도록 데이터셋을 확장하고, 실제 임상 환경에서 모델을 검증하는 작업을 계획하고 있다. 또한 모델의 해석 가능성을 높이고 노이즈 견고성을 더욱 향상시키는 연구도 진행할 예정이다.
결론적으로, 스킨EHDLF 모델은 피부암 분류에 있어 유망한 가능성을 보여주었으며, 앞으로 피부과 진단을 혁신하고 환자 결과를 개선하는 데 중요한 역할을 할 것으로 기대된다.
FAQ
Q: 스킨EHDLF 모델이 기존 피부암 진단 방법보다 더 나은 점은 무엇인가요?
A: 스킨EHDLF 모델은 98.76%의 높은 정확도와 99.8%의 AUROC를 보이며, 오탐지를 28% 감소시켰습니다. 이는 여러 첨단 딥러닝 모델의 장점을 결합하고 적응형 주의 기반 특징 융합 메커니즘을 적용했기 때문입니다. 또한 처리 속도가 빨라 실시간 임상 환경에 적합합니다.
Q: 인공지능이 피부암 진단에 어떤 도움을 줄 수 있나요?
A: 인공지능은 방대한 양의 의료 이미지를 빠르고 정확하게 분석할 수 있습니다. 스킨EHDLF와 같은 AI 모델은 의사들이 더 정확한 진단을 내리는 데 도움을 주며, 특히 피부과 전문의가 부족한 지역에서 중요한 역할을 할 수 있습니다. 또한 인간의 눈으로는 구분하기 어려운 피부 병변의 미묘한 차이를 감지하는 데 도움이 됩니다.
Q: 이 AI 모델은 실제 의료 현장에서 곧 사용될 수 있나요?
A: 스킨EHDLF 모델은 연구 단계에서 뛰어난 성능을 보였지만, 실제 임상 환경에서의 검증이 더 필요합니다. 연구진은 실제 임상 데이터와 다양한 환경에서의 검증을 계획하고 있으며, 이러한 과정을 거쳐 의료 현장에 도입될 가능성이 높습니다. 처리 속도가 빠르고 정확도가 높아 실제 의료 환경에 적합한 특성을 갖추고 있습니다.
해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.
이미지 출처: 이디오그램 생성
기사는 클로드와 챗GPT를 활용해 작성되었습니다.