Value of Using a Generative AI Model in Chest Radiography Reporting: A Reader Study
판독 시간 34.2초에서 19.8초로: 생성형 AI가 의사의 업무 효율성 42% 향상
영상의학적 검사 판독의 정확성과 신속성은 환자 치료 결과에 큰 영향을 미친다. 특히 흉부 X선 검사는 가장 흔하게 시행되는 영상의학 검사임에도 해석에 상당한 전문성과 시간이 필요하다. 최근 영상의학 분야에서 주목받고 있는 생성형 인공지능(Generative Artificial Intelligence, 생성형 AI)은 텍스트와 이미지를 처리하고 생성할 수 있는 멀티모달 기술로, 단순한 이상 소견 분류를 넘어 맥락이 풍부한 종합적인 판독 보고서를 생성할 수 있는 잠재력을 가지고 있다.
홍은경 박사 연구팀이 수행한 이번 연구는 도메인 특화 멀티모달 생성형 AI 모델을 활용한 흉부 X선 판독의 임상적 가치를 평가했다. 2009년부터 2017년까지 공개 데이터셋에서 수집한 758개의 흉부 X선 영상을 대상으로 5명의 영상의학과 전문의가 AI 생성 보고서 없이 판독한 경우와 AI 생성 보고서를 예비 보고서로 활용한 경우를 비교하는 리더 연구가 진행되었다.
연구 결과, AI 생성 보고서를 활용했을 때 평균 판독 시간이 34.2초에서 19.8초로 약 42% 감소했다. 이는 영상의학과 의사들의 업무 효율성을 크게 향상시키는 결과로, 영상의학과의 워크플로우 개선에 중요한 의미를 갖는다. 특히 흉부 전문 영상의학과 의사 중 한 명의 경우, 판독 시간이 59.8초에서 7.6초로 대폭 감소하는 놀라운 효과를 보였다.

판독 일치도 5.0으로 상승: AI 도입 후 보고서 품질 전문가 평가 점수 유의미하게 개선
AI 생성 보고서의 도입은 판독 일치도와 보고서 품질 점수 모두를 향상시켰다. 판독 일치도 점수는 중앙값 5.0(IQR 4.0-5.0)에서 5.0(IQR 4.5-5.0)으로 향상되었고, 보고서 품질 점수도 4.5(IQR 4.0-5.0)에서 4.5(IQR 4.5-5.0)으로 개선되었다. 이러한 변화는 통계적으로 유의미했으며(p < 0.001), AI 생성 보고서가 전반적인 판독 품질을 향상시키는 데 기여함을 보여준다.
이 연구의 큰 의의는 리더 연구(reader study)를 통해 생성형 AI의 실제 임상 환경에서의 가치를 입증했다는 점이다. 이전 연구들과 달리 영상 제시부터 판독 보고서 작성까지의 전체 과정을 평가함으로써, AI 모델이 영상의학과 워크플로우 전반을 개선할 수 있는 잠재력을 확인했다.
비정상 소견 감지율 최대 90.8%: AI 활용 시 종격동 이상 및 흉막 병변 발견 정확도 10% 향상
총 258개의 흉부 X선을 대상으로 한 사실적 정확성 분석에서도 주목할 만한 결과가 나타났다. AI 생성 보고서를 활용했을 때 여러 비정상 소견의 감지 민감도가 크게 향상되었다. 특히 확장된 종격동 실루엣(widened mediastinal silhouettes) 감지 민감도는 84.3%에서 90.8%로, 흉막 병변(pleural lesions) 감지 민감도는 77.7%에서 87.4%로 증가했다(p < 0.001).
또한 폐 경화(consolidation)와 폐 혼탁(lung opacity) 감지에서도 각각 56.8%에서 74.7%, 28.8%에서 51.3%로 민감도가 향상되었다. 다만 폐결절(nodules) 감지의 민감도는 86.7%에서 80.0%로 다소 감소했는데, 이는 결절을 설명하는 용어의 차이(예: “둥근 혼탁” 또는 “석회화된 육아종”)로 인한 것으로 추정된다.
59.8초에서 7.6초로: 생성형 AI가 영상의학과 워크플로우에 가져온 혁신적 변화
이번 연구 결과는 도메인 특화 멀티모달 생성형 AI 모델이 영상의학 보고서 생성의 효율성과 품질을 향상시킬 수 있음을 시사한다. 특히 판독 시간 단축과 정확도 향상은 증가하는 의료 영상 검사 수요에 대응하는 데 중요한 솔루션이 될 수 있다.
연구팀은 “생성형 AI 기술은 단순한 분류나 분할 작업을 넘어 맥락이 풍부한 종합적인 판독 보고서를 생성할 수 있는 잠재력을 보여주었다”며 “이 기술은 영상의학과의 워크플로우 전반을 개선하고 의사들의 부담을 줄이는 데 기여할 것”이라고 전망했다.
다만 연구팀은 개별 영상의학과 의사마다 AI 생성 보고서의 효과에 차이가 있었음에 주목했다. 일부 의사는 AI 생성 보고서에 대해 회의적인 태도를 보이며 오히려 판독 시간이 증가한 반면, 다른 의사들은 AI 생성 보고서를 적극적으로 활용하여 효율성을 크게 향상시켰다. 이는 AI 기술 도입 시 개인의 선호도와 수용성을 고려해야 함을 시사한다.
향후 연구에서는 더 큰 규모의 다양한 영상의학과 의사 그룹을 대상으로 한 검증과, 이전 영상과의 비교 분석 기능을 포함한 AI 모델의 추가 개발이 필요하다고 연구팀은 제안했다.
FAQ
Q: 생성형 AI가 기존의 영상의학 AI 기술과 어떻게 다른가요?
A: 기존의 딥러닝 기반 영상의학 AI는 주로 이상 소견 감지나 분류와 같은 시각적 작업에 초점을 맞췄습니다. 반면 생성형 AI는 이미지와 텍스트를 모두 처리하는 멀티모달 기술로, 이상 소견을 감지할 뿐만 아니라 맥락이 풍부한 종합적인 판독 보고서를 자동으로 생성할 수 있습니다.
Q: 영상의학과 의사가 AI 생성 보고서를 사용하면 어떤 이점이 있나요?
A: 연구 결과에 따르면 판독 시간이 평균 42% 감소하고, 판독 일치도와 보고서 품질이 향상되며, 여러 비정상 소견의 감지 정확도가 향상됩니다. 이는 업무 효율성 증가와 환자 진료 품질 향상으로 이어질 수 있습니다.
Q: 생성형 AI가 영상의학과 의사를 대체할 수 있나요?
A: 아닙니다. 이 연구에서 AI는 ‘예비 보고서’ 작성을 지원하는 도구로 사용되었으며, 최종 판독과 결정은 여전히 영상의학과 의사의 전문성이 필요합니다. AI는 의사의 업무 효율성을 높이고 진단 정확도를 향상시키는 보조 도구로 보는 것이 적절합니다.
해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.
이미지 출처: 이디오그램 생성
기사는 클로드와 챗GPT를 활용해 작성되었습니다.
관련 콘텐츠 더보기