• Home
  • AI Economy-Health
  • 의료 영상 판독 AI, 실제 병원서 첫 검증… “의사 판독시간 29초 단축시켰다”

의료 영상 판독 AI, 실제 병원서 첫 검증… “의사 판독시간 29초 단축시켰다”

Efficiency and Quality of Generative AI–Assisted Radiograph Reporting
이미지 출처: 이디오그램 생성

Efficiency and Quality of Generative AI–Assisted Radiograph Reporting


23,960건 분석해 29초 단축 효과 입증… 실제 병원서 첫 검증

노스웨스턴 의대 연구팀이 생성형 인공지능(Generative AI) 모델을 활용한 방사선 영상 판독 보조 시스템의 효과를 대규모 임상 연구를 통해 입증했다고 발표했다. 이번 연구는 생성형 AI가 실제 의료 현장에서 방사선과 의사의 판독 효율성을 유의미하게 향상시키면서도 진단 정확도를 유지할 수 있음을 보여준 첫 번째 전향적 임상 연구로 평가받고 있다.

2023년 11월 15일부터 2024년 4월 24일까지 진행된 이번 연구에서는 12개 병원으로 구성된 대학 의료 시스템에서 총 23,960건의 방사선 영상을 분석했다. 연구 결과, 생성형 AI 모델의 도움을 받은 방사선과 의사들의 판독 시간이 평균 29.4초 단축되어 15.5%의 효율성 향상을 보였다. 이는 연구 기간 중 총 63시간 이상의 판독 시간을 절약한 것으로, 대략 79개의 방사선과 의사 근무 교대를 67개로 줄일 수 있는 수준의 효율성 개선이다.

800건 동료평가 결과, 오진율 변화 없어… 부록 작성 0.13%→0.14% 동일

연구팀은 AI 모델 사용이 진단의 정확성에 미치는 영향을 평가하기 위해 800건의 연구에 대한 동료 평가(Peer Review)를 실시했다. 평가 결과, AI 모델을 사용한 판독 보고서와 기존 방식으로 작성된 보고서 간 임상 정확도에서 통계적으로 유의한 차이가 없었다. 또한 텍스트 품질 면에서도 양 그룹 간 차이가 나타나지 않았다.

특히 주목할 점은 보고서 수정이 필요한 오류를 정정하기 위한 부록(Addenda) 작성 빈도가 AI 모델 도입 전후로 동일하게 유지되었다는 것이다. 모델 도입 전 11,980건의 보고서 중 16건(0.13%)에서 부록이 작성되었고, 모델 사용 후에도 17건(0.14%)으로 거의 차이가 없었다. 이는 AI 모델 사용이 진단 품질에 부정적 영향을 주지 않았음을 시사한다.

97,651건 실시간 스크리닝… 24초 만에 응급상황 포착

연구팀은 AI 모델의 또 다른 중요한 활용 가능성으로 응급 상황 조기 감지 기능을 테스트했다. 97,651건의 방사선 영상을 대상으로 즉각적인 의료진 개입이 필요한 예상치 못한 폐기흉(Pneumothorax) 감지 성능을 평가한 결과, 72.7%의 민감도와 99.9%의 특이도를 보였다.

시스템은 영상 촬영 완료 후 평균 24초 만에 우선순위 플래그를 제공했으며, 방사선과 의사의 알림은 평균 24.5분 후에 이루어졌다. 이는 기존 분류 기반(Classification-based) AI 시스템들이 63-90%의 민감도와 98-100%의 특이도를 보이는 것과 비교할 때 경쟁력 있는 성능이다. 더욱 중요한 것은 생성형 AI가 보고서 텍스트의 임상적 맥락을 고려하여 중증도와 흉관 삽입 여부 등을 판단함으로써 불필요한 경고를 줄일 수 있다는 점이다.

3초 추론완료 멀티모달 AI… 에픽-파워스크라이브 시스템 완전 통합

이번 연구에서 사용된 생성형 AI 모델은 멀티모달 인코더-디코더 트랜스포머(Multimodal Encoder-Decoder Transformer) 기반으로 설계되었다. 모델은 이미지와 텍스트를 동시에 처리할 수 있으며, 병원의 전자의무기록(EHR) 시스템인 에픽(Epic)과 방사선 판독 소프트웨어인 파워스크라이브(PowerScribe)에 원활하게 통합되었다.

모델은 평균 3초(중앙값 기준, 범위 2-4초) 만에 추론을 완료하여 영상 획득 후 몇 초 내에 초안 AI 보고서를 생성한다. 방사선과 의사들은 기존 워크플로우 내에서 AI가 생성한 보고서를 검토하고 편집하는 방식으로 작업할 수 있어 기존 임상 루틴에 최소한의 방해만 가한다. 이는 수련의가 작성한 초안 보고서를 전문의가 검토하고 편집하는 기존 관행과 유사한 접근 방식이다.

Efficiency and Quality of Generative AIAssisted Radiograph Reporting


FAQ

Q: 생성형 AI가 방사선 판독에서 어떻게 효율성을 높이나요?

A: AI가 초안 보고서를 미리 생성해 주어 방사선과 의사가 처음부터 작성하거나 음성 인식으로 입력할 필요 없이 검토하고 편집만 하면 되기 때문입니다. 평균적으로 판독 시간이 29.4초 단축되어 15.5%의 효율성 향상을 보였습니다.

Q: AI 보조 판독이 진단 정확도에 영향을 주지 않나요?

A: 연구 결과 AI 모델을 사용한 판독과 기존 방식 판독 간 임상 정확도와 텍스트 품질에서 유의한 차이가 없었습니다. 오히려 AI가 일관된 품질의 초안을 제공해 전반적인 판독 품질 향상에 도움이 될 수 있습니다.

Q: 폐기흉 감지 기능은 어떻게 작동하나요?

A: AI가 생성한 보고서 텍스트를 분석하여 즉각적인 치료가 필요한 응급 폐기흉을 식별합니다. 단순한 이미지 분류가 아닌 임상적 맥락을 고려한 텍스트 분석을 통해 불필요한 경고를 줄이면서도 높은 정확도를 달성했습니다.

해당 기사에 인용한 논문 원문은 jamanetwork에서 확인 가능하다.

이미지 출처: 이디오그램 생성

이 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters_banner_article_bottom



의료 영상 판독 AI, 실제 병원서 첫 검증… “의사 판독시간 29초 단축시켰다” – AI 매터스 l AI Matters