Search

AI가 유방암 검진 의사를 대체할 수 있을까, 5만 명 임상 연구가 답했다

AI가 유방암 검진 의사를 대체할 수 있을까, 5만 명 임상 연구가 답했다
이미지 출처: 이디오그램 생성

유방암 조기 발견을 위한 검진 현장에 인공지능이 의사 한 명의 역할을 맡을 수 있는지를 두고 대규모 임상 연구 결과가 나왔다. 영국 국민보건서비스 유방암 검진 프로그램에 구글의 AI 판독 시스템을 도입한 이 연구는 AI가 두 번째 판독 의사를 대신해도 진단 성능이 떨어지지 않는다는 사실을 확인했다. 다만 AI가 찾아낸 암을 인간 의사가 최종 판단 단계에서 번복하는 경우가 적지 않아, AI 단독 도입보다는 인간과 AI의 협력 체계가 당분간 필요하다는 결론도 함께 제시됐다.

방사선과 의사 부족이 만든 AI 도입의 필요성

영국은 현재 임상 방사선과 전문의가 30% 부족한 상태이며, 이 비율은 2028년까지 40%까지 높아질 것으로 전망된다. 방사선과 전문의는 유방 촬영 영상을 판독해 암 여부를 판단하는 핵심 인력이다. 영국 유방암 검진 시스템은 한 장의 유방 촬영 영상을 반드시 두 명의 전문가가 각각 독립적으로 판독하도록 설계돼 있다. 두 사람의 판단이 엇갈리거나 한 명이라도 이상 소견을 발견하면 제3의 전문가가 최종 판정을 내리는 중재 절차를 거친다. 이 구조는 오진을 줄이는 데 효과적이지만, 동시에 많은 전문 인력을 필요로 한다. 인력 부족이 심화되는 상황에서 두 번째 판독자 역할을 AI가 대신할 수 있다면 현장의 부담을 크게 줄일 수 있다는 기대가 이번 연구의 출발점이다.

5만 명 데이터로 설계한 대규모 비교 실험

이번 연구는 영국 런던의 두 유방암 검진 센터에서 각각 2만 5,000명씩 총 5만 명의 여성 유방 촬영 데이터를 활용했다. 연구팀은 기존 방식대로 두 명의 인간 전문가가 판독하는 경우와, 첫 번째 판독은 사람이 하되 두 번째 판독을 구글의 AI 시스템이 대신하는 경우를 비교했다. 중재가 필요한 사례 8,732건은 22명의 전문가가 직접 판독에 참여하는 별도의 독자 연구를 통해 평가했다. 연구의 가장 큰 강점은 39개월에 달하는 장기 추적 데이터를 보유했다는 점이다. 이를 통해 AI가 검진 당시에 발견하지 못했던 암을 더 일찍 잡아낼 수 있는지까지 분석할 수 있었다.

AI, 두 번째 의사 자리를 꿰차다

중재 절차를 포함한 최종 결과에서 AI는 인간 두 명이 판독하는 기존 방식에 비해 진단 성능이 떨어지지 않는 것으로 확인됐다. 암을 얼마나 잘 찾아내는지를 나타내는 민감도는 AI 방식이 49.2%, 인간 방식이 48.0%로 AI가 소폭 높았고, 정상을 정상으로 정확히 판별하는 특이도 역시 AI 방식이 근소하게 앞섰다. 업무 부담 측면에서도 의미 있는 변화가 나타났다. AI가 두 번째 판독자를 대체하면서 전체 인간 판독 건수가 46% 줄었다. 두 검진 센터의 전체 판독 시간을 계산하면 각각 36%, 44% 감소하는 효과가 있었다. 단, AI가 판독 자체를 거부하는 사례가 전체의 8.7%에 달했고, 중재가 필요한 건수는 오히려 늘었다는 점은 현장 도입 전에 추가로 검토해야 할 과제로 남았다.

AI가 찾은 암을 의사가 번복한 까닭

연구에서 주목할 만한 현상이 발견됐다. AI가 중재 전 단계에서 간격 암과 다음 검진 주기 암, 즉 현재 검진에서는 보이지 않아 나중에야 발견되는 암을 인간보다 더 높은 비율로 감지했다. 간격 암 민감도는 AI가 32.4%로 인간의 15.4%를 크게 웃돌았다. 그러나 중재 절차를 거치고 나면 이 차이가 사라졌다. AI가 옳게 암으로 판단한 93건 중 86%가 중재 단계에서 전문가들에 의해 번복된 것이다. 번복된 사례를 분석한 결과, AI가 암의 위치를 정확히 표시하지 못한 경우가 절반에 달했고, 과거 촬영 영상을 참고하지 않는 AI의 한계가 의사의 판단에 영향을 미친 것으로 분석됐다. 연구에 참여한 전문가 21명 중 12명은 AI가 석회화 병변을 과도하게 양성으로 표시하거나 이전 영상을 반영하지 못하는 상황에서 신뢰하기 어렵다고 답했다.

AI와 의사가 함께 가야 할 이유

이번 연구는 AI가 유방암 검진에서 두 번째 판독자를 대체할 수 있는 가능성을 대규모로 검증한 첫 번째 사례 중 하나다. 결론적으로 AI는 인간 의사를 완전히 대체하는 수준에는 아직 미치지 못하지만, 판독 인력 부담을 절반 가까이 줄이면서도 진단 정확도를 유지할 수 있다는 점을 실증했다. 연구팀은 AI가 암의 위치를 더 정확히 표시하고, 이전 촬영 영상을 함께 분석하며, 판단 근거를 의사에게 더 명확히 설명할 수 있도록 기술을 발전시킨다면 일부 암을 더 일찍 발견하는 것도 가능하다고 전망했다. 현재 영국에서는 이 연구 결과를 토대로 AI를 유방암 검진에 실제 도입하는 전향적 임상시험인 에디스(EDITH) 시험이 진행 중이다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

AI가 유방암 검진에서 의사를 완전히 대체할 수 있나요? 현재 기술 수준에서는 완전한 대체는 어렵습니다. 이번 연구에서 AI는 두 번째 판독 의사를 대신해도 진단 성능이 유지됐지만, 최종 판단 단계에서는 여전히 인간 전문가의 역할이 필요한 것으로 나타났습니다.

AI를 유방암 검진에 도입하면 어떤 점이 달라지나요? AI가 두 번째 판독자를 대신하면 전체 인간 판독 업무가 약 46% 줄어드는 효과가 있습니다. 방사선과 전문의 인력 부족 문제를 완화하고, 검진 대기 시간을 줄이는 데 도움이 될 수 있습니다.

AI가 발견한 암을 의사가 번복하는 이유는 무엇인가요? AI가 암의 위치를 부정확하게 표시하거나, 이전에 찍은 유방 촬영 영상을 참고하지 못하는 경우 의사들이 AI 판단을 신뢰하지 않고 번복하는 사례가 발생합니다. AI의 판단 근거가 더 명확하게 제시될수록 이런 문제는 줄어들 것으로 기대됩니다.

기사에 인용된 리포트 원문은 네이처 캔서(Nature Cancer)에서 확인할 수 있다.

리포트명: Impact of using artificial intelligence as a second reader in breast screening including arbitration

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.