• Home
  • AI Report
  • 구글, 건강 관련 음향 분석하는 AI 모델 ‘HeAR’ 개발

구글, 건강 관련 음향 분석하는 AI 모델 ‘HeAR’ 개발

HeAR - Health Acoustic Representations
이미지 출처: 미드저니 생성

HeAR – Health Acoustic Representations

구글 리서치팀이 건강 관련 음향을 분석하는 혁신적인 AI 모델 ‘HeAR(Health Acoustic Representations)’를 개발해 주목받고 있다. HeAR는 기침, 호흡 등의 소리를 분석해 다양한 건강 정보를 추론할 수 있는 모델로, 기존의 유사 모델들을 크게 앞서는 성능을 보여주고 있다.

유튜브 영상으로 학습한 거대 AI 모델

HeAR의 가장 큰 특징은 전례 없는 규모의 데이터로 학습했다는 점이다. 연구팀은 30억 개의 유튜브 영상에서 추출한 3억 1330만 개의 2초 길이 오디오 클립을 학습 데이터로 사용했다. 이는 약 17만 4000시간, 즉 20년 가까운 시간의 음성 데이터에 해당한다. 이 방대한 데이터를 활용해 ‘자기지도학습(self-supervised learning)’ 방식으로 AI 모델을 훈련시켰다. 자기지도학습은 레이블이 없는 대규모 데이터를 활용해 AI 모델의 성능을 높이는 기법으로, 특히 데이터 레이블링에 많은 비용과 시간이 소요되는 의료 분야에서 그 가치가 크다.

다양한 건강 정보 추론 가능

연구팀은 HeAR의 성능을 평가하기 위해 33개의 다양한 작업에 적용해보았다. 그 결과 HeAR는 기존의 유명 AI 모델들보다 우수한 성능을 보였다. 특히 기침 소리를 통한 결핵, 코로나19 등의 질병 진단, 호흡 소리를 통한 폐 기능 추정, 성별과 나이 추정, 심지어 흡연 여부 판단까지 다양한 작업에서 높은 정확도를 보였다.

HeAR의 또 다른 주목할 만한 장점은 적은 양의 데이터로도 높은 성능을 낼 수 있다는 점이다. 연구팀에 따르면 HeAR는 일부 작업에서 기존 모델들이 100%의 데이터로 달성한 성능을 단 6.25%의 데이터만으로 달성할 수 있었다. 이는 의료 데이터 수집의 어려움을 고려할 때 매우 중요한 특성이다.

또한 HeAR는 다양한 녹음 기기에서 안정적인 성능을 보인다는 강점도 있다. 연구팀은 서로 다른 성능의 스마트폰 세 종류로 녹음한 음성에 대해 실험을 진행했고, HeAR는 기기 간 성능 차이가 가장 적었으며 특정 기기로 학습하지 않은 경우에도 높은 성능을 유지했다.

의료 현장 적용 위해서는 모델 크기 줄이고 임상 검증 필요

그러나 HeAR에게도 해결해야 할 과제가 남아있다. 가장 시급한 문제는 모델의 크기다. 현재 HeAR는 그 규모가 커서 스마트폰 등 모바일 기기에서 실행하기 어렵다. 연구팀은 모델 압축, 지식 증류 등의 기술을 활용해 이 문제를 해결할 계획이라고 밝혔다.

또한 의료 현장에 실제 적용하기 위해서는 더 많은 임상 검증이 필요하다. 특히 성별, 연령, 인종 등에 따른 편향 가능성을 면밀히 조사하고 보완해야 한다. 개인정보 보호도 중요한 과제다. 음성 데이터에는 민감한 개인정보가 포함될 수 있어, 이를 안전하게 처리하고 보관하는 방안도 마련해야 한다.

의료 AI의 새 지평

HeAR의 개발은 의료 AI 분야에 새로운 가능성을 제시했다는 평가를 받고 있다. 단순한 음향 분석만으로도 다양한 건강 정보를 얻을 수 있다는 점에서, 의료 서비스의 접근성을 크게 높일 수 있기 때문이다. 특히 의료 인프라가 부족한 개발도상국에서 큰 도움이 될 수 있을 것으로 기대된다.

구글 리서치팀은 HeAR 모델과 관련 데이터셋을 추후 다른 연구자들에게 공개할 예정이다. 이를 통해 더 많은 연구자들이 이 분야에 참여하고, 궁극적으로는 더 나은 의료 서비스 개발로 이어질 수 있기를 희망한다고 밝혔다.

HeAR의 개발은 의료 AI의 새로운 지평을 열었다는 점에서 큰 의의가 있다. 그러나 실제 의료 현장에 적용되기까지는 아직 많은 과제가 남아있다. 임상 검증, 윤리적 고려사항, 개인정보 보호 등의 문제를 해결하고, AI의 판단 근거를 명확히 설명할 수 있는 방안도 마련해야 한다. 또한 이러한 기술이 의료진을 대체하는 것이 아니라 보조하는 도구로 사용되어야 한다는 점도 중요하다. HeAR는 의료 AI의 잠재력을 보여주는 중요한 연구 성과이지만, 이를 실용화하기 위해서는 의료계, 윤리학계, 기술계의 긴밀한 협력이 필요할 것으로 보인다.

구글의 음향 분석 AI 논문은 링크에서 확인할 수 있다.


본 기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




구글, 건강 관련 음향 분석하는 AI 모델 ‘HeAR’ 개발 – AI 매터스