• Home
  • AI Report
  • AI로 단일 세포 단위의 단백질 생물학 연구 혁신

AI로 단일 세포 단위의 단백질 생물학 연구 혁신

Contextual AI models for single-cell protein biology
이미지 출처: 미드저니 생성

Contextual AI models for single-cell protein biology

하버드대 연구팀, 세포 맥락을 고려한 AI 모델 ‘PINNACLE’ 개발

단백질의 기능을 이해하고 분자 치료제를 개발하는 데 있어 단백질이 작용하는 세포 유형과 단백질 간 상호작용을 파악하는 것이 중요하다. 그러나 기존 알고리즘으로는 다양한 생물학적 맥락에서 단백질 상호작용을 모델링하는 데 한계가 있었다. 이러한 문제를 해결하기 위해 하버드대학교 연구팀이 새로운 AI 모델 ‘PINNACLE’을 개발했다. 이 연구 결과는 최근 네이처 메소드(Nature Methods) 저널에 게재되었다.

PINNACLE(Protein Network-based Algorithm for Contextual Learning)은 기하학적 딥러닝 접근법을 사용해 세포 유형별 맥락을 고려한 단백질 표현을 생성한다. 이 모델은 다중 장기 단일세포 아틀라스를 활용해 156개 세포 유형과 24개 조직에 걸쳐 394,760개의 단백질 표현을 학습했다. 연구를 주도한 마린카 지트닉(Marinka Zitnik) 하버드대 교수는 “PINNACLE의 임베딩 공간은 세포와 조직의 구조를 반영하며, 이를 통해 조직 계층 구조를 제로샷(zero-shot) 방식으로 검색할 수 있다”고 설명했다.

PINNACLE의 가장 큰 특징은 맥락 인식 능력이다. 기존 AI 모델들이 단백질당 하나의 표현만 생성하는 것과 달리, PINNACLE은 단백질이 활성화되는 각 세포 유형에 대해 고유한 표현을 생성한다. 이는 단백질의 기능이 세포 유형에 따라 달라질 수 있다는 생물학적 사실을 AI 모델에 반영한 것이다. 이를 통해 PINNACLE은 단백질의 다면적 기능을 더 정확하게 포착할 수 있게 되었다.

또한 PINNACLE은 사전 훈련된 단백질 표현을 다양한 다운스트림 과제에 적용할 수 있다. 예를 들어, 3D 구조 기반 표현을 향상시켜 면역-종양학 단백질 상호작용을 해석하는 데 활용할 수 있다. 연구팀은 PD-1/PD-L1과 B7-1/CTLA-4 단백질 상호작용을 분석하여 PINNACLE의 성능을 검증했다. 그 결과, PINNACLE은 기존의 구조 기반 표현보다 결합 단백질과 비결합 단백질을 더 잘 구분할 수 있었다. 이는 PINNACLE이 생성한 맥락화된 단백질 표현이 3D 구조 정보를 보완할 수 있음을 보여준다.

PINNACLE의 또 다른 중요한 응용 분야는 질병 치료제 예측이다. 연구팀은 PINNACLE을 류마티스 관절염(RA)과 염증성 장질환(IBD)에 대한 치료제 후보를 예측하는 데 적용했다. 그 결과, PINNACLE은 기존의 최신 모델들보다 더 높은 예측 정확도를 보였다. 특히 PINNACLE은 맥락 없는 모델들보다 더 높은 예측 능력을 가진 세포 유형 맥락을 식별할 수 있었다.

예를 들어, RA 치료제 예측에서 PINNACLE은 CD4+ 헬퍼 T 세포, CD4+ αβ 메모리 T 세포, CD1c+ 골수성 수지상 세포 등이 가장 예측력이 높은 세포 유형 맥락임을 밝혀냈다. 이는 RA의 병리학적 메커니즘에 대한 기존 지식과 일치하는 결과다. IBD의 경우, CD4+ αβ 메모리 T 세포, 대장 상피의 장세포, T 소포 도움 세포 등이 가장 예측력이 높은 것으로 나타났다.

이러한 결과는 PINNACLE이 단순히 예측 정확도를 높이는 데 그치지 않고, 질병의 세포 수준 메커니즘에 대한 새로운 통찰을 제공할 수 있음을 보여준다. 지트닉 교수는 “PINNACLE이 식별한 고예측력 세포 유형 맥락들은 RA와 IBD에 대한 안전하고 효과적인 치료법을 설계하는 데 중요한 단서를 제공할 수 있다”고 말했다.

PINNACLE의 개발은 단백질 기능 이해와 분자 치료제 개발에 새로운 지평을 열 것으로 기대된다. 특히 단백질이 다양한 세포 유형에서 수행하는 역할과 서로 다른 세포 유형 맥락에서의 단백질 상호작용을 포괄적으로 이해하는 데 기여할 것으로 보인다. 이는 정밀 의학의 발전에 중요한 기여를 할 수 있다.

그러나 연구팀은 PINNACLE에도 몇 가지 한계가 있다고 지적했다. 가장 큰 한계는 사람의 단백질 상호작용체(interactome)가 세포 유형별로 측정되지 않았다는 점이다. 연구팀은 이를 보완하기 위해 단일세포 측정치를 단백질 상호작용 네트워크에 오버레이하는 방식을 사용했지만, 이는 여전히 완벽한 해결책은 아니다.

또한 PINNACLE은 현재 특정 세포 유형 맥락에서 측정되지 않은 단백질 상호작용(즉, 위음성)을 모델링하지 못한다는 한계도 있다. 이러한 한계에도 불구하고, PINNACLE이 맥락 없는 모델들에 비해 큰 성능 향상을 보였다는 점은 맥락화된 예측의 중요성을 입증한다.

지트닉 교수는 “PINNACLE은 작동하는 맥락에 따라 출력을 동적으로 조정할 수 있다”며 “이는 다양한 생물학적 맥락에 맞춤화된 기초 모델의 광범위한 사용으로 이어질 수 있다”고 전망했다. 이는 PINNACLE이 단순한 예측 도구를 넘어, 생물학적 시스템의 복잡성을 더 잘 이해하고 모델링할 수 있는 새로운 패러다임을 제시할 수 있음을 시사한다.

연구팀은 향후 PINNACLE을 다양한 방식으로 확장하고 개선할 계획이다. 예를 들어, 질병 특이적 또는 교란 특이적 네트워크에 대해 모델을 훈련시키면 PINNACLE의 예측 능력을 더욱 향상시킬 수 있을 것으로 기대된다. 또한 단백질 아이소폼이나 대체 스플라이싱, 알로스테릭 변화 등에 대한 정보를 모델에 통합하는 방안도 검토 중이다.

이번 연구 결과는 AI 기술과 단일세포 생물학의 융합이 가져올 수 있는 혁신적인 가능성을 보여주는 사례라고 할 수 있다. PINNACLE과 같은 맥락화된 AI 모델은 복잡한 생물학적 시스템을 이해하고 질병을 치료하는 데 있어 중요한 도구가 될 것으로 기대된다. 앞으로 이러한 접근법이 어떻게 발전하고, 생물학 및 의학 연구에 어떤 변화를 가져올지 주목된다.

기사에 참고한 리포트 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI로 단일 세포 단위의 단백질 생물학 연구 혁신 – AI 매터스