Search

AI 과학자 ‘코스모스’, 6개월 연구를 하루 만에 완료

AI 과학자 '코스모스', 6개월 연구를 하루 만에…"생성형 AI가 과학 발견을 자동화하다"
이미지 출처: 구글 믹스보드 생성

퓨처하우스(FutureHouse)가 차세대 AI 과학자 ‘코스모스(Kosmos)’를 공개했다. 코스모스는 연구자가 6개월 동안 수행할 분량의 연구를 단 하루 만에 완료하며, 생성형 AI를 활용한 과학 연구 자동화의 새로운 가능성을 제시했다. 퓨처하우스는 코스모스의 기술 보고서를 통해 이같은 성과를 발표했으며, 코스모스는 에디슨 사이언티픽(Edison Scientific)이라는 상용 스핀오프 기업의 플랫폼에서 첫날부터 사용 가능하다.

1,500편 논문 읽고 4만 줄 코드 작성…기존 AI 과학자 대비 9.8배 성능

코스모스의 핵심 혁신은 ‘구조화된 세계 모델(structured world models)’의 활용이다. 기존 AI 과학자들은 언어 모델의 한정된 컨텍스트 길이 때문에 일정 단계 이상의 추론을 수행하기 어려웠다. 하지만 코스모스는 수백 개의 에이전트 궤적에서 추출한 정보를 효율적으로 통합하고, 수천만 개의 토큰에 걸쳐 특정 연구 목표를 향한 일관성을 유지할 수 있다.

Kosmos World Model: 여러 AI 에이전트가 협력하여 분석하고 보고서를 출력하는 워크플로우
이미지 출처: Kosmos: An AI Scientist for Autonomous Discovery

단 한 번의 코스모스 실행은 평균적으로 1,500편의 논문을 읽고 4만 2,000줄의 분석 코드를 작성한다. 이는 퓨처하우스의 이전 AI 과학자인 로빈(Robin)에 비해 코드 생성량이 9.8배 증가한 수치다. 베타 테스터들은 코스모스가 하루 만에 자신들이 6개월 동안 할 수 있는 연구를 수행한다고 평가했으며, 독립적인 과학자들은 코스모스가 도출한 결론의 79.4%가 정확하다고 판단했다.

Kosmos World Model: 작업 성능과 정확도 및 전문가 예상 작업 시간
이미지 출처: Kosmos: An AI Scientist for Autonomous Discovery

신경과학부터 재료과학까지…7가지 발견 사례 공개

퓨처하우스는 코스모스가 신경과학, 재료과학, 통계유전학 등 다양한 분야에서 이뤄낸 7가지 발견 사례를 공개했다. 이 중 3가지는 미공개 또는 사전 출판된 논문의 발견을 독립적으로 재현한 것이며, 나머지 4가지는 과학 문헌에 새롭게 기여한 발견이다.

첫 번째 발견에서 코스모스는 당시 미공개였던 대사체학 데이터를 사용해 저체온 상태의 쥐 뇌에서 뉴클레오타이드 대사가 주요 변화 경로임을 밝혀냈다. 이 연구는 코스모스 실행 후 바이오아카이브(BioRxiv)에 사전 출판됐다. 두 번째 발견에서는 재료과학 분야로 영역을 확장해, 열처리 과정에서의 절대 습도가 페로브스카이트 태양전지 효율을 결정하는 가장 중요한 요소이며, 습도가 약 60g/m³ 이상일 때 소자가 고장 나는 임계 기준을 확인했다. 이 논문은 코스모스가 사용한 언어 모델의 학습 데이터 마감일 이후에 출판됐다.

네 번째 발견에서 코스모스는 공개 가능한 전장유전체 연관 분석(GWAS) 및 단백질 정량적 형질 유전자좌(pQTL) 데이터를 활용해 멘델 무작위 배정 분석을 수행했다. 그 결과 순환하는 초과산화물 불균등화효소 2(SOD2)의 높은 수치가 심근 T1 시간 단축 및 심근 섬유화 감소를 인과적으로 유도할 수 있다는 통계적 증거를 제시했다. 쥐를 대상으로 한 연구에서 SOD2의 역할은 이미 문서화됐지만, 이번 발견은 인간에서의 관련성을 뒷받침한다.

다섯 번째 발견에서는 제2형 당뇨병의 보호 유전자 변이 메커니즘을 규명하고, 여섯번째는 알츠하이머병에서 타우 단백질 축적으로 이어지는 분자 사건의 순서를 결정하는 새로운 분석 방법을 개발했다.

일곱 번째 발견은 임상적으로 가장 중요한 새로운 발견이다. 코스모스는 노화와 관련된 신경 취약성을 이해하기 위해 젊은 쥐와 늙은 쥐의 단일 핵 전사체 데이터를 대규모로 편향 없이 탐색했다. 그 결과 알츠하이머병에서 타우 축적이 가장 먼저 발생하는 내후각피질 뉴런이 노화에 따라 플리파아제(flippase) 유전자의 발현이 감소한다는 사실을 발견했다. 이러한 플리파아제 발현 감소는 세포 표면에서 포스파티딜세린(phosphatidylserine)의 “먹어치워라(eat me)” 신호 노출을 증가시켜, 미세아교세포가 이러한 취약한 뉴런을 포식하고 분해하도록 유도할 수 있다. 연구팀은 인간 알츠하이머병 환자의 독립적인 단일 세포 RNA 시퀀싱 데이터셋에서 이 발견을 검증할 수 있었다. 내후각피질의 과립상 뉴런에서 브라크(Braak) 0단계 대비 2단계에서 플리파아제 발현이 감소했으며, 이는 해당 부위에 타우 병리가 나타나는 시기와 일치한다.

박사급 연구원 6개월 작업, 코스모스는 하루 만에 완료

코스모스의 가장 놀라운 점은 작업량 추정치다. 베타 테스터들은 20단계 코스모스 실행이 평균 6.14개월의 박사급 또는 박사후 연구원 작업에 해당한다고 평가했다. 연구팀은 이 추정치의 타당성을 검증하기 위해 독립적인 계산을 수행했다. 과학자가 논문 한 편을 읽는 데 15분, 데이터 분석 궤적 하나를 수행하는 데 약 2시간이 걸린다고 가정하면, 평균적인 코스모스 실행에 포함된 논문 및 분석 궤적 수를 합산할 경우 주당 40시간 근무 기준으로 약 4.1개월의 시간이 소요된다.

흥미롭게도 코스모스의 작업량은 실행 깊이에 따라 선형적으로 증가한다. 베타 테스터들은 코스모스를 5단계, 10단계, 20단계로 실행한 결과를 평가했으며, 사람에 해당하는 작업 시간이 5단계에서 3.9개월, 10단계에서 4.4개월, 20단계에서 6.2개월로 증가했다고 추정했다. 이는 과학 연구를 위한 최초의 추론 시간 확장 법칙(inference-time scaling law) 중 하나다.

79.4% 정확도로 투명하고 추적 가능한 과학적 결론 제시

코스모스의 또 다른 강점은 투명성과 추적 가능성이다. 과학적 결론은 사실에 근거해야 하지만, 최근 많은 AI 시스템은 명확한 출처 없이 결론을 도출한다. 반면 코스모스 보고서의 모든 결론은 플랫폼을 통해 해당 결론을 도출한 특정 코드 라인이나 과학 문헌의 특정 구절까지 추적할 수 있어, 코스모스의 보고서는 항상 완전히 감사 가능하다.

독립적인 과학자들이 코스모스의 3개 대표 보고서에서 추출한 102개 진술을 평가한 결과, 전체적으로 79.4%의 진술이 정확했다. 유형별로는 데이터 분석 기반 진술의 85.5%가 재현 가능했으며, 문헌 검토 기반 진술의 82.1%가 원본 출처로 검증됐고, 종합 진술의 57.9%가 정확했다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. 코스모스가 기존 AI 과학자와 다른 점은 무엇인가요?
A1. 코스모스는 구조화된 세계 모델을 사용해 수백 개의 에이전트 작업을 조율하며, 한 번 실행 시 1,500편의 논문을 읽고 4만 2,000줄의 코드를 작성합니다. 이는 이전 AI 과학자 대비 9.8배 많은 코드 생성량이며, 6개월 분량의 연구를 하루 만에 완료할 수 있습니다.

Q2. 코스모스의 연구 결과는 얼마나 신뢰할 수 있나요?
A2. 독립적인 과학자들이 평가한 결과, 코스모스가 도출한 결론의 79.4%가 정확한 것으로 확인됐습니다. 또한 모든 결론은 작성된 코드나 참조한 문헌으로 추적 가능해 투명성이 높습니다.

Q3. 코스모스는 어떤 분야에서 활용할 수 있나요?
A3. 코스모스는 신경과학, 재료과학, 통계유전학, 대사체학, 단백질체학, 전사체학 등 다양한 과학 분야에서 활용 가능합니다. 데이터가 풍부한 모든 분야에 적용할 수 있는 범용 과학 에이전트입니다.

기사에 인용된 리포트 원문은 아카이브에서 확인할 수 있다.

리포트명: Kosmos: An AI Scientist for Autonomous Discovery

이미지 출처: 구글 믹스보드 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




AI 과학자 ‘코스모스’, 6개월 연구를 하루 만에 완료 – AI 매터스