구글이 8일(현지 시간) 자사 블로그를 통해 생성형 AI와 지리공간 기반 모델을 결합한 ‘지오스페이셜 추론(Geospatial Reasoning)’ 연구를 발표했다. 이 기술은 재난 대응부터 공중 보건, 기후 회복력, 상업적 응용까지 다양한 분야에서 강력한 통찰력을 제공할 것으로 기대된다.
구글 맵스, 스트리트 뷰, 구글 어스 등을 통해 우리는 일상적으로 지리공간 데이터를 활용하고 있다. 수십 년간 구글은 전 세계의 지리공간 정보를 조직화하고 접근 가능하게 만들어왔다. 구글 리서치(Google Research)에 따르면, 지리공간 정보는 크고 복잡하며 이해하기 어렵다. 특수 센서와 플랫폼이 필요하고, 다양한 종류의 데이터(날씨, 지도, 이미지 등)를 상호 참조해야 하는 경우가 많다. 최근의 AI 방법들도 지리공간 문제에 완전히 최적화되어 있지 않은 상황이다.
구글은 지난 11월 인구 역학 기반 모델(PDFM)과 궤적 기반 이동성 모델을 소개했다. 200개 이상의 조직이 이미 PDFM을 테스트했으며, 구글은 이 데이터셋을 영국, 호주, 일본, 캐나다, 말라위까지 확장하고 있다. 이번에 새롭게 발표한 원격 감지 기반 모델은 마스크드 오토인코더, SigLIP, MaMMUT, OWL-ViT 등의 검증된 아키텍처를 기반으로 한다. 이 모델들은 고해상도 위성 및 항공 이미지로 훈련되었으며, 건물 매핑, 재난 피해 평가, 인프라 위치 파악 등에 활용될 수 있다. 자연어 인터페이스를 통해 사용자는 “태양 전지판이 있는 주거용 건물” 같은 복잡한 검색도 가능하다.
지오스페이셜 추론은 제미나이(Gemini)와 같은 대규모 언어 모델을 활용해 복잡한 지리공간 쿼리를 처리한다. 예를 들어 허리케인 발생 후 위기 관리자는 다음과 같이 활용할 수 있다. 위기 관리자는 어스 엔진을 통해 오픈소스 위성 이미지로 재난 전 상황을 확인하고, 고해상도 항공 이미지로 재난 후 상황을 시각화할 수 있다. 원격 감지 기반 모델이 항공 이미지를 분석해 건물 손상 지역과 홍수 발생 지역을 식별하며, WeatherNext AI 일기 예보는 추가 손상 위험이 높은 지역을 예측한다. 제미나이는 동네별 손상 건물 비율과 인구 조사 데이터 기반 재산 피해액을 추정하며, 사회적 취약성 지수를 고려해 구호 활동의 우선순위를 제안할 수 있다.
WPP의 Choreograph는 PDFM을 자사의 미디어 성능 데이터와 통합해 AI 기반 청중 인텔리전스를 개발할 예정이다. 에어버스, 맥사, 플래닛 랩스는 원격 감지 기반 모델의 초기 테스터로 참여한다. 에어버스는 위성 이미지에서 더 빠른 통찰력 추출을, 맥사는 “살아있는 지구” 데이터에서 임무 중요 답변 추출을, 플래닛 랩스는 고객을 위한 통찰력 가속화를 목표로 이 기술을 활용할 계획이다.
해당 발표에 대한 자세한 사항은 링크에서 확인할 수 있다.
이미지 출처: 구글 블로그
기사는 클로드와 챗gpt를 활용해 작성되었습니다.