Search

‘AGI 향한 핵심 진전’… 구글, 실시간 메타버스 생성 가능 범용 모델 ‘지니 3’ 공개

구글, 실시간 상호작용 가능한 범용 모델 ‘제니 3’ 공개… AGI 향한 핵심 진전
이미지 출처: 구글 딥마인드

구글 딥마인드(Google DeepMind)가 텍스트 프롬프트만으로 실시간 상호작용이 가능한 세계를 생성하는 범용 세계 모델 ‘지니3(Genie 3)’를 공개했다고 5일(현지시간) 발표했다. 지니3는 초당 24프레임으로 구동되며 720p 해상도에서 몇 분간 일관성을 유지하는 동적 세계를 생성한다. 사용자가 실시간으로 탐색하고 상호작용할 수 있는 것이 특징이다.


주요 기능으로는 물리적 특성 모델링, 자연 세계 시뮬레이션, 애니메이션과 판타지 구현, 다양한 위치와 역사적 배경 탐험이 가능하다. 화산 지역 탐험부터 베니스 운하 항해, 심해 탐험, 일본 선 정원 체험까지 광범위한 환경을 제공한다. 특히 ‘프롬프트 가능한 세계 이벤트’ 기능을 통해 날씨 조건 변경이나 새로운 객체 도입 등 텍스트 명령으로 생성된 세계를 실시간으로 변화시킬 수 있다.

구글 딥마인드는 3D 가상 환경용 범용 에이전트인 시마(SIMA)와의 호환성 테스트도 진행했다. 지니3가 일관성을 유지해 에이전트가 더 복잡한 목표를 달성할 수 있게 됐다고 설명했다. 현재 제한된 행동 공간, 다중 에이전트 상호작용 모델링의 어려움, 현실 세계 위치의 부정확한 표현, 제한적인 상호작용 지속 시간 등이 한계로 지적된다.

구글 딥마인드는 안전성과 책임감 있는 개발을 위해 소수의 학계 인사와 창작자들에게만 조기 접근을 제공하는 제한된 연구 미리보기로 지니3를 공개했다. 향후 교육, 훈련, 에이전트 성능 평가 등 다양한 분야에 활용될 것으로 기대된다고 밝혔다.

해당 모델에 대한 자세한 사항은 구글 딥마인드 블로그에서 확인 가능하다.

이미지 출처: 구글 딥마인드




‘AGI 향한 핵심 진전’… 구글, 실시간 메타버스 생성 가능 범용 모델 ‘지니 3’ 공개 – AI 매터스 l AI Matters