구글 딥마인드, 제미나이 2.0 기반 로보틱스 모델 공개

구글 딥마인드(Google DeepMind)가 AI를 물리적 세계로 확장하는 ‘제미나이 로보틱스(Gemini Robotics)’를 공개했다. 제미나이 2.0을 기반으로 한 이 기술은 로봇이 실제 환경에서 작업을 수행할 수 있게 한다. 구글 딥마인드는 12일(현지 시간) 자사 블로그를 통해, 제미나이 2.0을 기반으로 한 두 가지 새로운 AI 모델을 발표했다. 첫 번째는 제미나이 로보틱스로, 시각-언어-행동(VLA) 모델에 물리적 행동 기능을 추가해 로봇을 직접 제어할 수 있게 했다. 두 번째는 제미나이 로보틱스-ER로, 향상된 공간 이해 능력을 갖춘 모델이며 로보틱스 전문가들이 기존 컨트롤러와 연결할 수 있도록 설계됐다.

제미나이 로보틱스는 세 가지 핵심 특성을 갖추고 있다. 첫째, 다양한 상황에 적응하고 이전에 접하지 않은 작업도 수행할 수 있는 범용성을, 둘째, 일상 언어로 된 명령을 이해하고 환경 변화에 빠르게 반응하는 상호작용성을, 셋째, 종이접기나 지퍼백에 간식 담기 같은 섬세한 조작 작업을 수행할 수 있는 정교함을 갖추고 있다. 구글 딥마인드에 따르면 이 모델은 기존 최첨단 VLA 모델보다 평균 2배 이상의 성능을 보인다고 한다.

제미나이 로보틱스는 알로하 2(ALOHA 2), 프랑카(Franka) 팔 기반 로봇 등 다양한 형태의 로봇에 적용할 수 있도록 설계됐다. 구글 딥마인드는 앱트로닉(Apptronik)과 협력해 아폴로(Apollo) 휴머노이드 로봇을 개발 중이라고 발표했다. 구글 딥마인드는 AI 로보틱스의 발전과 함께 안전성 연구도 적극적으로 병행하고 있다. 충돌 회피, 접촉력 제한 등 물리적 안전 조치를 마련했으며, 아이작 아시모프의 로봇 3원칙에서 영감을 받은 ‘로봇 헌법’을 개발했다. 또한 학계와 산업계를 대상으로 로보틱스 안전 연구용 데이터셋을 공개했다. 구글 딥마인드는 어질 로봇, 보스턴 다이나믹스 등 신뢰할 수 있는 테스터들과 함께 이 기술을 더욱 발전시킬 계획이다.

해당 기사 원문은 링크에서 확인할 수 있다.

이미지출처: 구글 딥마인드

기사는 클로드와 챗GPT를 활용해 작성되었습니다.