• Home
  • News
  • 구글, 제미나이 2.0 공개…실시간 다국어 지원·3D 공간인식까지

구글, 제미나이 2.0 공개…실시간 다국어 지원·3D 공간인식까지

구글, 제미나이 2.0 공개...실시간 다국어 지원·3D 공간인식까지
이미지출처: 구글 공식 유튜브

구글(Google)이 차세대 AI 모델 ‘제미나이(Gemini) 2.0’을 공개했다. 이번 신모델은 멀티모달 기능을 대폭 강화하고 에이전트(Agent) 기능을 탑재해 AI의 새로운 지평을 열 것으로 기대를 모았다.

구글 딥마인드(Google DeepMind)는 제미나이 2.0을 기반으로 범용 AI 어시스턴트 연구 프로토타입인 ‘프로젝트 아스트라(Project Astra)’를 선보였다. 이 프로젝트는 멀티모달 메모리와 실시간 정보 처리 기능을 통해 사용자의 환경을 실시간으로 이해하고 상호작용할 수 있다.

제미나이 2.0의 주요 특징

구글이 공개한 제미나이 2.0 플래시(Flash)는 이전 버전인 1.5 플래시보다 향상된 성능과 빠른 응답 속도를 자랑한다. 특히 1.5 프로(Pro) 대비 2배 빠른 속도로 더 우수한 성능을 제공한다. 이미지, 비디오, 오디오 등 다양한 멀티모달 입력을 지원하며, 텍스트와 이미지 생성, 다국어 음성 변환 기능도 탑재했다. 또한 구글 검색, 코드 실행, 사용자 정의 기능 등 다양한 도구 활용이 가능하다.

새롭게 도입된 딥 리서치(Deep Research) 기능은 복잡한 주제를 탐색하고 보고서를 작성하는 연구 보조 기능을 제공한다. 이 기능은 제미나이 어드밴스드(Gemini Advanced)에서 즉시 사용할 수 있다.

검색 서비스도 크게 강화됐다. AI 오버뷰(AI Overview) 기능이 10억 사용자를 돌파했으며, 제미나이 2.0의 고급 추론 기능으로 복잡한 주제와 다단계 질문 처리가 가능해졌다. 고급 수학 방정식, 멀티모달 쿼리, 코딩 등도 지원한다.

혁신적인 프로젝트들

프로젝트 아스트라(Project Astra)는 다국어 및 혼합 언어 대화가 가능하며, 구글 검색, 렌즈, 지도 등 다양한 도구를 활용할 수 있다. 10분간의 세션 메모리와 이전 대화 기억 기능을 갖추고 있으며, 인간 대화 수준의 지연 시간을 구현했다.

프로젝트 마리너(Project Mariner)는 브라우저 내 정보를 이해하고 추론할 수 있는 기능을 제공한다. 웹보이저 벤치마크에서 83.5%의 높은 성능을 달성했으며, 브라우저 내 탐색 및 작업 수행을 지원한다. 보안을 위해 중요 작업 시 사용자 확인 절차를 포함했다.

개발자들을 위한 쥴스(Jules)는 깃허브(GitHub) 워크플로우와 직접 통합되는 AI 코드 에이전트다. 개발자의 감독 하에 이슈를 해결하고 실행할 수 있는 기능을 제공한다.

게임과 로봇 분야 확장

구글은 제니 2(Genie 2)를 도입해 3D 월드 생성 기능을 선보였다. 슈퍼셀(Supercell)과 협력해 게임 내 AI 에이전트를 테스트하고 있으며, 로봇 공학 분야에서도 공간 추론 능력 적용을 실험하고 있다.

안전성과 책임감 강화

구글은 책임성 및 안전성 위원회(RSC)와 협력해 잠재적 위험을 식별하고 있다. AI 지원 레드팀 접근 방식으로 안전성을 최적화하고, 멀티모달 출력의 안전성 평가 및 훈련을 진행하고 있다. 프로젝트 아스트라와 마리너에는 개인정보 보호를 위한 통제 기능을 구현했다.

향후 계획

구글은 2024년 1월부터 제미나이 2.0을 일반 공개할 예정이며, 검색을 비롯한 주요 서비스에 순차적으로 적용할 계획이다. 데미스 하사비스(Demis Hassabis) 구글 딥마인드 CEO는 “안전하고 책임감 있는 AI 개발을 최우선으로 두고 발전시켜 나갈 것”이라고 강조했다.

해당 기사의 원문은 구글 공식 블로그에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




구글, 제미나이 2.0 공개…실시간 다국어 지원·3D 공간인식까지 – AI 매터스