구글 크롬 브라우저에 통합된 제미나이(Gemini) AI 어시스턴트가 초기 버전으로 출시됐다. 이 기능은 웹 탐색 중 화면의 콘텐츠를 ‘볼 수 있는’ 능력을 갖추고 있어 구글의 에이전틱(agentic) AI 전략의 첫 단계로 보인다. 더버지(The Verge)는 지난 26일(현지 시간) 사용 후기를 기사로 게재했다. 새롭게 통합된 제미나이는 크롬 브라우저 우측 상단의 버튼을 클릭하면 바로 대화를 시작할 수 있다. 기존 웹앱에 접속할 필요 없이 브라우저 내에서 직접 AI 어시스턴트를 활용할 수 있다는 것이 가장 큰 특징이다.
현재 이 기능은 제미나이 AI 프로(AI Pro) 또는 AI 울트라(AI Ultra) 구독자나 크롬의 베타, 개발자, 카나리 버전 사용자만 접근할 수 있다. 제미나이 브라우저 통합의 주요 기능 중 하나는 웹페이지 콘텐츠 요약이다. 더버지의 기사나 게임 관련 뉴스를 요약할 수 있으며, 닌텐도 스위치 온라인 서비스에 추가된 게임보이 게임, 엘든 링(Elden Ring) 영화 각색, 밸브(Valve)의 스팀덱(Steam Deck) 업데이트 등을 정확히 식별했다.
그러나 이 AI 어시스턴트는 현재 페이지에서 직접 볼 수 있는 내용만 분석할 수 있다. 예를 들어 댓글 섹션 요약을 원한다면 먼저 해당 섹션을 확장해야 한다. 여러 탭을 이동할 때 제미나이도 함께 따라가지만, 한 번에 하나의 탭 정보만 처리할 수 있다. 타이핑 대신 음성으로 소통하고 싶다면 대화 상자 우측 하단의 ‘라이브(Live)’ 기능을 선택해 음성으로 질문하고 응답을 들을 수 있다.
유튜브 영상 시청 중에 이 기능이 특히 유용했다. 욕실 리모델링 영상을 보면서 “그가 어떤 도구를 사용하고 있나요?”라고 물었을 때, 제미나이는 “나무 조각을 고정하기 위해 네일건을 사용하고 있는 것 같습니다”라고 정확히 응답했다. 다른 영상에서는 마더보드의 커패시터(capacitor)와 유튜버가 이를 제거하기 위해 사용한 핀셋과 열풍 도구를 정확히 식별했다.
더버지 기자가 가장 유용하게 느낀 기능은 유튜브 영상에서 레시피를 추출하는 것이었다. 직접 메모하거나 설명란에서 링크를 찾을 필요 없이 AI가 자동으로 정보를 정리해준다. 또한 아마존 검색 페이지에서 방수 가방을 찾아내는 데도 도움이 됐다. 그러나 제미나이의 응답이 항상 일관적인 것은 아니었다. 미스터비스트(MrBeast)가 마야 고대 도시를 탐험하는 영상에서 그의 위치를 물었을 때 첫 응답에서는 “실시간 정보에 접근할 수 없어 미스터비스트의 정확한 현재 위치를 알 수 없다”고 했지만, 다시 물었을 때는 영상 설명에 나온 대로 “멕시코”라고 답했다.
또한 크롬의 작은 팝업 창에서 제미나이의 긴 응답을 보는 것이 불편할 수 있다. 창을 확장할 수 있지만 13인치 맥북 에어에서는 여전히 공간이 제한적이다. AI의 주요 장점 중 하나는 빠르고 간결한 답변을 제공하는 것인데, 특별히 요청하지 않으면 항상 그렇지는 않았다.
이런 초기 단계의 문제점에도 불구하고, 구글이 크롬의 제미나이 통합을 단순한 질문과 답변을 넘어 확장할 가능성이 크다. 구글은 AI를 ‘에이전틱’하게 만들어 사용자를 대신해 작업을 수행하게 하려는 계획을 가지고 있으며, 크롬의 제미나이가 이러한 기능을 도입할 준비가 되어 있는 것으로 보인다. 예를 들어 레스토랑 메뉴를 요약한 후에는 픽업 주문을 하도록 요청하고 싶었지만, 현재는 이런 작업을 수행할 수 없다. 미래에는 여행 연구와 관련된 페이지를 북마크하거나 다양한 레시피 유튜브 영상을 ‘나중에 보기’ 목록에 저장하는 기능도 가능해질 것으로 예상된다.
구글은 제미나이 앱에 ‘프로젝트 마리나(Project Mariner)’의 ‘에이전트 모드(Agent Mode)’를 도입하여 한 번에 최대 10개의 작업을 관리하고 웹을 검색할 수 있게 할 계획이다. 언젠가는 이러한 기능들이 크롬의 제미나이에도 적용될 가능성이 높다.
해당 기사의 원문은 링크에서 확인할 수 있다.