• Home
  • 뉴스
  • 구글 연례 개발자 컨퍼런스 구글 I/O 2024 총정리 

구글 연례 개발자 컨퍼런스 구글 I/O 2024 총정리 

Image Generated by Midjourney
Image Generated by Midjourney

지난 5월 14일 개최된 구글 연례 개발자 컨퍼런스의 대부분은 AI로 점철되었다. 최근 검색 시장 점유율이 주춤하고 있는 가운데 챗GPT의 급부상으로 그 영향이 더 커질 것을 대비한 전략과 함께 다양한 업데이트들이 눈에 띈다. 아래는 구글의 CEO 순다르 피차이(Sundar Pichai) 키노트에서 공개된 다양한 AI 관련 업데이트들을 요약 정리한 내용이다. 

출처: 구글 공식 블로그 

제미나이의 시대 

구글은 지난해 I/O에서 제미나이를 발표한 뒤 지속적으로 업그레이드했고, 현재 150만 명 이상의 개발자들이 다양한 도구에서 이 모델을 활용하고 있다. 개발자들은 Gemini를 사용해 코드 디버깅, 새로운 인사이트 발견, 차세대 AI 애플리케이션 구축 등의 작업을 수행하고 있다. 구글은 검색, 사진, 작업 공간, 안드로이드 등 다양한 제품에 Gemini의 혁신 기능을 탑재하며 모든 사용자가 AI의 혜택을 누릴 수 있도록 노력하고 있다. 

검색에서의 AI 확대 적용 

구글이 자사의 최신 AI 기술 ‘제미니’를 활용해 혁신적인 검색 경험을 선보였다. 구글은 새로운 AI 검색 기능을 발표가 있었던 5월 14일 주에 미국에서 먼저 출시하고, 점차 글로벌 지역으로 확대할 계획이라고 밝혔다. 

새로운 AI 검색 기능의 핵심은 ‘사진에 질문하기(Ask Photos)’ 기능이다. 구글 포토에서 사용자는 사진에 직접 질문할 수 있게 됐다. 예를 들어 주차장에서 차량 번호판 번호를 잊었다면, 사진에 ‘이 차 번호판은 뭐지?’라고 물으면 AI가 번호판을 인식해 번호를 알려준다. 

AI는 단순 검색을 넘어 사진 속 다양한 상황을 파악하고 연관 정보를 제공한다. 사용자가 “루시아는 언제 수영을 배웠나요?”라고 묻으면, AI가 수영장에서의 모습, 수영 증명서 등을 인식해 대답해준다. 나아가 “루시아의 수영 실력이 어떻게 발전했는지 보여주세요”라는 질문에도 대응할 수 있다. 

구글은 향후 포토에서 AI 기능을 더욱 강화할 계획이라고 밝혔다. 이를 통해 사용자들은 보다 쉽고 편리하게 과거 추억을 되새기고, 사진 속 다양한 정보를 찾아볼 수 있게 될 전망이다. 

출처: 구글 공식 블로그 

제미나이 1.5 Pro: 더욱 강력해진 성능과 확장된 컨텍스트 

출처: 구글 공식 블로그 

제미나이 1.5 Pro는 100만 개 토큰을 처리할 수 있는 능력을 갖추고 있으며, 번역, 코딩, 추론 등 다양한 분야에서 품질을 개선했다. 이제 전 세계 모든 개발자가 이 개선된 버전을 사용할 수 있으며, 제미나이 Advanced에서는 100만 개의 컨텍스트를 35개 언어로 지원한다. 또한 200만 개 토큰까지 처리 가능한 버전도 비공개 미리보기로 제공될 예정이다. 

다중 데이터 처리(multimodality)와 장문 맥락(long contenxt) 분석 기술이 융합된 제미나이는 구글 워크스페이스에서 획기적인 AI 경험을 제공할 전망이다. 예를 들면, 구글 메일에서는 자녀 학교에서 온 메일과 첨부파일을 제미니가 요약해준다. 중요 내용과 액션 아이템만 간단히 확인할 수 있어 업무 효율이 크게 높아질 것으로 보인다. 

구글 밋에서 열린 회의 영상도 제미나이가 주요 부분을 추려 하이라이트로 제공한다. 예를 들어 자원봉사자를 모집하는 안건이 있었다면, 제미나이가 이를 감지해 관련 내용을 요약하고 답변 초안까지 만들어준다. 

제미나이는 텍스트뿐 아니라 이미지, 영상 등 다양한 데이터를 분석할 수 있는 다중 양식 기술과 장문 맥락 이해 기술을 갖췄다. 이를 통해 구글 워크스페이스에서 보다 지능적이고 실용적인 AI 기능을 활용할 수 있게 된다. 관련 신규 기능은 현재 워크스페이스 랩스에서 미리 체험 가능하며, 구글은 점진적으로 정식 출시할 계획이라고 밝혔다. 

AI 에이전트: 사용자를 위한 지능형 시스템 

출처: 구글 공식 블로그

구글은 AI 에이전트를 통해 사용자를 위한 지능형 시스템을 구축하고 있으며, 쇼핑, 이사 등 다양한 분야에서 사용자의 복잡한 작업을 자동화하고 지원하는 것을 목표로 한다. 

구글은 AI 에이전트가 쇼핑 과정에서 반품 업무를 자동화할 수 있다고 설명했다. 에이전트가 이메일에서 영수증과 주문번호를 찾아 반품 양식을 작성하고, 배송업체 픽업까지 예약해준다. 보다 복잡한 예로, 이사 가는 상황을 가정했다. AI 에이전트와 구글 크롬 브라우저가 협력해 새 거주지 주변 생활 정보를 수집하고, 새 주소로 각종 웹사이트 정보를 업데이트하는 등 이사 준비 업무를 대행한다. 

구글은 “AI 에이전트가 사용자를 대신해 미리 생각하고 추론하며 계획을 수립하는 지능형 시스템”이라며 “일상생활에서 이런 시스템의 활용 사례가 많을 것”이라고 기대했다. 다만 프라이버시와 보안 문제에 유의해야 한다고 덧붙였다. 구글은 “비공개적이고 안전한 방식으로 AI 에이전트 경험을 설계하는 데 힘쓰고 있다”고 강조했다. 

새로운 지평을 여는 제미나이 1.5 플래시 

AI의 잠재력을 최대한 현실화시키기 위해 구글 딥마인드 팀은 꾸준히 노력해왔다. 개발팀으로부터 더 빠르고 비용 효율적인 모델이 필요하다는 피드백을 받아 일상생활에서 유용하게 활용할 수 있는 제미나이 1.5 플래시를 발표했다. 

제미나이 1.5 플래시는 기존 1.5 프로 버전에 비해 가볍고 대기시간과 비용이 적게 드는 모델이다. 개발자들의 요구를 반영해 저비용 고효율 작업에 최적화됐다. 5월 14일부터 AI 스튜디오와 버텍스 AI에서 사용이 가능하다. 

뿐만 아니라, 구글은 ‘프로젝트 아스트라(Project Astra)’를 통해 일상생활에서 활용 가능한 범용 AI 에이전트를 만들고 있다. 이 에이전트는 다중 모드 이해와 실시간 대화 기능을 갖출 예정이다. 

구글 딥마인드 팀은 비디오와 이미지 생성 분야에서도 진전을 이뤘다. 비전 AI 모델인 비오(Veo)와 이마젠3(Imagen3)를 새롭게 선보였다. 또한 책임감 있는 AI 혁신을 위한 오픈 모델 ‘젬마 2.0(Gemma 2.0)’도 공개했다. 

Trillium: 6세대 TPU로 AI 혁신 가속화 

구글은 AI 인프라에도 막대한 투자를 진행하고 있으며, 6세대 TPU인 트릴리움(Trillium)을 비롯한 최첨단 기술을 통해 AI 혁신을 가속화하고 있다. 트릴리움은 구글이 자체 개발한 최신 AI 전용 칩으로, 이전 세대 TPU 대비 4.7배 높은 컴퓨팅 성능을 자랑한다. 

구글은 2024년 말부터 트릴리움 칩을 클라우드 고객에게 제공할 예정이다. 이를 통해 고객들이 보다 복잡한 AI 모델을 효율적으로 개발하고 운영할 수 있을 것으로 기대된다. 

트릴리움 외에도 구글은 지난달 발표한 ARM 기반 CPU ‘액시온’과 Nvidia 최신 GPU ‘블랙웰’을 함께 공급해 모든 AI 워크로드를 지원한다는 계획이다. AI 전용 칩과 범용 CPU/GPU 간 시너지를 높여 업계 최고 수준의 AI 컴퓨팅 성능을 제공하겠다는 것이다. 

아울러 구글은 액체 냉각 기술과 전세계 네트워크 등 탄탄한 인프라 기반에서 ‘AI 하이퍼 컴퓨터’를 구축해 나간다는 청사진도 제시했다. 혁신적인 AI 기능 개발을 위해 필요한 역량을 지속 확충해 나가겠다는 포부를 밝힌 것이다. 

구글 검색: 생성형 AI 기반의 새로운 검색 경험 

출처: 구글 공식 유튜브 채널 

구글은 검색 기능을 혁신하여 사용자들이 더욱 쉽고 편리하게 정보를 찾을 수 있도록 돕고 있다. 음성, 이미지, 심지어 허밍으로도 검색이 가능하며, ‘Circle to Search’ 기능을 통해 관심 있는 상품을 쉽게 찾아볼 수 있다. 제미나이 시대의 구글 검색은 생성형 AI를 기반으로 사용자의 호기심을 충족시키는 가장 흥미로운 장이 될 것이다.  

Live: 음성으로 제미나이와 대화하는 새로운 경험 

구글은 제미나이와 음성으로 대화할 수 있는 새로운 기능인 Live를 발표했다. 또한 올해 말에는 제미나이 Advanced에 200만 개의 토큰을 지원하여 비디오 및 긴 코드와 같은 대용량 파일을 업로드하고 분석할 수 있도록 할 예정이다. 

안드로이드: 제미나이를 통한 새로운 AI 경험 

사진 출처: 구글 공식 블로그 

구글은 수십억 명의 안드로이드 사용자에게 제미나이를 더욱 깊이 통합하여 언제 어디서나 AI 비서의 도움을 받을 수 있도록 할 계획이다. 또한 최신 온디바이스 모델인 제미나이 Nano with Multimodality를 통해 텍스트, 이미지, 오디오 및 음성을 처리하여 개인 정보를 보호하면서 새로운 경험을 제공한다. 

AI에 대한 책임감 있는 자세 

구글은 생성형 기술의 도전 과제를 해결하고 책임감 있게 AI 생성 콘텐츠를 사용하도록 여러 안전 테스트와 필터를 적용했다. 모델을 개선하기 위해 알파고와 같이 구글 딥마인드의 혁신을 활용하는 AI 기반 레드팀이라는 최첨단 기술을 개발하고 있다. 또한, AI로 생성 이미지, 오디오, 텍스트, 비디오에 디지털 워터마크를 삽입해 더 쉽게 식별할 수 있게 해주는 도구인 SynthID를 텍스트와 비디오 두 가지 형식으로 확장 도입했다. 

Google Keynote (Google I/O ‘24) 풀버전 바로 보기

Google Keynote (Google I/O ‘24)




구글 연례 개발자 컨퍼런스 구글 I/O 2024 총정리  – AI 매터스 l AI Matters