구글(Google)이 제미나이 어드밴스드(Gemini Advanced)와 위스크(Whisk)에 인공지능 비디오 생성 기능을 추가했다. 구글 원 AI 프리미엄(Google One AI Premium) 구독자들은 이제 텍스트 프롬프트만으로 8초 길이의 고해상도 영상을 만들 수 있게 되었다.
구글 블로그에 따르면, 제미나이 어드밴스드 사용자들은 최첨단 비디오 모델인 ‘비오 2(Veo 2)’를 통해 텍스트 기반 프롬프트를 동적인 비디오로 변환할 수 있게 되었다. 구글 랩스(Google Labs)는 또한 위스크를 통해서도 비오 2를 사용할 수 있도록 했는데, 위스크는 텍스트와 이미지 프롬프트를 모두 사용하여 새로운 이미지를 만들고 이를 비디오로 애니메이션화할 수 있는 생성형 AI 실험 플랫폼이다.
비오 2는 비디오 생성 기술의 큰 진전을 보여주며, 영화적 사실감이 있는 고해상도의 상세한 비디오를 제작하도록 설계되었다. 실제 세계의 물리학과 인간의 움직임을 더 잘 이해함으로써, 다양한 주제와 스타일에 걸쳐 유동적인 캐릭터 움직임, 사실적인 장면, 더 세밀한 시각적 디테일을 제공한다.
비디오를 생성하려면 제미나이에서 모델 드롭다운에서 비오 2를 선택하면 된다. 이 기능은 720p 해상도의 8초 길이 비디오 클립을 16:9 가로 형식의 MP4 파일로 제공한다. 매월 생성할 수 있는 비디오 수에는 제한이 있지만, 사용자가 한도에 가까워지면 알림을 받게 된다.
제미나이로 비디오를 만드는 방법은 간단하다. 짧은 이야기, 시각적 개념, 또는 특정 장면 등 만들고 싶은 장면을 설명하면 제미나이가 아이디어를 영상으로 구현해준다. 설명이 상세할수록 최종 비디오에 대한 통제력이 높아진다. 이를 통해 현실에 존재하지 않는 조합을 상상하거나, 현실주의부터 판타지까지 다양한 시각적 스타일을 탐색하거나, 짧은 시각적 아이디어를 빠르게 서술하는 등 재미있는 창의적 가능성이 열린다.
창작의 가장 좋은 점 중 하나는 다른 사람들과 공유하는 것이다. 모바일에서 비디오를 공유하는 것은 간단하다. 공유 버튼을 탭하면 틱톡(TikTok)이나 유튜브 쇼츠(YouTube Shorts)와 같은 플랫폼에 짧은 비디오를 빠르게 업로드할 수 있다. 비디오 생성 기능은 오늘부터 시작해 앞으로 몇 주에 걸쳐 전 세계 제미나이 어드밴스드 사용자들에게 웹과 모바일을 통해 점진적으로 배포될 예정이다. 이 기능은 제미나이가 지원하는 모든 언어에서 구글 원 AI 프리미엄 구독자들이 사용할 수 있다.
작년 12월에 소개된 위스크는 텍스트와 이미지 프롬프트를 모두 사용하여 새로운 아이디어를 빠르게 탐색하고 시각화하는 데 도움을 주는 구글 랩스의 실험이다. 오늘부터 위스크 애니메이트(Whisk Animate)를 통해 생성한 이미지에 생명을 불어넣을 수 있게 되었다. 위스크 애니메이트는 비오 2를 사용하여 이미지를 생생한 8초 길이의 비디오로 변환할 수 있게 해준다. 이 기능은 오늘부터 전 세계 구글 원 AI 프리미엄 구독자들이 사용할 수 있으며, 구독자들은 labs.google/whisk에서 시도해볼 수 있다.
구글은 비디오 생성을 안전한 경험으로 만들기 위해 중요한 조치를 취했다. 여기에는 정책을 위반하는 콘텐츠 생성을 방지하기 위한 광범위한 레드 티밍(red teaming)과 평가가 포함된다. 또한 비오 2로 생성된 모든 비디오에는 각 프레임에 내장된 디지털 워터마크인 신스ID(SynthID)가 표시되어 비디오가 AI로 생성되었음을 나타낸다.
제미나이의 출력물은 주로 사용자 프롬프트에 의해 결정되며, 다른 생성형 AI 도구와 마찬가지로 일부 개인이 부적절하다고 생각할 수 있는 콘텐츠를 생성하는 경우가 있을 수 있다. 구글은 계속해서 좋아요/싫어요 버튼을 통한 사용자 피드백을 듣고 지속적인 개선을 할 것이라고 밝혔다. 구글은 구글 원 AI 프리미엄 구독자들이 제미나이 앱과 위스크에서 비디오를 만드는 것을 즐기기를 바란다고 전했다.
해당 업데이트에 대한 자세한 사항은 링크에서 확인할 수 있다.
이미지 출처: 구글
기사는 클로드와 챗gpt를 활용해 작성되었습니다.