• Home
  • News
  • 구글, 영상 생성 AI ‘비오2’ 공개…4K 해상도에 영화 촬영 기법 이해도 뛰어나

구글, 영상 생성 AI ‘비오2’ 공개…4K 해상도에 영화 촬영 기법 이해도 뛰어나

구글, 영상 생성 AI '비오2' 공개...4K 해상도에 영화 촬영 기법 이해도 뛰어나
이미지출처: 구글 딥마인드

구글 딥마인드(Google DeepMind)가 16일(현지시간) 최신 영상 생성 AI 모델 ‘비오2(Veo 2)’를 공개했다. 비오2는 다양한 주제와 스타일로 4K 해상도의 고품질 영상을 생성할 수 있으며, 사실적인 움직임과 다양한 카메라 제어 기능을 제공한다. 이용자들은 비디오FX(VideoFX)를 통해 비오2를 직접 체험할 수 있다.

비오2는 단순하고 복잡한 지시사항을 정확하게 수행하며, 실제 물리법칙과 다양한 시각적 스타일을 설득력 있게 구현한다. 향상된 사실성과 충실도를 바탕으로 기존 AI 영상 모델과 비교해 세부 묘사, 사실성, 화질 개선 측면에서 획기적인 발전을 이뤘다.


비오2는 물리학에 대한 이해와 상세한 지시사항을 따르는 능력을 통해 높은 수준의 정확도로 동작을 표현할 수 있다. 특히 영화 촬영 기법에 대한 이해도가 뛰어나 장르, 렌즈, 영화적 효과 등을 지정하면 4K 해상도의 영상을 수 분 길이로 생성할 수 있다. 저각도 추적 샷이나 현미경을 들여다보는 과학자의 클로즈업 샷 등 구체적인 요청에도 충실히 대응한다.


메타가 공개한 무비젠벤치(MovieGenBench) 데이터셋 1,003개의 프롬프트와 영상을 대상으로 한 인간 평가에서 비오2는 전반적인 선호도와 프롬프트 정확도 측면에서 최고 성능을 기록했다. 720p 해상도에서 진행된 비교 평가에서 비오2는 8초, 비디오젠(VideoGen)은 10초, 기타 모델은 5초 길이의 영상을 생성했으며, 평가자들에게는 전체 영상 길이가 제공됐다.

모든 이미지와 영상 생성 모델과 마찬가지로 비오2의 출력물에도 신스ID(SynthID) 워터마크가 보이지 않게 포함되어 있어 AI 생성 여부를 식별할 수 있으며, 이는 허위정보와 잘못된 귀속을 줄이는 데 도움을 준다.

함께 발표된 이마젠3는 더 밝고 구도가 개선된 이미지를 생성할 수 있다. 사실주의부터 인상주의, 추상화, 애니메이션에 이르기까지 다양한 예술 스타일을 더 정확하게 구현한다. 새로운 실험 도구인 휘스크는 사용자가 원하는 주제, 장면, 스타일을 이미지로 입력하거나 생성할 수 있게 해준다. 휘스크는 이마젠3 모델과 제미나이(Gemini)의 시각적 이해 및 설명 기능을 결합했다.

현재 비오2는 구글 랩스의 비디오FX를 통해 이용할 수 있으며, 대기자 명단에 등록할 수 있다. 내년에는 유튜브 쇼츠와 다른 제품으로도 확대될 예정이다.

해당 기사의 원문은 구글 블로그에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




구글, 영상 생성 AI ‘비오2’ 공개…4K 해상도에 영화 촬영 기법 이해도 뛰어나 – AI 매터스