출처: 비두 홈페이지
중국 스타트업 센슈(Shengshu AI)가 오픈AI의 ‘소라(Sora)’에 대응하는 자사의 텍스트 to 비디오 생성형 AI 서비스인 ‘비두(Vidu)’를 공식적으로 오픈했다. 사우스차이나모닝포스트 보도에 따르면 지난 30일 비두가 전세계 누구나 ‘비두’ 플랫폼을 통해 영상을 생성할 수 있도록 서비스를 공개했다. 중국어와 영어 텍스트 프롬프트를 모두 지원하는 것이 특징이다.
베이징에 본사를 둔 이 회사는 오픈AI가 자사의 비디오 생성 모델 ‘소라’ 발표한 지 두 달 만인 4월에 ‘비두’를 처음 선보였으며, 생성된 영상 샘플을 공개했다. ‘비두’는 텍스트 to 비디오 방식으로 영상을 생성하는 중국의 첫 번째 영상 생성형 AI 모델이다. 센슈는 ‘비두’가 비디오 생성형 AI 서비스 중 가장 빠른 속도인 30초 만에 4초짜리 클립을 생성할 수 있다고 밝혔다.
‘비두’는 공식 웹사이트에서 이용이 가능하며 서비스에 등록한 사용자들은 4초 또는 8초 길이의 영상 클립을 생성할 수 있다.
센슈 측은 확산(Diffusion) 모델과 트랜스포머 아키텍처(Transformer Architecture)를 통합한 ‘유니버설 비전 트랜스포머(U-ViT)’라는 시각 변환 모델 아키텍처를 기반으로 한다고 밝혔다. 이는 ‘소라’와 매우 흡사한 방식이다.
이번에 공개된 시범 서비스의 경우 텍스트 to 비디오 기능에 캐릭터 to 비디오 기능이 추가됐다. 사람 이미지나 애니메이션 캐릭터 이미지를 업로드하고 간단한 텍스트 프롬프트를 입력하면 영상이 생성되는 방식이다.
센슈는 이 기능을 통해 사용자가 실제 인물이나 특정 애니메이션 캐릭터의 이미지를 활용해 생동감 있는 캐릭터를 영상으로 만들 수 있다고 밝혔다.
출처: 비두 홈페이지
비두의 홈페이지에 방문하면 비디오 생성 체험이 가능하다.
관련 콘텐츠 더보기