• Home
  • News
  • 미드저니, AI 비디오 생성 모델 ‘V1’ 출시… AI 영상도 제패할까

미드저니, AI 비디오 생성 모델 ‘V1’ 출시… AI 영상도 제패할까

미드저니, 첫 AI 비디오 생성 모델 ‘V1’ 출시… AI 영상 경쟁 본격 돌입
이미지 출처: 미드저니

AI 이미지 생성 플랫폼 미드저니(Midjourney)가 6월 18일(현지 시간) 첫 번째 비디오 모델인 ‘V1 비디오 모델’을 전체 커뮤니티에 공개했다고 발표했다. 미드저니 창립자 데이비드(David)는 공식 발표를 통해 “지난 몇 년간 이미지에 집중해 왔지만, 이 기술의 최종 목표는 실시간 오픈월드 시뮬레이션이 가능한 모델”이라고 밝혔다. 그는 “실시간으로 이미지를 생성하고, 3D 공간에서 자유롭게 움직이며, 환경과 캐릭터들도 움직이고, 모든 것과 상호작용할 수 있는 AI 시스템을 상상해 보라”고 설명했다.


이러한 목표 달성을 위해 미드저니는 단계별 접근법을 택했다. 먼저 시각적 요소(첫 번째 이미지 모델), 이미지에 움직임 부여(비디오 모델), 공간 이동 능력(3D 모델), 그리고 실시간 처리(실시간 모델) 등의 구성 요소들을 개별적으로 구축한 후 이를 통합된 단일 시스템으로 결합할 계획이다.

오늘 공개된 비디오 모델은 ‘이미지-투-비디오(Image-to-Video)’ 방식으로 작동한다. 사용자는 기존과 같이 미드저니에서 이미지를 생성한 후 ‘애니메이트(Animate)’ 버튼을 눌러 이를 동영상으로 변환할 수 있다. 이 시스템은 두 가지 애니메이션 설정을 제공한다. ‘자동’ 설정은 시스템이 모션 프롬프트를 자동 생성해 객체들을 움직이게 하며, ‘수동’ 설정은 사용자가 직접 움직임과 장면 전개 방식을 설명할 수 있다.

또한 ‘고동작(High Motion)’과 ‘저동작(Low Motion)’ 두 가지 모션 설정도 선택할 수 있다. 저동작은 카메라가 대부분 고정된 상태에서 피사체가 천천히 또는 의도적으로 움직이는 주변적 장면에 적합하지만, 때로는 전혀 움직이지 않는 결과물이 나올 수 있다. 고동작은 피사체와 카메라 모두 활발하게 움직이는 장면에 최적화되어 있지만, 과도한 움직임으로 인해 부자연스러운 결과가 나올 수 있다.

생성된 비디오는 약 4초씩 최대 4번까지 확장할 수 있으며, 미드저니 외부에서 업로드한 이미지도 애니메이션화할 수 있다. 사용자는 이미지를 프롬프트 바에 드래그한 후 ‘시작 프레임’으로 표시하고 모션 프롬프트를 입력하면 된다.

가격 정책 면에서 미드저니는 비디오 작업에 대해 이미지 작업보다 약 8배 높은 요금을 책정했다. 각 작업당 4개의 5초 영상이 생성되며, 이는 비디오 1초당 “이미지 1개 분량의 비용”에 해당한다고 설명했다. 회사 측은 이 가격이 기존 시장 대비 25배 이상 저렴하다고 강조했다.

현재는 웹 버전에서만 서비스가 제공되며, 프로(Pro) 구독자 이상에게는 비디오 릴랙스(Relax) 모드도 테스트 중이다. 미드저니는 향후 한 달간 사용자들의 기술 활용 패턴을 관찰하며 지속 가능한 사업 운영을 위해 가격과 서비스를 조정할 예정이라고 밝혔다. 또한 비디오 모델 구축 과정에서 얻은 많은 학습 내용들이 앞으로 몇 주 또는 몇 달 내에 이미지 모델에도 반영될 것이라고 예고했다.


해당 모델에 대한 자세한 사항은 미드저니 홈페이지에서 확인 가능하다.

이미지 출처: 미드저니




미드저니, AI 비디오 생성 모델 ‘V1’ 출시… AI 영상도 제패할까 – AI 매터스 l AI Matters