미국 IT전문매체 벤처비트는 새로운 AI 동영상 생성 모델인 ‘피라미드 플로우(Pyramid Flow)’가 출시됐다고 보도했다. 이 모델은 최대 10초 길이의 고품질 동영상을 빠르게 생성할 수 있으며, 완전히 오픈소스로 제공된다.
베이징대학교, 베이징우전대학교, 콰이서우테크놀로지(Kuaishou Technology) 연구진이 공동 개발한 피라미드 플로우는 혁신적인 기술을 활용해 단일 AI 모델로 여러 단계의 영상을 생성한다. 대부분의 단계에서 저해상도 영상을 만들고 최종 단계에서만 고해상도 버전을 저장하는 방식이다.
피라미드 플로우는 ‘피라미드 플로우 매칭(pyramidal flow matching)’이라는 새로운 개념을 기반으로 한다. 이 방법은 동영상 생성 과정의 계산 비용을 대폭 줄이면서도 높은 시각적 품질을 유지한다. 영상 생성 과정을 일련의 ‘피라미드’ 단계로 완성하며, 최종 단계에서만 최고 해상도로 작업한다.
연구진은 아카이브(arXiv)에 제출한 논문 “효율적인 비디오 생성 모델링을 위한 피라미드 플로우 매칭(Pyramidal Flow Matching for Efficient Video Generative Modeling)”에서 이 기술을 상세히 설명했다.
피라미드 플로우는 MIT 라이선스로 공개됐다. 이 라이선스는 상업적 응용, 수정, 재배포를 폭넓게 허용하며 저작권 고지만 유지하면 된다. 이는 개발자와 기업들이 이 모델을 독점 시스템에 통합하는 데 매력적인 옵션이 될 수 있다.
루마AI(Luma AI)와 런웨이(Runway)가 개발자들에게 유료 API를 제공하는 상황에서, 피라미드 플로우는 이들에게 도전장을 내밀 수 있다. 그러나 피라미드 플로우는 아직 완전한 애플리케이션 구축에 적합한 추론 모델을 제공하지 않아, 사용자들은 자체적으로 추론 버전을 호스팅해야 한다.
AI 동영상 생성 시장이 계속 진화하면서 피라미드 플로우의 출시는 런웨이와 루마 같은 독점 서비스와 경쟁할 수 있는 접근성 높은 오픈소스 솔루션으로의 전환을 알린다.
현재로서는 폐쇄형 모델의 비용과 제한을 피하면서도 상용 제품에 버금가는 인상적인 비디오 품질을 제공하는 솔리드한 대안이 될 것으로 보인다.
앞으로 몇 달 동안 개발자와 크리에이터들은 피라미드 플로우의 성장을 주목할 것이다. 추가적인 개선과 최적화 가능성을 고려하면, 이 모델은 비디오 콘텐츠 제작자들에게 필수적인 도구가 될 수 있다. 현재 모든 기업과 연구진은 기술적 우위와 사용자 확보를 위해 치열한 경쟁을 벌이고 있다.
한편, 2024년 2월에 처음 공개된 오픈AI(OpenAI)의 소라(Sora)는 일부 초기 알파 사용자와의 협업 외에는 아직 모습을 드러내지 않고 있다.
벤처비트의 기사 원문은 링크에서 확인할 수 있다.
관련 콘텐츠 더보기