Developing robust assessment in the light of Generative AI developments
생성형 AI, 동영상 제작의 새 지평을 열다
메타(Meta)가 최근 발표한 Movie Gen은 텍스트만으로 고품질 동영상을 생성하고 편집할 수 있는 생성형 AI 모델 시리즈로, 동영상 제작 분야에 혁신을 가져올 것으로 기대를 모으고 있다. 이 모델은 간단한 텍스트 프롬프트만으로 최대 16초 길이의 1080p HD 동영상을 만들어낼 수 있으며, 기존 동영상에 대한 정교한 편집과 개인화된 동영상 생성 기능도 갖추고 있다.
Movie Gen의 핵심은 30B 파라미터 규모의 텍스트-비디오 생성 모델인 ‘Movie Gen Video’다. 이 모델은 1:1, 9:16, 16:9 등 다양한 화면비의 동영상을 생성할 수 있어 실용성이 높다. 연구팀은 약 1억 건의 비디오-텍스트 쌍과 10억 건의 이미지-텍스트 쌍으로 모델을 사전 학습시켰다고 밝혔다.
종합 동영상 제작 도구로서의 Movie Gen
Movie Gen은 단순한 동영상 생성을 넘어 다양한 기능을 제공하는 종합 동영상 제작 도구의 면모를 보여준다. ‘Personalized Movie Gen Video’ 모델을 통해 특정 인물의 이미지를 입력하면 해당 인물이 등장하는 맞춤형 동영상을 생성할 수 있으며, ‘Movie Gen Edit’ 모델은 텍스트 지시만으로 생성된 동영상이나 실제 동영상을 정밀하게 편집할 수 있다.
또한 ‘Movie Gen Audio’ 모델은 동영상에 맞는 고품질 음향 효과와 배경음악을 생성할 수 있어, 전문가 수준의 종합적인 동영상 제작이 가능하다. 연구팀은 이러한 기능들이 현재 상용화된 시스템들을 포함한 기존 모델들보다 우수한 성능을 보인다고 주장했다.
동영상 생성 모델 평가의 새로운 기준 제시
Movie Gen 프로젝트는 동영상 생성 모델을 평가하기 위한 새로운 벤치마크인 ‘Movie Gen Video Bench’도 함께 제안했다. 이 벤치마크는 1000개의 다양한 프롬프트로 구성되어 있으며, 여러 개념과 동작 수준을 포함하고 있어 모델의 성능을 다각도로 평가할 수 있다.
연구팀은 이 벤치마크가 향후 동영상 생성 모델의 성능을 평가하는 데 중요한 역할을 할 것으로 기대하고 있다. 또한 Movie Gen의 생성 결과물을 공개하여 향후 연구에서 쉽고 공정한 비교가 가능하도록 했다.
Movie Gen 프로젝트는 동영상 생성 AI 기술의 빠른 발전 속도를 보여주는 동시에, 이러한 기술이 가져올 변화에 대비해야 할 필요성을 제기하고 있다. 특히 교육 분야에서는 이런 기술이 학생 평가 방식에 미칠 영향에 주목하고 있으며, 새로운 평가 방식의 개발이 필요할 것으로 보인다.
Movie Gen은 AI 기술이 창의적인 콘텐츠 제작 분야에서도 빠르게 발전하고 있음을 보여주는 좋은 사례다. 이러한 기술의 발전은 콘텐츠 제작 방식의 혁신을 가져올 것으로 예상되며, 관련 산업 전반에 큰 변화를 몰고 올 것으로 전망된다.
기사에 인용된 리포트 원문은 링크에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
관련 콘텐츠 더보기