알리바바, 14B 파라미터 영상 생성 AI ‘완2.1’ 오픈소스로 공개

알리바바 클라우드(Alibaba Cloud)가 17일(현지 시간) 첫 번째 프레임-비디오 변환 대규모 AI 모델인 ‘Wan2.1-FLF2V-14B’를 오픈소스로 공개했다. 이 모델은 디지털 아티스트들에게 전례 없는 효율성과 창의적 유연성을 제공할 것으로 기대된다. Wan 팀의 공식 X 계정에 따르면, 이번에 공개된 Wan2.1-FLF2V-14B는 14B 파라미터 규모의 대형 모델로 첫 프레임과 마지막 프레임을 기반으로 비디오를 생성하는 기술을 탑재했다. 특히 이 모델은 데이터 기반 학습과 DiT(Diffusion Transformer) 아키텍처를 활용해 첫 프레임과 마지막 프레임의 조건부 제어 기능을 구현했다.

1/3 🚀Thrilled to introduce Wan2.1-FLF2V-14B – our first 14B-parameter large model for First-Last-Frame to video generation!
Open-source, open-source, open-source!
Empowering digital artists with unprecedented efficiency and creative flexibility. #wan #AIGC #alart pic.twitter.com/QnDik82JFl
— Wan (@Alibaba_Wan) April 17, 2025

“데이터 기반 학습과 DiT 아키텍처를 통해 첫 프레임과 마지막 프레임의 조건부 제어 기능을 구현했습니다. 이를 통해 참조 시각 자료를 완벽하게 복제하고, 정확한 지시 따르기, 부드러운 전환과 현실 세계 물리법칙 준수, 그리고 영화급 720P 출력을 제공합니다,” 라고 Wan 팀은 설명했다. 이 모델은 현재 깃허브(GitHub), 허깅페이스(Huggingface), 모델스코프(Modelscope) 등 다양한 플랫폼에서 다운로드할 수 있다. Wan 팀은 공식 웹사이트(wan.video)를 통해서도 이 기술을 체험할 수 있도록 제공하고 있다.

3월 초 Wan2.1 모델은 모델스코프 플랫폼과 허깅페이스 허브에서 이미 100만 건 이상의 다운로드를 기록했으며, 허깅페이스의 모델 트렌딩 리스트에서 2위, 스페이스 트렌딩 리스트에서는 1위를 차지했다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 이디오그램 생성

기사는 클로드와 챗gpt를 활용해 작성되었습니다.

알리바바, 14B 파라미터 영상 생성 AI ‘완2.1’ 오픈소스로 공개

‘의료계 보안도 AI로’… 클라우드네트웍스, 의료계 AI 보안 솔루션 ‘쿼리파이 AI 허브’ 공개

[AI 매터스 뉴스레터 #118] “서비스 줘도 난리야” AI 숏폼으로 영어 공부 문턱을 낮춘 야나두

웹케시, AI 자금관리 솔루션 ‘브랜치Q’ 공개… “4,000가지 업무 자동화”

서울AI재단, 도쿄도와 도시AI 기반 디지털 혁신 협력 본격화

당구게임으로 진로 찾기? 게임하듯 진로 탐색하는 AI 시스템의 등장

Highlight

오픈AI 이사회 의장 “지금 AI 버블 상태 맞아… 많은 사람들이 큰돈…

오픈AI, 코딩 전용 AI 에이전트 ‘GPT-5-코덱스’ 출시… “7시간 연속 독립 작업…

[AI 매터스 뉴스레터 #116] 나노바나나보다 낫다고? 바이트댄스 AI ‘시드림 4.0’ 사용 가이드

[Q&AI] 최대 30만원 받는 상생페이백… 신청 어떻게?

[Q&AI] 영화 ‘얼굴’ 개봉… 관람객 후기는?