“영상계의 나노바나나 프로 나왔다”… 클링, 멀티모달 비디오 생성 모델 ‘Kling O1’ 공개

중국 AI 기업 클링(Kling) AI가 세계 최초로 통합 멀티모달 비디오 생성 모델인 ‘비디오 O1’을 정식 출시했다. 1일(현지 시각) 클링이 발표한 자료에 따르면, 비디오 O1은 텍스트 투 비디오, 이미지 참고 생성, 비디오 편집, 스타일 변환 등 18가지 기능을 하나의 모델에 통합한 것이 특징이다. 사용자는 “행인 삭제”, “낮을 해질 무렵으로 변경” 같은 간단한 텍스트 명령만으로 복잡한 영상 편집 작업을 수행할 수 있다. 기존에는 각각의 작업마다 별도 모델이나 도구가 필요했지만, 이제 원스톱으로 창작 과정을 완료할 수 있게 됐다.

특히 비디오 일관성 문제를 해결한 점이 눈에 띈다. 다시각 이미지를 통한 주체 생성을 지원해 카메라가 어떻게 움직이든 캐릭터나 소품의 특징을 일관되게 유지한다. 여러 피사체를 동시에 사용하는 복잡한 장면에서도 각각의 특징을 독립적으로 유지할 수 있다.

클링 AI 팀이 자체 평가한 결과, 비디오 O1은 이미지 참고 작업에서 구글 비오(Veo) 3.1 대비 247%의 승률을 기록했다. 지시 변환 작업에서는 런웨이(Runway) 알레프(Aleph) 대비 230%의 우위를 보였다. 피사체 참고, 이미지와 피사체 동시 참고, 비디오 카메라 무빙 참고 등은 비디오 O1만이 지원하는 독보적인 기능이다.

비디오 O1은 3초에서 10초까지 자유로운 길이의 영상 생성을 지원하며, 서로 다른 기능을 조합해 한 번에 다양한 편집 작업을 수행할 수 있다.

해당 모델에 대한 자세한 사항은 클링AI 홈페이지에서 확인 가능하다.

이미지 출처: 클링AI

“영상계의 나노바나나 프로 나왔다”… 클링, 멀티모달 비디오 생성 모델 ‘Kling O1’ 공개

저커버그, 프라다 패션쇼 전면 착석…메타 AI 안경 명품 버전 나오나

구글, 이미지 생성 모델 ‘나노 바나나 2’ 공개…4K 해상도에 속도까지 잡았다

잭 도시, 직원 절반 잘랐다…”당신 회사도 곧 같은 길 걷게 될 것”

AI 데이터센터의 ‘친환경’ 선언, 전력망을 들여다보면 허상이다

챗GPT가 강박장애 환자를 더 아프게 만든다, ‘안심 로봇’의 위험한 진실

Highlight

“AI 이미 포화됐다고?” 전 세계 84%는 AI를 한 번도 써본 적…

AI 전쟁 시뮬레이션, 가장 먼저 핵 투하를 지시한 AI 모델은?

앤트로픽 “중국 AI 3사, 가짜 계정 2만4천 개로 클로드 기술 훔쳐갔다”

제미나이, 안드로이드에서 택시 호출·음식 배달 주문까지 자동화한다… 한국서도 적용

구글, 이미지 생성 모델 ‘나노 바나나 2’ 공개…4K 해상도에 속도까지 잡았다