콰이쇼우(Kuaishou, 快手)가 15일(현지 시간) ‘Kling AI 2.0’ 행사에서 혁신적인 AI 영상 생성 모델 ‘Kling AI 2.0 Master’를 공식 출시했다. 이번 모델은 기존 버전보다 대폭 개선된 성능을 자랑하며, 텍스트나 이미지에서 영상을 생성하는 기능에서 세계 최고 수준의 역량을 보여주고 있다.
지난해 6월 처음 출시된 클링 AI는 10개월 동안 20번의 반복 개발과 9번의 마일스톤 릴리스를 거쳐 지속적으로 성능을 향상시켜왔다. 해외 테스트 사이트인 ‘아티피셜 애널리시스(Artificial Analysis)’의 평가에 따르면, 클링 AI는 이미지-비디오 변환 부문에서 세계 1위를 차지했으며, 텍스트-비디오 부문에서도 상위권을 유지하고 있다.
현재 클링 AI는 2200만 명 이상의 사용자를 보유하고 있으며, 매월 활성 사용자는 25배 증가했다. 플랫폼에서는 1억 6800만 개의 영상과 3억 4400만 개의 이미지가 생성되었다. 또한 클링 AI 앱은 칠레, 아르헨티나를 포함한 8개국에서 최상위 앱으로 선정되었으며, 미국 등 29개국에서 서브 카테고리 다운로드 순위 1위를 차지했다.
클링 AI 2.0 Master는 경쟁사 제품과 비교했을 때 텍스트-비디오 생성에서 소라(Sora)보다 367% 더 뛰어 성능을, 이미지-비디오 생성에서는 경쟁사 모델보다 182%와 178% 더 나은 결과를 보여주었다. 특히 이번 버전은 의미적 충실도, 동적 품질, 시각적 미학 측면에서 큰 개선을 이루었다.
클링 AI 2.0의 주요 혁신 중 하나는 멀티모델 비주얼 언어(MVL, Multimodel Visual Language)의 도입이다. 기존에는 텍스트 프롬프트만으로 영상을 생성했지만, MVL은 텍스트와 이미지를 함께 사용해 보다 정확하고 풍부한 표현이 가능하도록 했다. 퀀 부사장은 “단순 텍스트만으로는 사람들이 상상하는 것을 완벽하게 묘사하기 어렵다”며 “멀티 엘리먼트 에디터(Multi Elements Editor)를 통해 사용자는 더 직관적이고 정확하게 AI와 소통할 수 있게 됐다”고 설명했다.
클링 AI 2.0는 특히 세 가지 측면에서 큰 발전을 이루었다. 첫째, 프롬프트 충실도가 향상되어 표정, 신체 언어, 카메라 움직임, 순차적 행동 등을 더 정확하게 표현할 수 있게 되었다. 둘째, 복잡한 움직임, 합리적인 모션 범위, 적절한 속도 등 동적 품질이 크게 개선되었다. 셋째, 시네마틱한 영상과 풍부한 디테일, 예술적 스타일 보존 등 시각적 미학 측면에서도 큰 향상을 보였다.
클링 AI는 콘텐츠 크리에이터들과 협업을 강화하고 있으며, 이번 행사에서는 클링 AI 2.0을 활용해 제작된 AI 단편 시리즈 ‘뉴 월드 로딩(New World Loading)’이 공개되었다. 이 시리즈의 감독인 내비 첸(Navi Chen)은 “클링 AI는 단순한 도구가 아니라 우리의 워크플로우에 완전히 통합될 수 있는 협업 파트너”라며 “AI는 창작자를 대체하는 것이 아니라 확장하는 것”이라고 강조했다.
콰이쇼우는 클링 AI 2.0의 글로벌 확장을 위해 홍콩, 상하이, 도쿄 등 주요 도시에서 광고 캠페인을 진행할 계획이다. 또한 수천만 달러 규모의 벤처 캐피털 투자 프로젝트인 ‘클링 AI Next Gen’을 통해 더 나은 스토리텔링과 글로벌 확장을 지원할 예정이다. 이번 행사를 통해 클링 AI 2.0 Master와 멀티 엘리먼트 에디터는 즉시 사용 가능하며, 더 비용 효율적인 다양한 버전의 클링 AI 2.0 모델도 곧 출시될 예정이다. 또한 5월에는 더 많은 혁신적인 제품과 서비스가 순차적으로 공개될 것이라고 밝혔다.
해당 모델에 대한 자세한 사항은 링크에서 확인할 수 있다.
이미지 출처: 클링AI
기사는 클로드와 챗gpt를 활용해 작성되었습니다.