Top 5 AI 비디오 생성기 

Image

현재 한국에서 가장 뜨거운 비디오 효과가 뭔지 아시는지요? 인어공주 효과입니다. 틱톡에서 유행을 시작한 이 비디오는 전 세계로 퍼지고 있죠. 상반기 지브리 스타일 이미지 생성이 유행을 탔다면, 하반기에는 인어공주 효과가 인기를 끌 모양입니다. 

챗GPT 등장 이후 불과 2년 반 정도가 지났는데요. 이후에는 이미지가, 현재는 동영상 생성이 인기를 끌고 있습니다. 

이미지와 동영상 제작은 유사성이 있지만 구동 방식이 조금 다릅니다. 이미지 30장을 합치면 1초 분량의 영상이 되지만, 30장의 이미지가 고맥락으로 연결돼 있어야 하죠. 그래서 올림픽 출전 선수가 악어로 변한다거나, 윌 스미스가 콧구멍으로 파스타를 먹는다거나 하는 일이 발생했는데요. 현재 동영상 툴들은 생각보다 많이 발전해 있습니다. 오죽하면 시리즈물도 나올 정도죠. 

앞으로 다양한 크리에이터들은 좋은 기획만 있으면 유튜브를 운영하거나, 영화를 만들어볼 수도 있겠죠. 프롬프트 작성도 AI로 대신할 수 있으니 더욱 편리하게 영상을 제작할 수 있을 거고요. 기획자의 역량에 따라 재밌는 영상이 당분간은 쏟아져 나올 것 같습니다. 이제는 모두가 크리에이터가 되는 시대가 됐으니 우리도 영상 제작을 한번 해볼까요? AI 매터스가 최고의 영상 툴 다섯 가지를 모아왔습니다. 


폴로 – 올인원 영상 생성 AI 

보통 영상 생성을 위해서는 각 영상 툴들을 열심히 돌아다녀야 합니다. 각 툴마다의 강점이 명확하기 때문이죠. 그런데 처음부터 그럴 필요가 없었다면요? 폴로 AI 때문입니다. 

직장에서 쓰면 좋을 만한 이미지네요. 

클링 2.1 역시 클링 내부 업데이트 후 3일 만에 적용됐군요. 대단한 속도입니다.

이미지 투 비디오 항목으로 가보시죠. 폴로의 자체 엔진 폴로 1.6은 물론 비두, 피카, 런웨이와 클링, 심지어 얼마 전 출시된 구글의 VEO 3 엔진까지 있네요. 만약 영상을 하나 제작한다면, 그다음 영상은 극적인 효과를 위해 런웨이를, 사이에 어설프게 빈 항목이 있다면 빠르게 채워줄 수 있는 폴로 AI를 쓰면 되는 겁니다. 

폴로 자체 엔진인 폴로 1.6으로 간단한 영상을 하나 제작해 보겠습니다. 폴로의 장점은 한글로 프롬프트를 입력해도 된다는 것인데요. 

구식 브라운관 TV 화면 클로즈업, 화면 속 안경 쓴 매드사이언티스트 박사가 미친 듯 웃으며 얼굴을 비춘다. TV 화면은 지직거리며 불규칙한 노이즈가 일렁이고, 박사의 얼굴은 강한 명암 대비로 어둡고 음산하게 드러난다. 전체 색감은 차갑고 어두운 누아르 톤, 블랙 미러 같은 미래 디스토피아 감성. 불안하고 긴장감 넘치는 분위기, 미세한 화면 떨림과 고주파 전자음 효과 포함. 

이런 프롬프트를 입력해 보았습니다. 

Close-up of a vintage CRT TV screen showing an eyeglass-wearing mad scientist laughing maniacally. The TV screen flickers with static and irregular noise, revealing the scientist’s face with strong chiaroscuro lighting that casts dark, eerie shadows. The overall color palette is cold and dark noir tones, evoking a Black Mirror-style dystopian atmosphere. The scene feels tense and unsettling, with subtle screen jitter and high-frequency electronic sound effects. 

영어로도 동일한 프롬프트를 입력했는데요. 한글 프롬프트(위)가 원래의 목적을 더 잘 반영하는 것을 알 수 있네요. 

폴로 1.6 엔진은 속도도 매우 빠릅니다. 다른 툴에서 이미지 생성하는 것보다 더 빨라요. 거의 30초~1분 내 5초짜리 영상을 뽑아줍니다. 굉장한 속도죠? 크레딧도 5크레딧으로 매우 저렴합니다. 

이번엔 미국 유튜버가 한식을 만드는 장면을 만들어보겠습니다. 품질을 높이기 위해서 이미지를 생성한 후 이미지를 기반으로 만들어보겠습니다. 

미국 한식 유튜버가 실사 느낌으로 제대로 만들어졌죠? 이 이미지를 기반으로 미국 한식 유튜브를 운영하는 영상을 만들어보겠습니다. 품질을 위해 VEO 3 엔진을 사용해 보겠습니다. 하단에 보시면 시드 고정 항목이 있는데요. 시드를 고정하시면 장면이나 얼굴이 고정돼 일관성 있는 작업을 하실 수 있습니다. 

개인적으로 폴로는 진행 상황을 확실하게 보여주는 게 참 좋습니다. 타 툴은 진행 상황을 확실하게 보여주지 않는 경우가 많은데요. 폴로의 경우 앞에 몇 개의 태스크가 진행 중인지, 진행 상황이 몇 퍼센트인지 확실하게 보여줘 기다리는 동안 다른 작업을 할 수 있습니다.

꽤 괜찮은 품질의 영상이 나왔습니다. 외국인의 어설픈 한국어 발음까지 완벽하죠? 그러나 “핵 맛있네요” 단어가 맨 마지막에 들어가는 것이 제대로 반영되지 않았습니다. 이 부분은 비디오투비디오 기능으로 수정하면 됩니다. 

폴로의 강점은 소셜 미디어에 간편하게 업로드할 수 있는 다양한 이펙트도 많이 있다는 것인데요. AI 로테이션, 근두운, 근육 제네레이터, AI 허그, 립싱크, 페이스스왑 등 간편하게 소셜 미디어에 업로드할만한 다양한 이펙트를 사전 보유하고 있어요. 

특히 요즘 소셜 미디어에서 엄청난 인기를 끌고 있는 인어 이펙트도 있군요. 한국인 노인 부부의 사진을 인어 필터로 만들어보겠습니다. 

이미지를 먼저 생성하고요. 이미지를 업로드해주고 크리에이트 버튼을 누릅니다. 

멋지죠? 할머니만 인어공주가 된 게 아니라 엄숙한 표정의 할아버지도 인어왕자가 되었습니다. 할아버지의 심통 난 표정을 보면서 안타까웠는데, 할아버지도 왕자가 되고 나서는 활짝 웃고 계시네요. 이런 식으로 소셜 미디어용 영상을 만들어 업로드해보세요. 

폴로의 장점은 영상 제작을 위해 툴을 이리저리 옮길 필요가 없다는 것입니다. 클링 2.1, VEO 3 등 주요 엔진을 선택할 수 있기 때문에, 서사가 있는 영상 한 편을 만들 때 각 툴의 강점을 살려 제작할 수 있죠. 폴로 안에서 모든 것이 해결되는 겁니다. 보통은 매월 각 서비스를 구독해야 하잖아요. 월 구독 없이 필요할 때 크레딧만 구매해서 쓸 수 있다는 것이 장점입니다. 

진지한 영상이 아니더라도, 폴로에는 유행하는 필터나 이펙트가 대부분 있다는 걸 알 수 있는데요. 소셜 미디어용으로 간편한 이펙트 영상을 만들어 가족과, 친구들과 즐거운 시간을 보내시기 바랍니다. 


Sora – 접근성 높은 동영상 AI 


영상 AI의 포문을 연 소라는 챗GPT를 만드는 오픈AI의 서비스입니다. 전 세계에서 가장 많이 쓰이는 생성형 AI인 만큼 접근성이 높은 편이죠.

활용 방법은 sora.com으로 접속 후 비디오 탭을 누르고 하단에 있는 프롬프트 창에 원하는 비디오에 대해 입력하면 되는데요. 개인적으로 생각하는 소라의 장점은 ‘빛 표현’입니다. 빛과 그림자, 투명 피사체에 이르기까지 다양한 빛 표현을 거의 완벽하게 해내고 있는 것을 알 수 있습니다. 아래는 투명 꽃의 꽃잎이 하나씩 눈물처럼 떨어지는 장면을 묘사한 겁니다. 챗GPT로 작성한 프롬프트는 다음과 같습니다. 

A single crystal-like glass flower stands alone in the middle of a white snowy field. The camera slowly zooms in to a close-up of the delicate, transparent petals. One by one, the petals begin to melt and fall gently like drops of water. After the final petal falls, the camera smoothly pans down and follows the falling droplet, shifting the focus to the snowy ground where it lands. The lighting is soft and ethereal, evoking a peaceful, melancholic atmosphere. loopable motion. photorealistic. 

‘눈물처럼 떨어지는 설원의 꽃’을 작성했는데 눈물처럼 떨어지는 장면이 제대로 표현되지 않습니다. 이때는 소라의 장점인 스토리보드로 컷 네 개를 분리해서 만들면 됩니다. 

🎬 컷 1: 설원 위에 피어난 유리 장미 

Prompt
A single crystal rose stands alone in the middle of a vast white snowy field. The scene is calm and silent. The camera slowly zooms in from a distance, drawing closer to the delicate, translucent flower. Gentle light reflects through the transparent petals, casting soft rainbow-like glows on the snow. The sky is pale blue, creating a cold but serene atmosphere. Subtle wind sounds in the background. Soft focus on the rose as it becomes the center of the frame. 

🎬 컷 2: 녹기 시작하는 유리 잎 

Prompt
A close-up of one of the glass petals as it begins to melt. The petal’s edge turns to liquid, dripping slowly like a droplet of water. The camera holds still on the transformation, capturing the fine details of the melting surface and reflections of light moving across it. The atmosphere is quiet and intimate, with soft ambient sounds. The petal loses shape but remains graceful as it begins its descent. 

🎬 컷 3: 떨어지는 잎 

Prompt
The camera smoothly tracks the melted petal as it falls gently through the cold air, spinning slowly like a water droplet. The background blurs into a dreamy white. Soft snowflakes drift by, and the focus stays on the falling petal. The motion is slow and fluid, evoking a sense of melancholy and beauty. Subtle glimmering light passes through the translucent form as it nears the ground. 

🎬 컷 4: 잎이 눈에 닿고 불꽃처럼 사라짐 

Prompt
As the droplet touches the snowy surface, a small glowing flame flickers up softly and silently. The snow beneath melts slightly around it. The camera moves in close to show the flame’s quiet dance before it fades and disappears. The light reflects faintly on nearby snowflakes. The final shot lingers on the now-empty space, evoking a peaceful, haunting stillness. Ethereal background hum underscores the moment. 

이렇게 컷을 나눠봤어요. 

그러나 결국 얼음 장미가 눈 녹듯 떨어지는 장면을 만드는 데는 실패했습니다. 

타 툴에 비해 아쉬운 점은 물리법칙을 제대로 이해하지 못할 때가 많고, 프롬프트 설정이 복잡해질수록 오류가 많이 난다는 것입니다. 다른 툴이 프롬프트를 조밀하게 설계할수록 좋은 결과물을 내는 것과는 반대의 결과죠. ‘탐색’ 탭에서의 훌륭한 결과물들도 프름프트를 보면 단순한 경우가 많은데요. 단순한 프롬프트로 좋은 영상을 뽑아주는 건 어찌 보면 좋은 일이지만 반대로 영상을 작성자 마음대로 통제하지 못한다는 뜻도 됩니다. 아주 오만방자한 툴이군요. 

어쨌거나 소라는 빙 모바일 앱에서 무료로 사용할 수도 있으니 가장 접근성이 좋은 툴인 것만큼은 사실이겠네요. 처음 빙이나 소라에서 영상을 테스트해 본 뒤 각자에게 맞는 특성을 찾아 다른 툴로 이동해보시는 것이 좋겠습니다. 


런웨이 – 복잡한 작업에 적합 


소라보다 더 일찍부터 서비스를 시작했던 런웨이는 Gen-4에 이르러 영화급 품질을 갖게 되었습니다. 거기다 최근 포함된 챗 모드로 결과물을 채팅으로 수정해 가며 사용할 수도 있게 됐죠. 우선 젤리 별에 내린 우주견을 그려보았습니다. 챗GPT로 작성한 프롬프트는 다음과 같습니다. 

A humanoid astronaut with a greyhound dog’s head inside a transparent helmet, standing on an alien planet completely covered in tiny colorful gummy bears. The surface is densely packed with small, vibrant jelly candies in red, orange, yellow, and green, making the ground look bumpy and glossy — no bare soil is visible. The astronaut wears a full human-style space suit, and the face inside the glass helmet is clearly visible: a greyhound dog with a puzzled, wide-eyed expression. In the sky above, fluffy, semi-transparent clouds float — all shaped like giant multicolored gummy bears. The lighting is soft and dreamy, with glowing pink and lavender hues in the sky. The scene feels surreal, whimsical, and high-definition.

우주견의 황당한 표정이 인상적이죠? 

이 이미지를 기반으로 챗 모드에 들어가 영상을 생성했습니다. 목적지가 예상과 다른 그레이하운드가 황당해하는 장면을 그려봤는데요.  

그레이하운드의 황당한 표정이 아주 인상적이죠. 챗 모드로 몇 가지를 보완한 뒤 젤리별을 탐색하는 그레이하운드의 영상을 만들어봤습니다. 

멋지죠? 젤리별을 탐사하는 그레이하운드의 서사가 완성되었습니다. 프롬프트를 조금 더 다듬으면 영화에 쓸 수도 있을 것 같네요. 


피카 – 편리하지만 느린 AI 


피카 역시 오래된 영상 툴입니다. 고품질 영상 제작과 쉬운 제작이 가능한 비디오 이펙트 중심으로 이뤄져 있는데요. 일반 이미지와 영상 생성도 가능합니다. 프롬프트로 ‘어색하게 뉴욕을 날아다니는 너드 슈퍼맨’을 입력해봤습니다.

A skinny, pale white nerdy man in a brown plaid shirt and khaki pants is awkwardly flying through the sky above a busy New York City street. He looks confused and nervous, with wide eyes and a slightly panicked expression, as if he just discovered he has superpowers. His flying pose is clumsy — legs bent, arms not fully extended — as he hovers uncertainly above yellow taxis and pedestrians. The camera tracks him in mid-air, occasionally cutting to the ground below where people look up in shock. The lighting is natural daylight with soft shadows. The mood is humorous and surreal. High-detail, realistic physics, city sounds implied, loopable short clip.

어색한 부분이 상당히 많지만 어쨌든 소기의 목적대로는 영상이 출력되었습니다. 

아쉬운 점을 꼽자면, 무료 플랜으로 했을 때 영상 생성이 매우 느립니다. 사용자가 몰리면 몇 시간을 기다려야 할 때도 있었습니다. 그런데 이펙트의 경우에는 조금 빠르게 출력이 되는 것으로 봐서, 피카의 주력 비디오 생성은 이펙트가 아닐까 하는 생각이 들더군요. 긴 영상 생성도 나쁘지 않지만, 전반적으로 재미있는 이펙트에 더 많은 힘을 주는 느낌입니다. 

VEO 3 – 높은 성능과 높은 가격


VEO 3는 현재 가장 높은 성능을 내는 툴입니다. 4K 영상 제작에 소리까지 자동으로 생성해주죠.

아래 영상은 ‘한국 식당 주방에서 냉면을 만드는 아기 돼지’를 VEO 3로 제작해본 것입니다. 다른 영상 툴들과 달리 소리까지 생성해줘서 현장 느낌이 더욱 잘 살아 있죠. 돼지의 움직임은 약간 어설프지만, 프롬프트를 더 잘 조정하면 훌륭한 요리 영상을 만들 수 있을 것입니다.

문제는 비싸다는 것입니다. VEO 3 사용을 위해서는 높은 가격의 구글 원 AI 프리미엄 멤버십을 유지해야 하죠. 가장 저렴한 요금제도 월 2만 9,000원, 비싼 요금제는 36만 원에 달합니다. 이걸 매월 구독해야 하기 때문에 부담감이 상당한데요.

폴로 AI를 사용하면 이러한 문제가 사라집니다. 크레딧을 구매해서 폴로 안에서 VEO 3 엔진을 사용하면 되니까요. 구독 없이 필요한 만큼만 구매해서 사용하면? 더 합리적인 가격으로 VEO 3 엔진을 사용할 수 있을 것입니다.

이 기사는 Pollo AI와의 협업으로 작성되었습니다.




Top 5 AI 비디오 생성기  – AI 매터스 l AI Matters