구글이 19일 I/O 2026에서 새로운 멀티모달 모델 ‘제미나이 옴니(Gemini Omni)’를 공개했다. 이름 그대로 모든(omni) 형태의 입력을 받아 원하는 결과물로 변환하는 모델이다. 다만 첫 출시 단계에서는 동영상 생성·편집에 집중한다. 이미지와 오디오 출력은 향후 몇 달 안에 단계적으로 추가될 예정이다.
쉽게 말하면, 처음에는 ‘대화형 영상 편집기’로 시작해 점차 ‘모든 형식을 자유롭게 오가는 만능 생성 도구’로 진화하는 모델이다. 일반 사용자 입장에서 옴니가 매력적인 이유는 명확하다. 영상 편집을 자판 두드리거나 메뉴를 뒤지는 작업이 아니라, 친구에게 부탁하듯 말로 하면 된다는 것이다.
예를 들어 직접 찍은 평범한 영상을 업로드한 뒤 “조각상을 비눗방울로 바꿔줘”라고 말하면 그대로 바뀐다. “사람이 거울을 만지면 거울이 액체처럼 출렁이고 팔이 반사 재질로 바뀌게 해줘”처럼 복잡한 상황 연출도 한 문장이면 끝난다. 등장인물의 일관성과 물리적 자연스러움은 알아서 유지된다.
참조 자료를 자유롭게 섞을 수 있는 점도 강점이다. 이미지 한 장과 음악 파일, 짧은 영상을 함께 던지면 “이미지의 분위기로, 영상의 카메라 움직임을 살려, 음악 박자에 맞춰 빛이 들어오게 해줘” 같은 주문을 소화한다. 자기 모습과 목소리를 본뜬 ‘AI 아바타’를 만들어 영상 속에 직접 등장하는 것도 가능하다.
글로벌 IT 매체들이 주목한 부분은 ‘교육·설명 콘텐츠’다. 테크크런치(TechCrunch) 등 외신은 “단백질 접힘 과정을 클레이메이션 영상으로 만들어달라”는 짧은 요청만으로 스톱모션 해설 영상이 즉시 나오는 사례를 사용 가능성의 핵심으로 꼽았다. 마케팅 영상, 제품 데모, 짧은 교육 클립 등 ‘복잡한 개념을 빠르게 시각화해야 하는’ 분야에서 가장 먼저 자리 잡을 것으로 보인다.
옴니로 만든 모든 영상에는 눈에 보이지 않는 워터마크 ‘신스ID(SynthID)’와 ‘C2PA 콘텐츠 자격 증명’이 새겨진다. 오늘부터 한국 포함 전 세계 구글 AI 프로·울트라 구독자에게 제미나이 앱과 구글 플로우(Google Flow)를 통해 순차 제공되며, 유튜브 쇼츠와 유튜브 크리에이트 앱에서는 이번 주부터 무료로 풀린다. API는 몇 주 안에 개방된다.
자세한 내용은 구글 블로그에서 확인할 수 있다.
이미지 출처: 구글


![[클로드 처음 사용해보기] 클로드, 이렇게 시작하세요 — 입문부터 코워크까지 14편 총정리](https://aimatters.co.kr/wp-content/uploads/2026/06/claude_01.jpg)


