오픈AI, 새 영상 생성 모델 ‘소라 2’ 공개... "물리 법칙 따르는 영상·음향 동시 생성"

오픈AI(OpenAI)가 지난달 30일(현지 시각) 차세대 영상 생성 모델 ‘소라 2(Sora 2)’를 공개했다. 이 모델은 이전 시스템보다 물리적으로 정확하고 사실적이며 제어 가능성이 높다. 특히 동기화된 대화와 음향 효과를 생성할 수 있는 기능을 갖췄다.

오픈AI에 따르면 소라 2는 올림픽 체조 루틴, 패들보드 위에서의 백플립 등 이전 모델로는 구현이 어려웠던 동작을 표현한다. 특히 물리 법칙을 더욱 정확하게 따른다는 점이 특징이다. 예를 들어 농구 선수가 슛을 놓치면 공이 골대로 순간이동하는 대신 백보드에서 튕겨 나오는 식이다.

오픈AI는 “이전 영상 모델들은 텍스트 프롬프트를 수행하기 위해 객체를 변형하거나 현실을 왜곡했다”며 “소라 2는 모델이 만드는 실수조차 물리 법칙을 따르는 방식으로 나타난다”고 설명했다. 소라 2는 여러 장면에 걸친 복잡한 지시를 따르면서도 세계 상태를 정확하게 유지할 수 있다. 범용 영상·음향 생성 시스템으로서 배경 음향, 음성, 음향 효과를 높은 사실감으로 구현한다.

오픈AI는 새로운 iOS 앱 ‘소라’도 함께 출시했다. 이 앱의 ‘카메오(cameos)’ 기능을 사용하면 짧은 영상 및 음성 녹화만으로 자신을 모든 소라 장면에 삽입할 수 있다. 사용자는 누가 자신의 카메오를 사용할 수 있는지 직접 제어하고, 언제든지 접근 권한을 취소할 수 있다. 소라 iOS 앱은 현재 미국과 캐나다에서 다운로드 가능하며, 곧 다른 국가로 확대될 예정이다. 초기에는 무료로 제공되며, 챗GPT Pro 사용자는 고품질 소라 2 프로 모델도 사용할 수 있다.

해당 서비스에 대한 자세한 사항은 오픈AI 뉴스룸에서 확인 가능하다.

이미지 출처: 오픈AI

오픈AI, 새 영상 생성 모델 ‘소라 2’ 공개… “물리 법칙 따르는 영상·음향 동시 생성”

AI 웹툰 ‘지구인 AI 사용법’ 12화 : 축의금 얼마 내는 게 좋을까?

AI 웹툰 ‘금옥씨 보호모드!’ 14화 : 새로운 감정

AI도 눈치 본다? 목표 알려주자, 답변 바꾸는 챗GPT의 비밀 “목적을 알려주지 말 것”

[AI 매터스 뉴스레터 #167] 회의록 쓰느라 회의에 집중 못한다면? AI가 답이다

구글 딥마인드의 제미나이, 수학·물리학 난제 해결하며 AI 연구 협력자로 진화

Highlight

챗GPT 프로, ‘90% 할인’… 카카오 선물하기 깜짝 특가

오픈AI, 초당 1,000토큰 생성하는 초고속 코딩 모델 ‘GPT-5.3-Codex-Spark’ 공개

“AI 비서가 하루종일 일한다”… 오픈AI, 장시간 작동 AI 만드는 법 공개

[AI 매터스 뉴스레터 #167] 회의록 쓰느라 회의에 집중 못한다면? AI가 답이다

“개인 컴퓨터로 초거대 AI 학습 가능해진다”… 12배 빠른 신기술 등장