Search

오픈AI, 새 영상 생성 모델 ‘소라 2’ 공개… “물리 법칙 따르는 영상·음향 동시 생성”

오픈AI, 새 영상 생성 모델 ‘소라 2’ 공개... "물리 법칙 따르는 영상·음향 동시 생성"
이미지 출처: 오픈AI

오픈AI(OpenAI)가 지난달 30일(현지 시각) 차세대 영상 생성 모델 ‘소라 2(Sora 2)’를 공개했다. 이 모델은 이전 시스템보다 물리적으로 정확하고 사실적이며 제어 가능성이 높다. 특히 동기화된 대화와 음향 효과를 생성할 수 있는 기능을 갖췄다.

오픈AI에 따르면 소라 2는 올림픽 체조 루틴, 패들보드 위에서의 백플립 등 이전 모델로는 구현이 어려웠던 동작을 표현한다. 특히 물리 법칙을 더욱 정확하게 따른다는 점이 특징이다. 예를 들어 농구 선수가 슛을 놓치면 공이 골대로 순간이동하는 대신 백보드에서 튕겨 나오는 식이다.


오픈AI는 “이전 영상 모델들은 텍스트 프롬프트를 수행하기 위해 객체를 변형하거나 현실을 왜곡했다”며 “소라 2는 모델이 만드는 실수조차 물리 법칙을 따르는 방식으로 나타난다”고 설명했다. 소라 2는 여러 장면에 걸친 복잡한 지시를 따르면서도 세계 상태를 정확하게 유지할 수 있다. 범용 영상·음향 생성 시스템으로서 배경 음향, 음성, 음향 효과를 높은 사실감으로 구현한다.

오픈AI는 새로운 iOS 앱 ‘소라’도 함께 출시했다. 이 앱의 ‘카메오(cameos)’ 기능을 사용하면 짧은 영상 및 음성 녹화만으로 자신을 모든 소라 장면에 삽입할 수 있다. 사용자는 누가 자신의 카메오를 사용할 수 있는지 직접 제어하고, 언제든지 접근 권한을 취소할 수 있다. 소라 iOS 앱은 현재 미국과 캐나다에서 다운로드 가능하며, 곧 다른 국가로 확대될 예정이다. 초기에는 무료로 제공되며, 챗GPT Pro 사용자는 고품질 소라 2 프로 모델도 사용할 수 있다.

해당 서비스에 대한 자세한 사항은 오픈AI 뉴스룸에서 확인 가능하다.

이미지 출처: 오픈AI




오픈AI, 새 영상 생성 모델 ‘소라 2’ 공개… “물리 법칙 따르는 영상·음향 동시 생성” – AI 매터스 l AI Matters