Search

오픈AI는 ‘소라 2’를 왜 iOS부터 풀었나… 모바일 퍼스트 전략의 속내

오픈AI는 ‘소라 2’를 왜 iOS부터 풀었나... 모바일 퍼스트 전략의 속내
이미지 출처: 오픈AI

오픈AI가 10월 1일(한국 시각) 영상 생성 AI ‘Sora 2’를 공개했다. 웹 기반으로 선공개됐던 Sora 1과 달리, Sora 2는 iOS 전용 네이티브 앱을 먼저 출시했다. 안드로이드 사용자는 초대코드를 받은 뒤에야 웹을 통해 접근할 수 있다. AI 영상 생성 기술의 정점을 보여주는 모델을 왜 모바일, 그것도 iOS부터 풀어놓았을까. 이 선택 뒤에는 오픈AI의 전략적 계산이 숨어 있다.

초대제 앱 출시 뒤 숨은 계산, “소셜 플랫폼 야심”

Sora 2의 iOS 우선 출시는 단순한 개발 일정 문제가 아니다. 오픈AI는 공식 발표에서 “안드로이드 버전을 준비 중”이라고만 밝혔을 뿐, 구체적인 출시 시점을 제시하지 않았다. 실제로 Sora 팀 리더들은 라이브 발표에서 “팀이 안드로이드 버전을 만들기 위해 열심히 작업 중이니 기다려 달라”고 양해를 구했다.

iOS 네이티브 앱으로 시작한 이유는 명확하다. 바로 ‘Cameo(카메오)’ 기능의 최적화된 사용자 경험(UX)을 제공하기 위해서다. Cameo는 사용자가 짧은 동영상과 음성을 녹화하면, Sora 2가 그 사람의 외모와 목소리를 학습해 AI가 생성한 어떤 장면에도 자연스럽게 삽입하는 기능이다.

이 기능을 구현하려면 실시간 카메라 접근, 음성 녹음, 안면 인식 기반 본인 확인(liveness check), 그리고 빠른 렌더링이 필수다. iOS 네이티브 환경은 하드웨어-소프트웨어 통합이 긴밀해 이런 복잡한 멀티미디어 처리에 유리하다. 반면 웹 기반 접근은 브라우저 제약으로 인해 카메라, 마이크 권한 처리와 실시간 처리 성능에서 한계가 있다.

오픈AI 제품 팀을 이끄는 Rohan Sahai는 “Cameo 설정 과정에서 무작위 음성 챌린지를 제시하고, 사용자가 머리를 특정 방향으로 움직이게 해 본인 확인을 한다”며 “이 모든 것이 누군가 다른 사람을 사칭하지 못하도록 하기 위한 검증 시스템”이라고 설명했다. 이런 정교한 본인 인증 프로세스는 네이티브 앱에서 훨씬 안정적으로 구현된다.

‘틱톡 킬러’ 노리나… Cameo로 승부수

Sora 2 앱의 핵심은 단순한 영상 생성 도구가 아니라, AI 생성 콘텐츠 기반 소셜 플랫폼이다. 앱 내부에는 피드(Feed)가 있고, 사용자는 팔로우, 좋아요, 댓글, 리믹스(Remix) 기능을 사용할 수 있다. 전통적인 소셜 미디어와 거의 동일한 구조다. 차이가 있다면 모든 콘텐츠가 AI로 생성된다는 점이다.

오픈AI가 공개한 ‘피드 철학(Feed Philosophy)’ 문서에 따르면, Sora 피드의 목표는 “수동적 스크롤이 아닌 창작과 적극적 참여를 촉진하는 것”이다. 알고리즘은 사용자가 피드에 머문 시간이 아니라, 창작 의욕을 자극할 가능성이 높은 콘텐츠를 우선 노출한다.

특히 주목할 점은 ‘연결된 콘텐츠(connected content)’ 우선 정책이다. 알고리즘은 글로벌 바이럴 콘텐츠보다 사용자가 팔로우하거나 상호작용한 사람들의 콘텐츠를 우선 노출한다. Thomas Dimson 제품 엔지니어링 리더는 “모든 주요 플랫폼이 소셜 그래프(social graph)에서 멀어지는 시대에, Cameo가 커뮤니티를 강화할 것”이라고 강조했다.

Cameo 기능은 이 전략의 핵심이다. 사용자는 친구에게 자신의 Cameo 사용 권한을 부여하고, 친구들은 그 사람을 자신이 만든 영상에 등장시킬 수 있다. 예컨대 “샘 알트먼이 이번 라이브 스트림이 너무 잘 됐다고 환호하는 영상”을 만들면, 실제 샘 알트먼의 얼굴과 목소리가 자연스럽게 합성된다.

오픈AI 팀은 내부 테스트 중 “Cameo 기능 덕분에 회사 내에서 새로운 친구를 사귀게 됐다”는 피드백을 받았다고 밝혔다. Bill Peebles Sora 팀 리더는 “텍스트 메시지에서 이모지, 음성 메시지로 진화했던 커뮤니케이션이 이제 Cameo라는 영상 기반 매체로 진화하는 것처럼 느껴진다”고 말했다.

초대 코드 받은 사람만 입장시키는 이유

안드로이드 사용자는 초대코드를 받으면 웹 브라우저를 통해 sora.com에 접속할 수 있다. 하지만 웹 환경에서는 iOS 앱의 핵심 기능인 Cameo를 완전히 활용하기 어렵다. 특히 실시간 카메라·음성 입력과 본인 인증 프로세스는 네이티브 앱에서만 매끄럽게 작동한다.

이는 의도된 격차다. 오픈AI는 초대제 출시 전략을 통해 사용자가 “친구들과 함께” 플랫폼에 유입되도록 유도하고 있다. 앱을 다운로드하고 대기 리스트에서 승인받은 사용자는 자동으로 4개의 초대 코드를 받는다. Bill Peebles는 “친구들과 함께 들어오는 것이 정말 중요하다. 이건 소셜 방식으로 경험하는 것이 가장 좋고, 거의 새로운 메시징 형태와 같다”고 설명했다.

이는 초기 사용자 규모를 제한해 서버 부하를 관리하면서 동시에 소셜 네트워크 효과를 극대화하려는 전략으로 해석된다. 영상 생성에는 막대한 컴퓨팅 리소스가 필요하므로, 무분별한 대규모 유입보다는 친구 네트워크를 통한 점진적 확장이 서비스 안정성과 초기 사용자 경험 품질을 확보하는 데 유리하다. 실제로 오픈AI는 “우리는 피드 체류 시간을 최적화하지 않으며, 소비가 아닌 창작을 극대화하도록 앱을 명시적으로 설계했다”고 밝혔다.

‘둠스크롤’ 방지하려는 오픈AI의 계산

소셜 피드 플랫폼의 고질적 문제인 ‘둠스크롤링(doomscrolling)’, 중독, 고립 문제에 대한 우려도 반영됐다. 오픈AI는 10대 사용자에게 하루 피드 노출 콘텐츠 수를 제한하고, 무한 스크롤을 기본적으로 비활성화했다. 성인 사용자에게도 일정 시간 스크롤하면 창작 활동을 유도하는 넛지(nudge)를 제공한다. 부모는 챗GPT 부모 통제 기능을 통해 자녀의 무한 스크롤 제한을 조정하거나, 알고리즘 개인화를 끄고, DM 설정을 관리할 수 있다.

또한 Sora 2 앱은 자연어로 조작 가능한 새로운 추천 알고리즘을 도입했다. 사용자가 피드 상단에서 “편안한 기분”, “귀여운 동물만”과 같이 원하는 콘텐츠 유형을 지정하면, 알고리즘이 그에 맞춰 피드를 조정한다. 사용자의 웰빙을 주기적으로 체크하고 피드 조정 옵션을 제공하는 메커니즘도 내장됐다.

수익 모델도 주목할 지점이다. 오픈AI는 “투명하게 말하자면, 현재 유일한 계획은 수요가 가용 컴퓨팅 파워를 초과할 경우 사용자에게 추가 영상 생성을 위한 유료 옵션을 제공하는 것”이라며 “다른 앱의 많은 문제는 수익화 모델이 사용자 웰빙과 상충되는 결정을 유도한다는 데서 비롯된다”고 밝혔다. 광고나 데이터 판매가 아닌, 컴퓨팅 리소스 기반 과금 모델을 시사한 것이다.

숏폼 시장 재편 가능성… 그러나 과제도 산적

Sora 2의 등장은 숏폼 영상 시장의 판도를 흔들 가능성이 있다. 틱톡, 인스타그램 릴스,유튜브 쇼츠가 지배하는 시장에서, AI 생성 콘텐츠 기반 플랫폼은 완전히 새로운 경쟁 축을 만들어낸다. 특히 Cameo 기능은 기존 플랫폼에서 불가능했던 경험을 제공한다. 사용자는 영상 촬영·편집 기술 없이도, 자신이 원하는 장면 속 주인공이 될 수 있다.

하지만 과제도 많다. 우선 컴퓨팅 비용이다. 영상 생성에는 수 분이 소요되며, 서버 부하가 클 경우 대기 시간은 더 길어진다. 실시간 피드 경험을 제공하는 기존 플랫폼과 달리, Sora는 비동기적 창작 방식에 의존한다. 이것이 사용자 경험의 걸림돌이 될 수 있다.

딥페이크 악용 우려도 상존한다. 오픈AI는 Cameo 생성 시 본인 인증을 거치고, 사용자가 자신의 Cameo 사용 권한을 세밀하게 통제할 수 있다고 강조한다. 다른 사람이 생성한 자신의 Cameo 영상도 언제든 확인하고 삭제할 수 있다.

콘텐츠 출처 추적을 위해 C2PA 표준을 적용하고, 앱 외부로 내보낸 영상에는 Sora 워터마크가 자동 삽입된다. 오픈AI는 “추론 모델(reasoning model)을 활용해 유해 콘텐츠 생성을 극도로 어렵게 만들었다”며 “특히 Cameo 기능에서 성적이거나 폭력적인 콘텐츠를 생성하는 것은 불가능하다”고 밝혔다.

그러나 이는 기술적 방어막일 뿐이다. 사용자 신고와 인간 검수자 팀이 실시간으로 괴롭힘 사례를 검토하지만, 플랫폼이 확장될수록 모니터링 부담은 급증할 것이다.

API 출시 예고… 개발자 생태계로 확장

오픈AI는 Sora 2를 “수 주 내” API로도 제공할 계획이다. 이는 Sora 1 Turbo가 API로 먼저 출시됐던 것과 대조적이다. Rohan Sahai는 “세밀한 편집 컨트롤이나 자체 비디오 에디터 통합 같은 다양한 사용 사례가 있다”며 “우리가 직접 만들지 않더라도, 이제 Sora 2를 통해 가능해진다”고 말했다.

API 출시는 Sora를 단순한 소비자 앱을 넘어 B2B 플랫폼으로 확장하려는 의도를 드러낸다. 광고 대행사, 교육 콘텐츠 제작사, 게임 개발사 등이 Sora 2를 자체 워크플로우에 통합하면, 영상 제작 시장의 판도가 근본적으로 바뀔 수 있다.

다만 API 가격 정책은 아직 미공개 상태다. Sora 1 Turbo가 유지된다는 점에서, Sora 2는 프리미엄 티어로 포지셔닝될 가능성이 크다. 챗GPT Pro 사용자는 더 높은 품질의 ‘Sora 2 Pro’ 모델을 sora.com에서 이용할 수 있으며, 곧 앱에도 추가될 예정이다.

모바일 퍼스트 전략, 오픈AI의 새로운 야심

Sora 2의 iOS 우선 출시는 오픈AI가 더 이상 백엔드 AI 제공자에 머물지 않겠다는 선언이다. 챗GPT로 대화형 AI 시장을 선점한 오픈AI는 이제 소셜 플랫폼 사업자로서의 입지를 다지고 있다. 다만 Sora가 틱톡, 인스타그램과 정면 경쟁할 수 있을지는 미지수다. 기존 플랫폼은 이미 수억 명의 사용자와 정교한 알고리즘, 광고 생태계를 갖췄다. AI 생성 콘텐츠가 인간의 진정성을 대체할 수 있을지도 의문이다.

그러나 한 가지는 분명하다. 오픈AI는 단순히 기술을 판매하는 데 머물지 않고, 사용자 경험을 직접 설계하는 플랫폼 사업자로 진화하고 있다. Sora 2 앱은 그 야심의 시험무대다. iOS부터 시작한 이 실험이 성공할지, 세계는 지켜보고 있다.




오픈AI는 ‘소라 2’를 왜 iOS부터 풀었나… 모바일 퍼스트 전략의 속내 – AI 매터스 l AI Matters