오픈AI가 텍스트와 오디오 프롬프트를 기반으로 음악을 생성하는 새로운 도구를 개발하고 있다고 테크크런치(TechCrunch)가 25일(현지 시각) 보도했다. 디 인포메이션(The Information) 소식통에 따르면 이 도구는 기존 영상에 음악을 추가하거나 보컬 트랙에 기타 반주를 더하는 용도로 활용될 수 있다. 다만 오픈AI가 언제 이 도구를 출시할 계획인지, 독립형 제품으로 출시될지 아니면 챗GPT나 영상 앱 소라(Sora)에 통합될지는 아직 명확하지 않다.
한 소식통은 디 인포메이션에 오픈AI가 줄리어드 음대 학생 일부와 협력해 학습 데이터를 제공하는 방식으로 악보에 주석을 다는 작업을 진행하고 있다고 전했다. 오픈AI는 과거 생성형 음악 모델을 출시한 적이 있지만, 이는 챗GPT 출시 이전의 일이다. 최근에는 텍스트 음성 변환(text-to-speech)과 음성 텍스트 변환(speech-to-text)에 초점을 맞춘 오디오 모델을 개발해 왔다. 생성형 음악 모델을 보유한 다른 기업으로는 구글과 수노가 있다.
해당 기사의 원문은 테크크런치에서 확인 가능하다.
이미지 출처: 오픈AI







![[Q&AI] “AI로 조작했다”… 이이경 사생활 폭로 사건 정리](https://aimatters.co.kr/wp-content/uploads/2025/10/AI-매터스-기사-썸네일-QAI-6.jpg)