Search

MS, 자체 개발 AI 모델 2종 공개… “코파일럿에서 1초 만에 1분 음성 생성”

MS, 자체 개발 AI 모델 2종 공개... "1초 만에 1분 음성 생성"
이미지 출처: MS

마이크로소프트 AI(MAI)가 자체 개발한 음성 생성 모델과 파운데이션 모델을 동시에 공개했다고 28일(현지 시간) 발표했다. 먼저 공개된 ‘MAI-Voice-1’은 단일 GPU에서 1초 이내에 1분 분량의 오디오를 생성할 수 있는 초고속 음성 생성 모델이다. 현재 코파일럿 데일리(Copilot Daily)와 팟캐스트 기능에 적용됐으며, 코파일럿 랩스(Copilot Labs)에서도 체험할 수 있다.

이 모델을 활용하면 간단한 프롬프트만으로 선택형 모험 이야기나 맞춤형 수면 명상 가이드를 제작할 수 있다. 마이크로소프트는 “음성은 AI 동반자의 미래 인터페이스”라며 “현재 사용 가능한 음성 시스템 중 가장 효율적인 시스템 중 하나”라고 설명했다.

두 번째 모델인 ‘MAI-1-preview’는 약 1만5000개의 엔비디아(NVIDIA) H100 GPU로 훈련한 혼합 전문가(mixture-of-experts) 모델이다. 마이크로소프트 AI가 처음부터 끝까지 자체 개발한 첫 번째 파운데이션 모델로, 현재 커뮤니티 모델 평가 플랫폼인 LM아레나(LMArena)에서 공개 테스트 중이다.

마이크로소프트 AI는 “지구상 모든 사람에게 힘을 실어주는 AI를 만들고 있다”며 “앞으로 몇 주 내에 코파일럿의 특정 텍스트 사용 사례에 MAI-1-preview를 단계적으로 적용할 예정”이라고 밝혔다.


해당 모델에 대한 자세한 사항은 MS 뉴스룸에서 확인 가능하다.

이미지 출처: MS




MS, 자체 개발 AI 모델 2종 공개… “코파일럿에서 1초 만에 1분 음성 생성” – AI 매터스 l AI Matters