MS 파운드리 Voice Live가 GA됐다. 음성 인식, TTS, 발화 차례 감지, 중간 끼어들기, 아바타를 단일 API로 묶어 텍스트 에이전트를 음성 에이전트로 곧장 전환할 수…
일레븐랩스(ElevenLabs)가 7일(현지 시간) 자사 X를 통해 개발자들을 위한 ‘넥스트JS 오디오 스타터 킷’이라는 새로운 무료 도구를 내놓았다. 이 도구는 개발자들이 단 몇 분 만에 텍스트…
오픈AI가 20일(현지 시간) 자사 웹사이트를 통해 개발자를 위한 새로운 음성 인식(STT)과 음성 합성(TTS) 모델을 공개했다. API를 통해 공개된 이번 모델은 더 정확하고 맞춤형 음성…
Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling 테스트 시간 확장이 작은 언어 모델의 성능을 비약적으로 향상 테스트 시간 확장(Test-Time Scaling, TTS)은…
VocalCrypt: Novel Active Defense Against Deepfake Voice Based on Masking Effect 기존 딥페이크 음성 탐지의 한계: 사후 대응에서 사전 예방으로 중국 란저우대학교 연구진이 발표한…
AI 기술이 발전하면서 실제 사람의 목소리와 구분하기 어려운 가짜 음성을 만들 수 있게 됐다. 이런 기술이 범죄에 악용되면서 심각한 사회적 문제로 대두되고 있다. CNN…