Search

음성 AI

“웃음, 한숨 소리까지 구현” 오픈AI, 음성 AI 모델 'GPT 리얼타임' 공개

“웃음, 한숨 소리까지 구현” 오픈AI도 음성 AI 모델 ‘GPT 리얼타임’ 공개

8월 29, 2025

오픈AI(OpenAI)가 인간 수준의 음성 품질을 자랑하는 새로운 음성-음성(speech-to-speech) 모델 ‘GPT 리얼타임(GPT Realtime)’과 개선된 실시간 API(Real-time API)를 정식 출시했다고 28일(현지 시간) 발표했다. 브래드 라이트캡(Brad Lightcap)…

오픈AI, 챗GPT 음성 모드에 ‘번역 기능’ 추가… “억양 변화도 자연스럽게 표현”

챗GPT 음성 모드에 ‘번역 기능’ 추가… “억양 변화도 자연스럽게 표현”

6월 9, 2025

오픈AI가 유료 사용자를 위한 고급 음성 모드를 대폭 개선했다. 더욱 자연스러운 억양과 표현력을 갖추게 된 챗GPT는 이제 실시간 언어 번역 기능도 제공한다. 오픈AI(OpenAI)는 지난…

메타 AI, 월 사용자 10억 명 돌파하며 수익화 계획 공개

메타 AI, 월 사용자 10억 명 돌파하며 수익화 계획 공개

5월 29, 2025

메타(Meta)의 앱 제품군에 적용된 인공지능 어시스턴트의 월간 활성 사용자가 10억 명을 돌파했다고 마크 저커버그 CEO가 5월 28일 연례 주주총회에서 발표했다. 저커버그는 “올해 목표는 개인화,…

구글, 크롬 브라우저 내 ‘제미나이’ 통합… “라이브 기능으로 음성 대화 가능”

구글, 크롬 브라우저 내 ‘제미나이’ 통합… “라이브 기능으로 음성 대화 가능”

5월 29, 2025

구글 크롬 브라우저에 통합된 제미나이(Gemini) AI 어시스턴트가 초기 버전으로 출시됐다. 이 기능은 웹 탐색 중 화면의 콘텐츠를 ‘볼 수 있는’ 능력을 갖추고 있어 구글의…

"Alexa, can you forget me?" Machine Unlearning Benchmark in Spoken Language Understanding

“알렉사, 나를 잊어줘” 음성 AI가 개인정보를 선택적으로 삭제하는 기술 등장

5월 23, 2025

“Alexa, can you forget me?” Machine Unlearning Benchmark in Spoken Language Understanding 음성 데이터 삭제가 시급한 이유: 개인 식별 정보 노출 위험성 음성 인공지능이…

아마존, 말투까지 이해하는 새로운 AI 음성 모델 '노바 소닉' 출시

아마존, 말투까지 이해하는 새로운 AI 음성 모델 ‘노바 소닉’ 출시

4월 10, 2025

아마존(Amazon)이 인간의 대화 방식을 더 깊이 이해하는 새로운 생성형 AI 모델 ‘노바 소닉(Nova Sonic)’을 발표했다. 이 모델은 단순히 말의 내용뿐만 아니라 어조, 억양, 속도까지…

Generative AI for Health

“위험한 질문은 인간에게, 일상 상담은 AI에게”… 저개발 국가의 AI 의료 혁신 사례

3월 26, 2025

Generative AI for Health 2-4일 대기에서 15분 응답으로: 케냐에서 매월 10,000건의 의료 질문을 처리하는 AI 생성형 AI(GenAI)는 저소득 및 중산층 국가(LMICs)에서 의료 접근성과 건강…

AI Matters 썸네일_MWC 2025 모바일을 재정의하는 AI

[AI 매터스 뉴스레터 #46] [MWC 2025] 스마트폰에서 스마트 조력자로, 모바일을 재정의하는 AI

3월 4, 2025

안녕하세요, AI 매터스 입니다.​​​​​​​AI 매터스는 생성형 AI 분야에서 수없이 쏟아져 나오는 소식 중에서 꼭 참고해야 할 내용을 엄선해 매일 기사를 발행하고 있습니다. 그 가운데 놓치지 말아야 할 중요한…

AI Matters 썸네일_MWC 2025 모바일을 재정의하는 AI

[MWC 2025] 스마트폰에서 스마트 조력자로, 모바일을 재정의하는 AI

3월 4, 2025

최근 스페인 바르셀로나(Barcelona)에서 열린 ‘모바일 월드 콩그레스(Mobile World Congress) 2025’에서는 인공지능(AI)이 스마트폰의 역할을 혁신적으로 변화시키는 다양한 기술들이 공개되었습니다. 이제 스마트폰은 단순한 통신 기기를 넘어…

MS 코파일럿, 모든 사용자에게 무제한 음성 기능과 심층 사고 기능 무료 제공

MS 코파일럿, 모든 사용자에게 무제한 ‘음성’ 기능과 ‘심층 사고’ 기능 무료 제공

2월 26, 2025

마이크로소프트(Microsoft)가 26일(현지 시간) 자사의 AI 어시스턴트 코파일럿(Copilot)에 대한 파격적인 업데이트를 발표했다. 마이크로소프트 코파일럿 공식 X에 따르면, 이제 모든 사용자들은 별도의 비용 지불 없이 ‘음성(Voice)’…

구글, ‘제미나이 2.0 플래시-라이트’ 공식 출시

구글, ‘제미나이 2.0 플래시-라이트’ 공식 출시

2월 26, 2025

구글 AI 개발자(Google AI Developers)가 25일(현지 시간) 최신 AI 모델인 ‘제미나이 2.0 플래시-라이트(Gemini 2.0 Flash-Lite)’를 일반에 공개했다. 구글 AI 개발자 공식 X에 따르면, 이…

네이버, 멀티모달 처리 능력 강화된 하이퍼클로바X 공개

네이버, 멀티모달 처리 능력 강화된 하이퍼클로바X 공개

8월 23, 2024

네이버가 자사의 대화형 AI 에이전트 클로바X(CLOVA X)에 시각 정보 처리 능력을 새롭게 추가한다고 밝혔다. 오는 27일 서비스 업데이트를 통해 이 기능이 도입될 예정이다. 또한…

음성 AI – AI 매터스