Search

  • Home
  • AI 음성 인터페이스

AI 음성 인터페이스

StreetReaderAI: Towards making street view accessible via context-aware multimodal AI

구글, 시각장애인용 스트리트뷰 첫 공개… “AI가 세계 거리 이미지 읽어준다”

10월 31, 2025

구글 연구팀이 시각장애인을 위한 세계 최초의 접근 가능한 스트리트뷰 도구 ‘StreetReaderAI’를 선보였다. 이 시스템은 상황을 이해하는 AI와 쉬운 조작법을 결합해, 그동안 시각장애인이 전혀 이용할…

MS, 자체 개발 AI 모델 2종 공개... "1초 만에 1분 음성 생성"

MS, 자체 개발 AI 모델 2종 공개… “코파일럿에서 1초 만에 1분 음성 생성”

8월 29, 2025

마이크로소프트 AI(MAI)가 자체 개발한 음성 생성 모델과 파운데이션 모델을 동시에 공개했다고 28일(현지 시간) 발표했다. 먼저 공개된 ‘MAI-Voice-1’은 단일 GPU에서 1초 이내에 1분 분량의 오디오를…

퍼플렉시티, iOS 앱에 '음성 비서' 출시… “웹 브라우징과 멀티앱 기능 갖췄다”

퍼플렉시티, iOS 앱에 ‘음성 비서’ 출시… “웹 브라우징과 멀티앱 기능 갖췄다”

4월 24, 2025

퍼플렉시티(Perplexity)가 iOS용 앱에 다양한 기능을 수행할 수 있는 ‘음성 비서(Voice Assistant)’를 출시했다. 이 새로운 기능은 웹 브라우징과 멀티앱 작업을 통해 예약, 이메일 전송, 캘린더…

그록, 이미지 인식 기능 ‘그록 비전’ 출시… 다국어 오디오와 음성모드 업데이트

그록, 이미지 인식 기능 ‘그록 비전’ 출시… 다국어 오디오와 음성모드 업데이트

4월 23, 2025

그록이 22일(현지 시간) 자사 공식 X 계정을 통해 이미지 인식 기능인 ‘그록 비전(Grok Vision)’, 다국어 오디오 지원, 그리고 음성 모드에서의 실시간 검색 기능 업데이트를…

AI 음성 인터페이스 - AI매터스