구글 연구팀이 시각장애인을 위한 세계 최초의 접근 가능한 스트리트뷰 도구 ‘StreetReaderAI’를 선보였다. 이 시스템은 상황을 이해하는 AI와 쉬운 조작법을 결합해, 그동안 시각장애인이 전혀 이용할…
마이크로소프트 AI(MAI)가 자체 개발한 음성 생성 모델과 파운데이션 모델을 동시에 공개했다고 28일(현지 시간) 발표했다. 먼저 공개된 ‘MAI-Voice-1’은 단일 GPU에서 1초 이내에 1분 분량의 오디오를…
퍼플렉시티(Perplexity)가 iOS용 앱에 다양한 기능을 수행할 수 있는 ‘음성 비서(Voice Assistant)’를 출시했다. 이 새로운 기능은 웹 브라우징과 멀티앱 작업을 통해 예약, 이메일 전송, 캘린더…
그록이 22일(현지 시간) 자사 공식 X 계정을 통해 이미지 인식 기능인 ‘그록 비전(Grok Vision)’, 다국어 오디오 지원, 그리고 음성 모드에서의 실시간 검색 기능 업데이트를…