• Home
  • News
  • 챗GPT 음성 모드에 ‘번역 기능’ 추가… “억양 변화도 자연스럽게 표현”

챗GPT 음성 모드에 ‘번역 기능’ 추가… “억양 변화도 자연스럽게 표현”

오픈AI, 챗GPT 음성 모드에 ‘번역 기능’ 추가… “억양 변화도 자연스럽게 표현”
이미지 출처: 오픈AI

오픈AI가 유료 사용자를 위한 고급 음성 모드를 대폭 개선했다. 더욱 자연스러운 억양과 표현력을 갖추게 된 챗GPT는 이제 실시간 언어 번역 기능도 제공한다. 오픈AI(OpenAI)는 지난 7일(현지 시간) 유료 사용자를 위한 고급 음성 모드(Advanced Voice Mode)에 대한 주요 업데이트를 발표했다. 이번 업데이트를 통해 유료 사용자들은 더욱 자연스러운 대화 경험과 함께 실시간 언어 번역 기능을 이용할 수 있게 됐다.


오픈AI에 따르면, 새롭게 개선된 고급 음성 모드는 대화 중 미묘한 억양 변화, 자연스러운 흐름(휴지와 강조 포함), 그리고 공감이나 풍자와 같은 감정 표현에서 훨씬 더 사람과 같은 느낌을 전달한다. 가장 주목할 만한 새로운 기능은 직관적이고 효과적인 언어 번역 기능이다. 사용자는 음성 모드에게 언어 간 번역을 요청하면, 대화가 끝나거나 중단 또는 전환을 지시할 때까지 계속해서 번역을 제공한다. 예를 들어, 브라질 레스토랑에서 음성 모드를 사용하면 영어 문장을 포르투갈어로 번역하고, 웨이터의 포르투갈어 응답은 다시 영어로 번역해 주는 방식으로 원활한 의사소통을 돕는다.

이번 업데이트는 모든 국가의 모든 유료 사용자에게 제공되며, 메시지 작성기의 음성 아이콘을 탭하면 사용할 수 있다. 이는 올해 초 발표된 중단 감소 및 억양 개선 업데이트에 이은 추가 개선 사항이다.

다만 오픈AI는 일부 제한 사항도 공개했다. 테스트 중에 관찰된 바에 따르면, 이번 업데이트로 인해 간혹 오디오 품질이 약간 저하되는 경우가 있으며, 특히 특정 음성 옵션에서 톤과 피치의 예상치 못한 변화가 더 두드러질 수 있다고 설명했다. 또한 음성 모드에서 드물게 광고, 무의미한 소리, 또는 배경 음악과 같은 의도하지 않은 소리가 발생하는 환각(hallucination) 현상이 여전히 존재한다고 밝혔다.

한편, 오픈AI는 이러한 문제들을 해결하기 위해 적극적으로 조사하고 있으며 시간이 지남에 따라 오디오 일관성을 개선할 것으로 예상한다고 덧붙였다.

해당 업데이트에 대한 자세한 사항은 오픈AI 웹사이트에서 확인 가능하다.

이미지 출처: 오픈AI




챗GPT 음성 모드에 ‘번역 기능’ 추가… “억양 변화도 자연스럽게 표현” – AI 매터스 l AI Matters