• Home
  • News
  • 일레븐랩스, 차세대 대화형 AI 2.0 출시… 기업용 음성 에이전트 시장 공략

일레븐랩스, 차세대 대화형 AI 2.0 출시… 기업용 음성 에이전트 시장 공략

일레븐랩스, 차세대 대화형 AI 2.0 출시… 기업용 음성 에이전트 시장 공략
이미지 출처: 일레븐랩스

일레븐랩스(ElevenLabs)가 대화형 AI 2.0(Conversational AI 2.0)을 출시했다고 지난달 30일(현지 시간) 발표했다. 이번 새로운 플랫폼은 기존 버전 출시 5개월 만에 선보이는 것으로, 세계에서 가장 정교하고 유능하며 신뢰할 수 있는 음성 에이전트 개발을 목표로 한다. 새로운 플랫폼은 기본적인 대화 API에서 최첨단 턴테이킹(turn-taking) 모델로 업그레이드됐다. 또한 통합 RAG(Retrieval-Augmented Generation) 기술을 통해 지식 접근이 가능해졌으며, 수동 언어 전환에서 자동 언어 감지 기능으로 개선됐다. 단일 음성 에이전트에서 다중 캐릭터 전환이 가능한 페르소나 기능도 추가됐다.


대화형 AI 2.0의 핵심 개선사항은 자연스러운 상호작용 흐름에 있다. 전통적인 음성 시스템이 인간 대화의 리듬을 따라가지 못해 어색한 침묵이나 부자연스러운 끼어들기를 보이는 문제를 해결했다. 새로운 턴테이킹 모델은 “음”, “아” 같은 대화 신호를 실시간으로 분석해 언제 끼어들거나 기다려야 할지 판단한다. 다국어 커뮤니케이션 기능도 크게 향상됐다. 통합 언어 감지 기능을 통해 AI가 사용자가 말하는 언어를 자동으로 식별하고 같은 상호작용 내에서 적절하게 응답할 수 있다. 이는 수동 설정이나 사용자 프롬프트 없이도 원활한 다국어 토론을 가능하게 한다.

지식과 창의성 측면에서도 대폭 개선됐다. 통합 RAG 기술을 통해 AI 모델이 외부 지식 소스의 정보에 접근해 응답에 통합할 수 있게 됐다. 일레븐랩스는 이 기능을 음성 에이전트 아키텍처에 직접 통합해 특정 지식 베이스에서 검색이 가능하도록 했으며, 최소 지연시간과 최대 개인정보 보호를 달성했다고 밝혔다. 운영 간소화를 위한 멀티모달리티 기능도 도입됐다. 엔지니어들이 텍스트 에이전트와 음성 에이전트를 각각 따로 개발해야 했던 기존 방식에서 벗어나, 이제 텍스트, 음성 또는 두 가지 모두로 동시에 소통할 수 있는 에이전트를 만들 수 있다. 에이전트를 한 번만 정의하면 되므로 엔지니어링 팀의 부담이 줄어든다.

배치 콜링(Batch Calling) 기능을 통해 대규모 아웃바운드 음성 커뮤니케이션 자동화가 가능해졌다. 사용자는 대화형 AI 에이전트를 사용해 여러 아웃바운드 호출을 동시에 시작할 수 있으며, 알림 발송, 설문조사 실시, 대규모 연락처 목록에 개인화된 메시지 전달 등의 용도로 활용할 수 있다.

기업용 기능도 대폭 강화됐다. 완전한 HIPAA 규정 준수를 통해 의료 애플리케이션에서 환자 데이터 개인정보 보호와 규제 준수를 보장한다. 기업급 보안 조치를 구현해 데이터를 보호하고 시스템 무결성을 확보했으며, 기존 기업 시스템 및 워크플로우와의 원활한 연결을 위한 서드파티 통합 기능도 제공한다. 선택적 EU 데이터 거주 옵션을 통해 유럽연합에서 운영되거나 서비스를 제공하는 조직의 데이터 주권 요구사항을 충족한다. 업계 최고 수준의 신뢰성으로 높은 가용성과 일관된 성능을 제공해 중요한 비즈니스 기능에 에이전트를 안정적으로 사용할 수 있도록 지원한다.

해당 발표에 대한 자세한 사항은 링크에서 확인 가능하다.

이미지 출처: 일레븐랩스




일레븐랩스, 차세대 대화형 AI 2.0 출시… 기업용 음성 에이전트 시장 공략 – AI 매터스 l AI Matters