• Home
  • AI Report
  • LLM 기반 AI, 사용자와의 ‘대화’로 문제해결 능력 2배 높였다

LLM 기반 AI, 사용자와의 ‘대화’로 문제해결 능력 2배 높였다

ReSpAct: Reasoning, Speaking, and Acting Towards Building Large Language Model-Based Conversational AI Agents
이미지출처: 이디오그램

ReSpAct: Reasoning, Speaking, and Acting Towards Building Large Language Model-Based Conversational AI Agents

AI와 인간의 협업으로 문제해결력 향상

일리노이 대학교 연구진이 AI가 사용자와의 실시간 소통을 통해 문제해결 능력을 대폭 향상시킬 수 있는 새로운 프레임워크 ‘ReSpAct’를 개발했다. 이 프레임워크는 기존 AI 에이전트들이 가진 독자적 판단의 한계를 넘어, 사용자와의 대화를 통해 불확실성을 해소하고 실수를 수정하며 더 나은 결과를 도출할 수 있게 했다.

연구진은 “기존의 AI 에이전트들이 모호한 상황에서 가정에 기반한 결정을 내리는 한계가 있었다”며 “ReSpAct는 사용자와의 자연스러운 대화를 통해 이러한 한계를 극복했다”고 설명했다. 특히 전자상거래 환경에서 진행된 실험에서는 사용자와의 대화 없이 독자적으로 과제를 수행했을 때 12%에 그쳤던 성공률이, 사용자와의 대화를 통해 50%까지 향상되는 놀라운 결과를 보여줬다.

추론-대화-행동의 유기적 결합이 핵심

ReSpAct의 핵심은 AI의 추론(Reasoning), 대화(Speaking), 행동(Acting) 능력을 유기적으로 결합한 것이다. AI는 복잡한 과제를 수행하는 과정에서 불확실한 상황에 직면하면 사용자에게 질문을 하거나 피드백을 요청할 수 있다. 또한 사용자의 응답을 바탕으로 계획을 수정하고 더 나은 결정을 내릴 수 있게 된다.

예를 들어, AI가 주방에서 특정 냄비를 가져오라는 지시를 받았을 때, 여러 개의 냄비가 있다면 사용자에게 어떤 냄비를 가져와야 하는지 물어볼 수 있다. 또한 잘못된 냄비를 가져왔을 경우, 사용자의 즉각적인 피드백을 통해 실수를 바로잡을 수 있다.

다양한 환경에서 검증된 성능

연구진은 ReSpAct의 효과를 검증하기 위해 세 가지 다른 환경에서 실험을 진행했다. 첫째, 가정환경을 시뮬레이션한 ALFWorld에서는 기존 방식 대비 6% 향상된 87.3%의 성공률을 기록했다. 둘째, 호텔·레스토랑 예약 시스템인 MultiWOZ에서는 정보 제공률과 성공률이 각각 5.5%와 3% 개선됐다. 마지막으로 전자상거래 플랫폼 WebShop에서는 사용자와의 실시간 소통을 통해 성공률이 50%까지 올라갔다.

특히 주목할 만한 점은 WebShop 환경에서의 실험 결과다. AI가 독자적으로 상품을 검색하고 구매를 결정할 때는 12%의 낮은 성공률을 보였지만, 사용자와 대화하며 선호도를 파악하고 대안을 제시하는 과정을 거치자 성공률이 4배 이상 증가했다. 이는 AI와 인간의 협업이 얼마나 중요한지를 잘 보여주는 사례다.

미래 발전 방향과 현재의 한계

ReSpAct는 AI가 보다 직관적이고 신뢰할 수 있는 방식으로 작동하도록 하는 중요한 진전이지만, 동시에 몇 가지 도전 과제도 안고 있다. 실제 환경은 실험실의 벤치마크 테스트보다 훨씬 복잡하고 비정형화되어 있어, 사용자의 의도를 정확히 파악하는 것이 더 어려울 수 있다.

또한 AI가 사용자의 입력에 지나치게 의존할 경우 작업 효율이 떨어질 수 있다는 점도 한계로 지적된다. 연구진은 “AI 에이전트의 자율성과 사용자 개입 사이의 적절한 균형을 찾는 것이 향후 중요한 연구 과제”라고 밝혔다.

이러한 한계에도 불구하고, ReSpAct는 AI가 독자적으로 작업을 수행하는 것보다 사용자와 소통하며 협력할 때 더 나은 결과를 얻을 수 있다는 것을 명확히 보여줬다. 이는 향후 AI 시스템 개발에 있어 인간-AI 협력의 중요성을 다시 한번 확인시켜주는 결과다.

기사에 인용된 연구에 대한 자세한 정보는 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




LLM 기반 AI, 사용자와의 ‘대화’로 문제해결 능력 2배 높였다 – AI 매터스