Agents Thinking Fast and Slow: A Talker-Reasoner Architecture
인간의 사고방식을 닮은 AI의 진화
구글 딥마인드가 대규모 언어 모델(Large Language Models, LLM)을 활용한 혁신적인 AI 에이전트 아키텍처를 공개했다. ‘토커-리즈너(Talker-Reasoner)’ 구조로 명명된 이 시스템은 노벨 경제학상 수상자 대니얼 카너먼의 ‘빠른 생각과 느린 생각’ 이론에서 영감을 받아 개발되었다. 연구진은 인간의 직관적이고 빠른 ‘시스템 1’과 논리적이고 느린 ‘시스템 2’라는 이중 사고방식을 AI 시스템에 성공적으로 구현했다.
토커-리즈너 아키텍처의 혁신적 설계
새롭게 제시된 토커-리즈너 아키텍처의 핵심은 두 개의 독립적인 에이전트의 유기적 협력에 있다. ‘토커’는 시스템 1에 해당하는 빠르고 직관적인 에이전트로, 사용자와의 자연스러운 대화를 전담한다. 제미니 1.5 플래시(Gemini 1.5 Flash) 모델을 기반으로 구현된 토커는 대화의 맥락을 즉각적으로 이해하고, 사용자의 감정을 인식하며, 적절한 응답을 실시간으로 생성하는 능력을 갖추고 있다.
반면 ‘리즈너’는 시스템 2에 해당하는 심층적 사고 담당 에이전트다. 계층적 구조로 설계된 리즈너는 복잡한 문제 해결과 다단계 추론을 수행하며, 필요할 경우 외부 도구나 데이터베이스를 활용해 정보를 수집하고 분석한다. 특히 사용자의 목표, 습관, 장애요인 등에 대한 정보를 JSON/XML 스키마 형태로 구조화하여 저장하고 지속적으로 업데이트하는 것이 특징이다.
기억 시스템을 통한 효율적 협업 구현
토커와 리즈너는 공유 메모리 시스템을 통해 효과적으로 협업한다. 리즈너가 생성한 신념 상태(belief state)와 문제 해결 계획은 메모리에 저장되고, 토커는 이를 실시간으로 참조하여 대화에 반영한다. 이러한 구조는 토커가 리즈너의 처리 완료를 기다리지 않고도 즉각적인 응답이 가능하게 하여, 자연스러운 대화 흐름을 유지하면서도 심층적인 문제 해결이 가능하게 한다.
수면 코칭 에이전트를 통한 실제 검증
연구팀은 이 아키텍처의 실효성을 검증하기 위해 수면 코칭 AI 에이전트를 개발했다. 임상 전문가들의 수면 관련 전문 지식을 바탕으로, 사용자 이해, 목표 설정, 코칭 계획이라는 세 단계로 구성된 체계적인 코칭 프로세스를 구현했다. 토커는 사용자와의 공감적 대화를 통해 수면 문제를 파악하고, 리즈너는 이를 바탕으로 개인화된 수면 개선 계획을 수립하는 방식으로 역할을 분담했다.
시스템의 성과와 한계
이 시스템의 가장 주목할 만한 성과는 즉각적인 대화 응답성과 깊이 있는 문제 해결 능력을 동시에 구현했다는 점이다. 기존의 AI 시스템들이 대화의 자연스러움과 문제 해결의 깊이 사이에서 균형을 잡지 못했던 것에 비해, 토커-리즈너 아키텍처는 두 가지 요구사항을 효과적으로 충족시켰다. 또한 기억 시스템을 통한 효율적인 정보 공유와 협업이 가능하며, 사용자 맞춤형 계획을 수립하고 지속적으로 개선할 수 있다는 점도 큰 장점이다.
그러나 현재 시스템에는 몇 가지 한계점도 존재한다. 토커가 때로는 리즈너의 최신 정보 없이 피상적인 답변을 제공할 수 있으며, 복잡한 문제 해결 과정에서는 토커와 리즈너 간의 동기화가 지연될 수 있다는 점이 확인되었다. 이는 향후 개선이 필요한 과제로 지적되었다.
미래 발전 방향과 전망
연구팀은 현재의 한계를 극복하기 위한 여러 연구 방향을 제시했다. 우선 토커가 리즈너의 개입이 필요한 상황을 자동으로 인식하고 대응하는 기능을 개발할 계획이다. 이는 시스템의 응답 품질을 높이고 일관성을 강화하는 데 기여할 것으로 기대된다.
또한 다양한 유형의 추론을 담당하는 여러 리즈너를 효율적으로 운영하는 방안도 연구 중이다. 이를 통해 더욱 전문적이고 정교한 문제 해결이 가능해질 것으로 예상된다. 사용자의 생각과 행동을 더 정확하게 이해하고 예측할 수 있는 고도화된 신념 상태 모델링 시스템도 개발될 예정이다.
이번 연구 성과는 인간의 인지 과정을 AI 시스템에 성공적으로 구현했다는 점에서 큰 의미를 가진다. 향후 이러한 이중 구조의 AI 에이전트는 교육, 의료, 상담, 고객 서비스 등 다양한 분야에서 활용되어 인간과 AI의 상호작용을 한층 더 자연스럽고 효과적으로 만들 것으로 전망된다.
기사에 인용된 리포트 원문은 링크에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
관련 콘텐츠 더보기