대형 언어 모델(LLM)이 발전하면서 AI와의 대화가 점점 자연스러워지고 있다. 하지만 여전히 해결되지 않은 과제가 있다. 바로 상대방의 언어 스타일에 맞춰 대화하는 ‘어휘 정렬(lexical alignment)’ 능력이다. 이에 네덜란드 라드바우드대학교(Radboud University) 연구팀은 단 10분간의 대화 데이터만으로 개인의 언어 스타일을 학습하는 AI 프로필 구축 방법을 제시했다. 이 연구는 특히 치매 환자처럼 의사소통에 어려움을 겪는 사람들을 위한 AI 시스템 개발에 중요한 기초를 제공한다.
사람처럼 말을 맞추는 AI, 어휘 정렬이란 무엇인가
어휘 정렬은 대화 중 두 사람이 점차 비슷한 단어와 표현을 사용하게 되는 자연스러운 현상이다. 예를 들어 한 사람이 어떤 물건을 ‘의자(chair)’라고 부르면, 대화 상대도 평소에는 ‘좌석(seat)’이라고 불렀더라도 ‘의자’라는 표현을 따라 사용하게 된다. 이러한 현상은 성공적인 의사소통에 필수적인 요소로 알려져 있다.
연구 논문에 따르면 사람들은 대화 상대가 비원어민이거나 어린이일 경우, 더 적극적으로 어휘를 맞춰주는 경향이 있다. 특히 상대방이 단어 찾기의 어려움을 겪을 때 자연스럽게 이런 조정이 발생한다. 이는 치매 환자와의 대화에서 특히 중요한 의미를 갖는다.
치매 환자는 단어 찾기의 어려움, 의도치 않은 단어 대체 등의 의사소통 문제를 경험한다. 기존 연구들에 따르면 치매 환자의 언어는 명사 사용이 감소하고 대명사와 형용사 사용이 증가하는 특징을 보인다. 또한 망설임을 반영하여 접속사 사용이 늘어나고, 동사 사용 패턴도 변화한다. 따라서 AI가 치매 환자의 언어 패턴에 맞춰 대화한다면 효과적인 소통을 지원할 수 있다.
10분이면 충분하다… 최소 데이터로 안정적인 프로필 구축
연구팀은 75세에서 95세 사이 평균 85세의 네덜란드 참전용사 38명이 참여한 50개의 인터뷰 녹취록을 분석했다. 이 연구는 치매 환자에게 특화된 연구 목표를 가지고 있었으나, 연구 당시 네덜란드어 치매 음성 데이터셋이 없었기 때문에 실제 실험 참가자는 노인의 자연스러운 발화를 반영하는 네덜란드 고령 참전용사였다.
연구팀은 5분, 10분, 15분, 20분, 25분, 30분 단위로 음성 전사 데이터를 나눠 프로필을 구축하고, 각 프로필이 이후 대화에서 얼마나 안정적으로 작동하는지 평가했다. 실험 결과 5분 데이터로 만든 프로필은 성능이 현저히 떨어졌지만, 10분 이상의 데이터로 구축한 프로필은 시간이 지나도 안정적인 성능을 유지했다. 이는 AI 시스템이 사용자와의 초기 상호작용만으로도 개인화된 대화 스타일을 학습할 수 있음을 의미한다.
형용사는 5개, 동사는 10개가 실용적 선택
연구팀은 프로필에 포함할 단어의 개수도 세밀하게 분석했다. 명사, 대명사, 형용사, 접속사, 동사, 부사 등 6가지 품사 카테고리별로 3개, 5개, 10개, 15개, 20개의 단어를 포함하는 다양한 조합을 테스트했다. 실험 결과 형용사와 접속사는 5개, 부사, 명사, 대명사, 동사는 각각 10개씩 포함하는 조합이 데이터 효율성과 성능의 균형 측면에서 가장 실용적인 선택으로 나타났다.
흥미롭게도 프로필 크기를 늘릴수록 더 많은 단어를 포착할 수 있었지만, 덜 안정적이고 대표성이 낮은 단어들이 포함되어 오히려 성능이 떨어지는 경우도 있었다. 형용사와 명사는 대화 주제에 따라 변동성이 크기 때문에 다른 품사에 비해 다소 낮은 성능을 보였다.
실시간 입력 없이도 작동하는 AI, 치매 환자 케어의 새 가능성
이 연구는 네덜란드 치매 노인을 위한 음성 기반 AI 시스템 개발 프로젝트의 일환으로 진행됐다. 이 방법의 가장 큰 장점은 실시간 사용자 입력에 의존하지 않는다는 점이다. 기존 AI 시스템은 대화 중 사용자 입력을 실시간으로 분석하여 스타일을 맞추는 방식이었지만, 이는 치매 환자처럼 일관된 입력을 제공하기 어려운 경우에는 한계가 있다.
반면 사전에 구축된 개인화 프로필을 활용하면 실시간 입력이 제한적이더라도 안정적인 어휘 정렬이 가능하다. 연구팀이 미확인 데이터로 테스트한 결과, 이 프로필 구성은 새로운 대화에서도 안정적인 성능을 보였다.
다만 본 연구는 실제 치매 환자 임상 환경이 아닌 고령자 대화 데이터를 기반으로 개념적 가능성을 입증한 데 의의가 있다. 프로필이 시간에 걸쳐 안정성을 유지하면서도, 향후 환자의 인지 상태 변화와 같은 주요 순간에 선택적으로 업데이트할 수 있다면 장기적으로도 효과적일 것으로 기대된다. 연구팀은 특히 치매 케어와 같이 사용자 입력이 제한적이거나 일관되지 않을 수 있는 상황에서 이 접근법이 보다 포용적인 AI 대화 시스템을 가능하게 한다고 밝혔다. 향후 실제 치매 환자 데이터를 활용한 추가 검증이 필요하다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q1. 어휘 정렬이 AI 대화 시스템에서 왜 중요한가요?
A: 어휘 정렬은 두 사람이 대화할 때 자연스럽게 비슷한 단어를 사용하게 되는 현상으로, 성공적인 의사소통에 필수적입니다. AI가 사용자의 언어 스타일에 맞춰 대화하면 더 자연스럽고 편안한 상호작용이 가능하며, 특히 치매 환자처럼 의사소통에 어려움을 겪는 경우 효과가 큽니다.
Q2. 10분 대화만으로 정말 충분한가요?
A: 연구 결과에 따르면 10분간의 대화 데이터로 구축한 프로필은 시간이 지나도 안정적인 성능을 유지했습니다. 5분 데이터는 불충분했지만, 10분 이상의 데이터로는 개인의 대표적인 언어 패턴을 충분히 포착할 수 있었습니다.
Q3. 이 기술은 일반인에게도 적용될 수 있나요?
A: 이 연구는 치매 노인을 위한 AI 개발에 초점을 맞췄지만, 개인화된 어휘 프로필 구축 방법 자체는 다양한 상황에 적용 가능합니다. 다만 연구팀은 향후 다양한 연령대와 언어 그룹에서도 효과가 있는지 추가 검증이 필요하다고 밝혔습니다.
해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.
논문명: Towards Stable and Personalised Profiles for Lexical Alignment in Spoken Human-Agent Dialogue
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.






