Generative Agent Simulations of 1,000 People
AI 인터뷰로 밝혀낸 인간 행동 패턴
스탠포드 대학교 연구진이 획기적인 연구 결과를 발표했다. 실제 사람들과의 2시간 인터뷰를 바탕으로 개인의 태도와 행동을 정확하게 예측하는 AI 시스템을 개발한 것이다. 연구팀은 인구통계학적으로 다양한 배경을 가진 1,052명의 미국인을 대상으로 연구를 진행했다.
혁신적인 AI 인터뷰 시스템
연구진은 참가자들과의 심층 인터뷰를 위해 특별한 AI 인터뷰어를 개발했다. 이 AI는 미리 준비된 질문을 하면서도 참가자의 답변에 따라 적절한 후속 질문을 생성할 수 있었다. 평균적으로 AI 인터뷰어는 99개의 기본 질문에 더해 약 82개의 추가 질문을 던지며, 참가자당 평균 6,491단어 분량의 응답을 이끌어냈다.
인터뷰는 참가자의 생애사부터 시작해 현재의 일상생활, 사회적 이슈에 대한 견해까지 폭넓은 주제를 다루었다. 이러한 방식은 설문조사나 간단한 인구통계학적 정보만으로는 파악하기 어려운 개인의 깊이 있는 특성을 이해하는 데 도움이 되었다.
놀라운 예측 정확도
연구팀은 AI 시스템의 예측 능력을 다양한 방식으로 검증했다. 먼저 일반사회조사(General Social Survey, GSS)에서 AI는 참가자들의 응답을 68.85%의 정확도로 예측했다. 이는 참가자들이 2주 후 보인 자기 응답 일관성 81.25% 대비 85%에 해당하는 놀라운 수준이었다.
성격 5요인 검사에서는 개방성, 성실성, 외향성, 친화성, 신경증의 5가지 성격 특성을 예측했는데, 참가자들의 자기 일관성 대비 80%의 정확도를 달성했다.
행동경제학 실험에서는 독재자 게임, 신뢰 게임, 공공재 게임, 죄수의 딜레마 등 다양한 경제 게임에서의 의사결정을 예측했으며, 참가자들의 자기 일관성 대비 66%의 정확도를 기록했다.
또한 연구진은 5개의 주요 사회과학 실험 결과를 성공적으로 재현했으며, 실험 효과 크기에서 실제 참가자들과 0.98의 높은 상관관계를 보였다.
인터뷰 기반 접근법의 장점

연구진은 인터뷰 기반 방식의 우수성을 입증하기 위해 다른 방법들과 비교 실험을 진행했다. 단순히 인구통계학적 정보나 자기소개문만을 사용한 AI와 비교했을 때, 인터뷰 기반 AI가 더 정확한 예측을 보여줬다.
특히 주목할 만한 점은 편향성 감소 효과다. 정치적 성향에 따른 예측 정확도 차이가 인구통계 기반 방식에서는 12.35%였으나, 인터뷰 기반 방식에서는 7.85%로 줄었다. 인종 간 예측 정확도 차이도 3.33%에서 2.08%로 감소했다.
더욱 흥미로운 점은 인터뷰 내용의 80%를 무작위로 제거하고도, 여전히 인구통계 정보만을 사용한 경우보다 높은 예측 정확도를 보였다는 것이다. 이는 짧은 대화만으로도 개인의 특성을 효과적으로 파악할 수 있음을 시사한다.
연구의 의의와 한계
이번 연구는 AI가 실제 개인들의 태도와 행동을 높은 정확도로 시뮬레이션할 수 있다는 것을 보여줬다. 특히 심층 인터뷰를 통한 접근 방식이 기존의 방법들보다 더 정확하고 공정한 예측을 가능하게 한다는 점이 입증되었다.
다만 연구진은 이러한 AI 시스템의 활용에 있어 개인정보 보호와 윤리적 고려가 중요하다고 강조했다. 이를 위해 연구팀은 데이터 접근에 대한 이원화된 시스템을 제안했다. 고정된 작업에 대한 집계된 응답은 일반 연구자들에게 공개하고, 개별 응답이 필요한 경우는 엄격한 심사를 거쳐 제한적으로 접근을 허용하는 방식이다.
데이터 수집 및 참가자 구성
이번 연구는 다양한 배경을 가진 참가자들을 대상으로 진행되었다. 참가자들의 평균 연령은 47.55세였으며, 표준편차는 15.93세였다. 성별 구성은 여성 593명, 남성 459명이었으며, 교육수준은 학사학위 소지자 283명, 석사 이상 151명, 준학사 학위 185명으로 다양했다. 인종별로는 백인/코카서스 833명, 흑인/아프리카계 미국인 154명, 아시아인 53명, 기타 95명이 참여했다.
참가자들에 대한 보상은 단계별로 이루어졌다. 첫 단계 참여에 대해 60달러, 2주 후 진행된 두 번째 단계에서 30달러를 지급받았으며, 경제 게임 결과에 따라 최대 10달러의 추가 보상이 주어졌다.
이 연구는 AI가 인간의 행동과 태도를 이해하고 예측하는 새로운 가능성을 보여주었다. 특히 심층적인 대화를 통한 접근 방식이 가진 장점을 실증적으로 입증했다는 점에서 의의가 있다.
기사에 인용된 논문의 원문은 링크에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
관련 콘텐츠 더보기