Search

우울증에 시달리는 아프간 여성들, GPT-4 챗봇과 1시간 대화 후 놀라운 변화

GPT Chatbots for Alleviating Anxiety and Depression: A Pilot Randomized Controlled Trial with Afghan Women
이미지 출처: 이디오그램 생성

일본 교토대학교 연구팀이 GPT-4로 만든 AI 상담사가 아프간 여성들의 마음 치료에 놀라운 효과를 보였다고 발표했다. 특히 공감하는 방법을 가르친 ‘지지적 청취자’ 버전 GPT-4는 일반 GPT-4보다 훨씬 좋은 결과를 냈다. 이때 ‘지지적 청취자’ 버전은 “도움이 되도록 잘 들어주는 상담사” 역할을 하는 AI 모델을 의미한다.

2024년 1월 9일부터 18일까지 60명의 아프간 여성을 4개 그룹으로 나누어 실험한 결과, 공감형 AI와 대화한 그룹은 불안과 우울 점수가 줄어들었다. 반대로 일반 GPT-4와 대화한 그룹은 오히려 늘어나 정반대 결과가 나왔다. 연구진은 단 1시간 AI와 대화하는 것만으로도 마음의 병이 크게 나아졌다고 밝혔다.

아프간 여성 80%가 우울증… 2,293명 지원자 중 60명만 뽑아

지금 아프간 여성들은 탈레반이 교육과 일을 금지하고, 사회가 불평등하며, 집에서 폭력을 당하는 등 여러 어려움에 시달리고 있다. 최근 조사를 보면 아프간 여성 47%가 극심한 마음의 고통을 받고 있고, 약 80%가 우울증 증상을 보인다고 한다. 마음 치료를 받기는 더욱 어렵다. 전 세계 평균으로는 사람 10만 명당 마음 치료 전문가가 13명 있지만, 남아시아는 2.8명뿐이다. 아프간은 사람 10만 명당 0.231명으로 전문 치료를 받기가 거의 불가능한 상황이다.

이번 연구에는 총 2,293명이 지원했지만, 까다로운 조건을 통과한 사람은 60명뿐이어서 합격률이 2.6%에 그쳤다. 참가자 중 58.33%가 23~27살이었고, 대학생이 63.33%, 대학 졸업자가 31.67%였다. 이런 상황에서 AI를 이용한 마음 치료는 많은 사람이 쉽게 접근할 수 있는 중요한 방법으로 주목받고 있다.

말하는 방식이 비슷할수록 치료 효과 커져

연구진이 대화 내용을 분석한 결과 흥미로운 사실을 발견했다. 공감형 AI 그룹에서 ‘언어 스타일 매칭’ 점수가 일반 GPT-4 그룹보다 높게 나왔다. 언어 스타일 매칭이란 AI와 사람이 비슷한 말하기 방식을 사용하는 정도를 나타낸다. 이 점수와 우울·불안 증상 개선 사이에는 반대 관계가 있어서, AI와 사용자가 비슷하게 말할수록 치료 효과가 크다는 것이 증명됐다.

구체적으로 말하는 방식에서도 차이가 났다. 공감형 AI는 “당신”이라는 말을 33% 더 많이 썼고, “우리”라는 말은 50% 적게 썼다. 긍정적인 말투 점수는 공감형 AI가 일반 GPT-4보다 37% 높았고, 긍정적인 감정 표현도 41% 더 많이 나타났다. 연구진은 사람끼리 대화할 때 언어 스타일 매칭 기준을 고려하면, 이번 연구 결과가 앞으로 사람과 AI 대화 연구에 중요한 기준이 될 수 있다고 평가했다.

공감하는 능력에서 76% 차이… AI 상담사 만들 때 가장 중요한 요소

참가자들이 AI의 공감 능력을 평가한 결과에서도 놀라운 차이가 나타났다. 공감형 AI 그룹은 일반 GPT-4 그룹보다 공감 반응 점수에서 76% 높은 평가를 받았다. 흥미롭게도 상황을 이해하는 능력 점수는 두 그룹이 비슷했다. 이는 AI가 상황을 알아듣는 것보다는 위로하고 격려하며 칭찬하는 능력이 치료 효과에 가장 중요하다는 것을 보여준다.

참가자들이 가장 많이 말한 단어는 일(38번), 교육(37번), 삶(35번), 탈레반(33번) 순이었다. 이는 아프간 여성들이 실제로 겪는 어려움을 잘 보여준다. 실제 AI의 답변에서도 차이가 뚜렷했다. 참가자가 우울하다고 말했을 때 공감형 AI는 “이런 기분이 드는 것은 드문 일이 아닙니다. 괜찮지 않아도 괜찮다는 것을 기억하세요”라며 부드럽게 전문가 도움을 권했다. 반면 일반 GPT-4는 “도움을 줄 수 없지만 마음 치료 전문가와 상담하는 것이 중요합니다”라며 직접적으로 말했다. 연구진은 “AI를 이용한 마음 치료에서 공감하는 소통 능력이 가장 중요한 요소”라고 강조했다.

FAQ

Q: AI 상담사가 기존 마음 치료를 완전히 대신할 수 있나요?

A: 아닙니다. 이 연구에서 AI 상담사는 기존 마음 치료를 도와주는 역할로 만들어졌습니다. 연구진은 AI가 기존 심리치료와 함께 작동해야 한다고 강조하며, 전문적인 치료가 필요할 때는 반드시 사람 치료사의 도움이 필요하다고 밝혔습니다.

Q: 단 1시간 대화로도 정말 효과가 있나요?

A: 네, 연구 결과 1시간 AI와 대화한 후 1주일이 지나도 불안과 우울 증상이 크게 줄어든 상태를 유지했습니다. 이는 짧은 치료로도 지속적인 효과를 낼 수 있다는 다른 연구 결과와 비슷합니다.

Q: 이런 AI 치료 서비스를 일반 사람도 쓸 수 있나요?

A: 지금은 연구 단계이지만, AI를 이용한 마음 건강 지원의 가장 큰 장점은 많은 사람이 쉽게 접근할 수 있다는 것입니다. 앞으로 적절한 안전장치와 윤리 규칙이 만들어진다면, 마음 치료 서비스를 받기 어려운 지역이나 상황에서 중요한 대안이 될 수 있을 것으로 예상됩니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: GPT Chatbots for Alleviating Anxiety and Depression: A Pilot Randomized Controlled Trial with Afghan Women

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




우울증에 시달리는 아프간 여성들, GPT-4 챗봇과 1시간 대화 후 놀라운 변화 – AI 매터스 l AI Matters