Generative AI Can Harm Learning
인공지능(AI) 기술이 빠르게 발전하면서 교육 분야에서의 활용 가능성에 대한 관심이 높아지고 있다. 특히 챗GPT(ChatGPT)와 같은 생성형 AI 도구는 학생들의 학습을 돕는 혁신적인 방법으로 주목받고 있다. 하지만 최근 연구 결과에 따르면 이러한 AI 도구가 학생들의 장기적인 학습 능력 발달에 오히려 부정적인 영향을 미칠 수 있는 것으로 나타났다.
GPT-4 기반 AI 튜터, 단기 성과는 높였지만 장기 학습 저해
펜실베이니아 대학교의 함사 바스타니(Hamsa Bastani), 오스베르트 바스타니(Osbert Bastani), 알프 순구(Alp Sungu) 등 연구진은 터키의 한 고등학교에서 약 1,000명의 학생들을 대상으로 GPT-4 기반 AI 튜터의 영향을 분석했다. 이 대규모 현장 실험은 생성형 AI가 학생들의 학습에 미치는 영향을 실제 교육 환경에서 검증한 첫 사례로 주목받고 있다.
연구팀은 학생들을 세 그룹으로 나눠 실험을 진행했다. 첫 번째 그룹은 일반 ChatGPT 인터페이스와 유사한 ‘GPT Base’를, 두 번째 그룹은 학습 보호 장치가 포함된 ‘GPT Tutor’를 사용했다. 세 번째 그룹은 AI 도구 없이 공부하는 대조군으로 설정됐다. 실험은 9학년, 10학년, 11학년 학생들을 대상으로 각 학년 교과 과정의 약 15%를 차지하는 네 차례의 90분 수업 세션으로 구성됐다.
연구 결과, AI 튜터를 사용한 학생들은 연습 문제 풀이에서 큰 성과 향상을 보였다. ‘GPT Base’ 사용 그룹은 48%, ‘GPT Tutor’ 사용 그룹은 무려 127%의 성적 향상을 기록했다. 이는 기존 연구에서 밝혀진 생성형 AI의 생산성 향상 효과와 일치하는 결과다.
하지만 이후 AI 도구 없이 치른 시험에서는 예상치 못한 결과가 나왔다. ‘GPT Base’ 사용 그룹의 성적이 대조군보다 17% 낮았던 것이다. ‘GPT Tutor’ 그룹은 대조군과 비슷한 수준을 유지했지만, 유의미한 성적 향상은 없었다.
연구진은 “학생들이 AI를 ‘지팡이’처럼 사용하면서 스스로 문제를 해결하는 능력 개발이 저해된 것으로 보인다”고 분석했다. 즉, AI의 도움으로 단기적인 성과는 높일 수 있지만, 이는 학생들의 실제 학습과 이해로 이어지지 않았다는 것이다.
AI의 오류 자체보다는 의존도가 문제
연구팀은 GPT Base의 오류율과 학생들의 성과 사이의 관계도 자세히 분석했다. GPT Base는 연습 문제의 51%만 정확히 풀었고, 42%는 논리적 오류를, 8%는 계산 오류를 보였다.
흥미로운 점은 AI의 오류 자체가 학생들의 시험 성적에 큰 영향을 미치지 않았다는 것이다. 연구진은 “만약 학생들이 GPT Base의 논리적 오류에 오도되었다면, 이는 해당 시험 문제의 성적에 영향을 미쳤을 것”이라고 설명했다. 하지만 실제로는 그러한 연관성이 발견되지 않았다. 이는 학생들이 AI의 답변을 비판적으로 검토하지 않고 그대로 수용하고 있음을 시사한다.
실제로 학생들의 메시지를 분석한 결과, GPT Base 사용 그룹은 대부분 단순히 답을 요구하는 경향을 보였다. 반면 GPT Tutor 그룹은 시간이 지날수록 더 실질적인 상호작용을 하는 것으로 나타났다. 이는 AI 도구의 설계 방식이 학생들의 학습 행동에 큰 영향을 미칠 수 있음을 보여준다.
학생들의 인식과 실제 성과 사이의 괴리
연구진은 학생들의 자기 인식도 조사했다. 흥미롭게도 GPT Base 사용 그룹의 학생들은 자신들의 시험 성적이 실제로 떨어졌음에도 불구하고, 학습 효과나 시험 성적에 대해 부정적으로 인식하지 않았다. GPT Tutor 그룹의 학생들은 실제 시험 성적 향상이 없었음에도 자신들의 성과가 크게 개선되었다고 느꼈다.
이러한 인식과 실제 성과 사이의 괴리는 교육 분야에서 AI 도구를 도입할 때 주의해야 할 또 다른 요소다. 학생들이 AI의 도움으로 인한 단기적인 성과 향상을 실제 학습의 개선으로 오해할 수 있기 때문이다.
AI 활용 교육, 신중한 접근 필요
이번 연구 결과는 AI 기술을 교육에 도입할 때 신중한 접근이 필요함을 강력히 시사한다. 단기적인 성과 향상에 집중하기보다는 학생들의 장기적인 학습 능력 개발을 고려해야 한다는 것이다.
연구를 주도한 함사 바스타니 교수는 “AI 도구가 인간의 성과를 크게 향상시킬 수 있지만, 학습이 중요한 상황에서는 적절한 보호 장치와 함께 배포되어야 한다”고 강조했다. 이는 AI를 교육에 도입할 때 단순히 기술적 측면만이 아니라 교육학적 고려사항도 함께 검토해야 함을 의미한다.
특히 연구진은 GPT Tutor와 같이 학습 보호 장치가 포함된 AI 도구의 가능성에 주목했다. GPT Tutor는 학생들에게 직접적인 답을 제공하는 대신 단계별 힌트를 제공하도록 설계되었다. 이러한 접근 방식은 GPT Base와 달리 학생들의 실제 학습을 저해하지 않으면서도 문제 해결을 지원할 수 있었다.
교육 전문가들은 AI를 활용한 학습에서 교사의 역할이 더욱 중요해질 것으로 전망한다. AI의 장점을 살리면서도 학생들의 비판적 사고력과 문제 해결 능력을 키울 수 있는 균형 잡힌 접근이 요구된다는 것이다.
또한 이번 연구는 AI가 학생들 간의 “능력 격차”를 줄이는 데 도움이 될 수 있음을 보여줬다. AI 도구는 특히 성적이 낮은 학생들에게 더 큰 도움을 주는 것으로 나타났다. 하지만 이러한 격차 감소 효과는 AI 도구에 대한 접근이 제한될 때 지속되지 않았다. 이는 AI를 교육에 도입할 때 형평성 문제도 함께 고려해야 함을 시사한다.
AI 시대의 교육, 새로운 도전과 기회
이번 연구는 생성형 AI가 교육에 미치는 영향에 대한 중요한 통찰을 제공한다. AI는 학생들의 학습을 지원하는 강력한 도구가 될 수 있지만, 동시에 학생들의 자기주도적 학습 능력을 저해할 위험도 있다.
교육 기관과 정책 입안자들이 AI를 교육에 도입할 때는 여러 가지 중요한 사항을 고려해야 한다. 먼저, AI 도구의 설계에 있어 단순히 정답을 제공하는 것을 넘어서 학생들의 사고 과정을 자극하고 지원하는 방식으로 접근해야 한다. 이는 학생들의 능동적인 학습을 촉진하고 실제 이해도를 높이는 데 도움이 될 것이다.
또한, AI 시대에 맞춰 교사의 역할도 재정의될 필요가 있다. 전통적인 지식 전달자에서 학습 촉진자로의 변화가 요구되며, 교사들은 AI를 효과적으로 활용하면서도 학생들의 비판적 사고력을 키우는 새로운 교수법을 습득해야 한다. 이는 AI와 인간 교육자의 장점을 결합한 새로운 교육 모델의 핵심이 될 것이다.
학생들의 AI 리터러시 향상도 중요한 과제이다. AI의 장단점을 이해하고 이를 비판적으로 활용할 수 있는 능력은 미래 사회에서 필수적인 역량이 될 것이다. 따라서 AI 리터러시 교육을 정규 교육과정에 포함시키는 것을 고려해야 한다.
평가 방식의 변화도 필요하다. AI 시대에는 단순 암기나 계산 능력보다는 창의력, 문제 해결 능력, 비판적 사고력 등이 더욱 중요해질 것이다. 이에 맞춰 새로운 평가 방식을 개발하고 도입해야 한다. 이는 교육의 목표와 방향성을 재설정하는 계기가 될 수 있다.
마지막으로, AI 활용에 따른 윤리적 고려사항도 간과해서는 안 된다. 학생들의 프라이버시 보호와 데이터 보안은 AI 기반 교육 시스템에서 매우 중요한 이슈이다. 따라서 AI 도입 과정에서 이러한 윤리적 문제들을 신중히 검토하고 적절한 가이드라인을 수립해야 할 것이다.
이러한 다각도의 접근을 통해 AI 기술의 장점을 최대한 활용하면서도 교육의 본질적 가치를 지키는 균형 잡힌 교육 혁신이 가능할 것이다.
보고서 원문은 링크에서 확인할 수 있다.
본 기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
관련 콘텐츠 더보기