독일 뒤스부르크-에센 대학교(University of Duisburg-Essen)와 보훔 루르 대학교(Ruhr-University Bochum) 연구진이 교수 113명과 학생 123명을 대상으로 실시한 설문 조사 결과, 대학 교육 현장에서 생성형 AI 사용을 둘러싼 심각한 인식 격차가 드러났다. 해당 논문에 따르면, 연구진은 교수와 학생 양측이 서로의 AI 활용 정도를 실제보다 크게 과대평가하고 있으며, 이러한 오해가 대학 교육의 핵심인 상호 신뢰를 위협할 수 있다고 경고했다.
학생의 AI 사용 빈도, 교수보다 평균 0.35점 높아
연구 결과에 따르면, 학생들은 교수들보다 학술 과제에서 AI를 더 자주 사용하는 것으로 나타났다. 5점 척도 기준으로 학생들의 AI 사용 빈도는 교수보다 평균 0.35점 높았으며, 이는 통계적으로 유의미한 차이였다. 연구진은 정보 검색, 문헌 조사, 프로그래밍, 글쓰기, 시각화, 번역 등 6개 학술 과제를 대상으로 분석을 진행했다.
특히 학생들의 높은 AI 사용률은 단순히 도구를 활용하는 수준을 넘어 과제를 AI에 위임하는 정도로 나타났다. 학생들은 교수보다 평균 15.72점 더 높은 수준으로 AI에 과제를 위임했다. 100점 척도에서 0점이 ‘100% 본인’이고 100점이 ‘100% AI’일 때, 이러한 차이는 중간 정도의 효과 크기로 분류됐다. 연구진은 이를 통해 학생들이 AI를 보조 도구로만 사용하는 것이 아니라, 실질적인 과제 수행 주체로 활용하고 있음을 확인했다.
정보 검색 75%, 프로그래밍 63%… 과제별 격차 두드러져
과제 유형별로 살펴보면 교수와 학생 간 AI 사용 격차가 더욱 명확해진다. 정보 검색 과제에서 학생과 교수의 사용 빈도 차이는 0.73점으로 가장 컸으며, 효과 크기는 0.75에 달했다. 프로그래밍 과제가 0.61점 차이(효과 크기 0.63)로 뒤를 이었고, 문헌 조사는 0.50점 차이(효과 크기 0.51), 글쓰기는 0.48점 차이(효과 크기 0.50)를 보였다.
흥미롭게도 번역 과제에서는 정반대 패턴이 나타났다. 교수들이 학생보다 0.36점 더 높은 AI 사용 빈도를 보고했으며, 이는 통계적으로 유의미한 차이였다. 연구진은 이에 대해 전문적 수준에 도달한 나이 든 교수들이 번역과 같은 특정 과제에서 확립된 AI 도구를 더 적극적으로 활용하는 반면, 학생들은 아직 언어 학습 과정에 있어 AI 의존도가 낮을 수 있다고 해석했다.
AI 위임 정도에서도 비슷한 패턴이 관찰됐다. 정보 검색 과제에서 학생과 교수의 위임 정도 차이는 24.09점으로 가장 컸으며, 효과 크기는 1.02에 달했다. 글쓰기 과제가 19.25점 차이(효과 크기 0.81), 문헌 조사가 18.06점 차이(효과 크기 0.76), 프로그래밍이 17.78점 차이(효과 크기 0.75)를 기록했다. 반면 번역 과제에서는 5.04점 차이로 통계적 유의성이 없었다.

교수와 학생, 서로의 AI 사용 1.02점씩 과대평가
연구의 가장 놀라운 발견은 교수와 학생 모두 상대방의 AI 사용을 크게 과대평가한다는 점이다. 양측 모두 상대방의 AI 사용 빈도를 실제보다 1.02점 과대평가했으며, 이는 매우 큰 효과 크기(1.75)를 보였다. AI 위임 정도에서도 양측 모두 25.89점씩 과대평가했으며, 효과 크기는 2.08에 달했다.
연구진은 교수들이 학생들의 AI 사용을 과대평가하는 패턴에서 고등 교육 현장의 광범위한 불신 경향을 발견했다. 교수들은 학생들이 AI를 매우 자주, 그리고 높은 수준으로 위임해 사용한다고 일관되게 예측했다.
반면 학생들은 교수들도 자신들과 비슷한 수준으로 AI를 사용한다고 가정하는 ‘허위 합의 효과(false-consensus effect)’를 보였다. 이는 개인이 다른 사람들도 자신과 유사하게 행동한다고 잘못 가정하는 심리적 편향으로, 학생들이 자신의 AI 사용 패턴을 교수들에게 투영한 결과로 분석됐다.
예상과 달리 교수들이 학생들의 AI 사용을 더 정확하게 예측할 것이라는 가설은 기각됐다. 연구진은 교수들이 대규모의 다양한 학생 집단을 지속적으로 관찰하고 평가하는 경험이 있어 더 정확한 예측을 할 것으로 기대했지만, 실제로는 양측 모두 비슷한 수준의 부정확성을 보였다. 일부 분석에서 학생들이 약간 더 정확한 예측을 한 것으로 나타났지만, 이는 대체 표본에서는 사라지는 결과였다.

AI 시대 대학 교육, 양방향 투명성이 해법
연구진은 이러한 인식 격차가 교수-학생 간 신뢰 관계에 심각한 위협이 된다고 경고했다. 상호 신뢰는 학습 성과, 위험 감수 의지, 새로운 기술의 협력적 탐구와 밀접하게 연결된 고등 교육의 핵심 요소다. AI라는 급격한 변화 속에서 과거 경험에 기반한 신뢰 구축이 어려워진 상황에서, 정확한 예측 없이는 불신이 확산될 수 있다는 것이다.
해결책으로 연구진은 ‘양방향 투명성’을 제안했다. 교수들도 학생들처럼 자신들이 사용하는 AI 지원을 공개적으로 인정해야 하며, 경우에 따라서는 채팅 기록과 같은 보조 문서를 제공해 학생들에게 기대하는 것과 동일한 수준의 책임성을 보여야 한다는 것이다. 이를 통해 AI 사용에 대한 개방적 논의가 가능해지고, 오해를 해소할 수 있다고 연구진은 강조했다.
연구팀은 이번 연구가 대학에서 AI 연구에 세 가지 중요한 기여를 했다고 밝혔다. 첫째, 대학 교수를 따로 조사하고 학생과 똑같은 방법으로 비교했다. 둘째, 단순히 ‘얼마나 자주 쓰나’뿐 아니라 ‘얼마나 맡기나’까지 함께 조사해 더 자세히 이해할 수 있게 했다. 셋째, 교수와 학생이 서로를 얼마나 정확하게 예측하는지 조사하고 이를 신뢰 문제와 연결한 최초의 연구 중 하나라는 점이다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q1. 대학생들은 어떤 학술 과제에서 AI를 가장 많이 사용하나요?
A. 독일 대학생들은 정보 검색 과제에서 AI를 가장 많이 사용하며, 교수보다 75%포인트 더 높은 사용률을 보였습니다. 그 다음으로 프로그래밍(63%), 문헌 조사(51%), 글쓰기(50%) 순으로 높은 사용률을 기록했습니다. 반면 번역 과제에서는 교수들이 학생보다 더 많이 AI를 활용하는 것으로 나타났습니다.
Q2. 왜 교수와 학생이 서로의 AI 사용을 과대평가하나요?
A. 교수들은 학생들에 대한 광범위한 불신 문화 속에서 학생들의 AI 사용을 실제보다 훨씬 높게 예측합니다. 반면 학생들은 ‘허위 합의 효과’로 인해 교수들도 자신들과 비슷하게 AI를 사용할 것이라고 가정합니다. AI가 급격히 도입된 상황에서 과거 경험이 부족해 정확한 예측이 어렵기 때문입니다.
Q3. AI 시대에 대학 교육의 신뢰를 회복하려면 어떻게 해야 하나요?
A. 연구진은 ‘양방향 투명성’을 해법으로 제시합니다. 학생뿐만 아니라 교수도 자신의 AI 사용을 공개적으로 인정하고, 필요시 채팅 기록 같은 증빙 자료를 제공해야 합니다. 또한 AI의 역할과 활용 방식에 대한 개방적인 대화를 통해 서로의 오해를 해소하고 건설적인 AI 통합 정책을 만들어가야 합니다.
기사에 인용된 논문 원문은 Open Science Framework에서 확인 가능하다.
논문명: Are they just delegating? Cross-Sample Predictions on University Students’ & Teachers’ Use of AI
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.






