From Automation to Cognition: Redefining the Roles of Educators and Generative AI
in Computing Education
생성형 AI가 가져온 컴퓨팅 교육의 새로운 패러다임
뉴질랜드 오클랜드 대학교 연구진이 ACE(Australasian Computing Education Conference) ’25에서 발표한 연구에 따르면, 생성형 AI가 컴퓨터 공학 교육의 판도를 크게 바꾸고 있다. 연구가 진행된 대규모 도시 연구 중심 기관에서는 매주 실험 수업을 통해 약 1,000명의 1학년 공학생들이 C 프로그래밍을, 300-500명의 1학년 컴퓨터 공학과 학생들이 파이썬을 학습했다. 이 과정에서 대학원 조교들의 지원을 받았으며, 모든 실습 과제는 CodeRunner라는 자동화된 테스트 시스템을 통해 평가되었다.
그 결과, OpenAI의 GPT-4o 모델은 독립적인 튜터링이 가능할 정도로 발전했으며, 기초 프로그래밍(CS1/CS2) 과제에서 거의 완벽한 점수를 받았다. 이러한 기술은 학생들에게 무제한적이고 즉각적인 개인화 지원을 제공할 수 있다는 장점이 있으며, 교수진의 학생 질의응답 업무 부담을 줄일 수 있다.
컴퓨터 그래픽스와 같은 멀티모달 입출력을 사용하는 과목에서는 시각적 출력, 함수 출력, API 불변성(OpenGL states) 등 다양한 수준에서 학생의 제출물을 평가할 수 있다. 향후 GenAI 도구들은 이러한 모든 수준에서 형성평가 피드백을 제공할 수 있을 것으로 기대된다.
“과제는 만점인데 시험은 못 보네” – AI 시대 교육현장의 딜레마
ChatGPT 출시 이후 학생들의 생성형 AI 사용이 꾸준히 증가했다. 초기에는 성능과 정확성에 대한 불확실성, 학문적 정직성 위반 우려로 조심스러운 접근을 보였으나, 시간이 지날수록 더 많은 학생들이 이를 활용하기 시작했다. 테스트와 퀴즈 중에도 일부 학생들의 ChatGPT 접근 시도가 발견되었다. 특히 주목할 만한 점은 새벽 1-3시 사이에 수백 건의 질문이 제출되었다는 것이다. 과제 제출 시 생성형 AI 사용이 금지되었음에도 불구하고, 과제 점수가 대면 평가 점수보다 현저히 높게 나타나는 현상이 관찰되었다.
연구에 따르면, 동기가 낮은 학생들은 ChatGPT와 Copilot 같은 도구를 사용할 때 “지속적이고 복합적인 메타인지 어려움”을 겪는 것으로 나타났다. 일부 학생들은 이전 과제를 모두 완료했음에도 간단한 print 문을 작성하는 데 어려움을 겪는 등, 생성형 AI에 과도하게 의존하는 징후가 발견되었다. 반면 학습 동기가 높은 학생들은 GenAI를 건설적인 질문과 즉각적인 피드백을 받는 도구로 활용하여 학습을 보완하는 경향을 보였다.
24시간 깨어있는 AI 튜터, 학습의 패러다임을 바꾸다
연구진은 Promptly라는 웹 기반 도구를 통해 프롬프트 문제를 도입했다. 이 도구는 전산 작업(computational tasks)과 코드 이해(code comprehension tasks) 두 가지 유형의 문제를 지원하며, 생성된 코드를 테스트 케이스에 대해 자동으로 평가할 수 있다. EiPL(Explain in Plain Language) 과제는 전통적인 프로그래밍 실력과의 상관관계가 낮아, 보완적인 학습 도구로서의 가치가 입증되었다.
BugSpotter 도구를 활용한 체계적인 디버깅 훈련에서는 문제 명세를 기반으로 버그가 있는 코드를 생성하고, 학생들이 오류를 드러내는 테스트 케이스를 설계하도록 했다. 전문가 검토 결과 강사가 설계한 과제와 비슷한 수준의 품질을 보여주었다.
350명 이상의 학생들이 참여한 연구에서 ChatGPT를 활용한 재귀 개념 학습 결과, 학생들의 관심사에 맞춘 유추가 일반적인 예시보다 더 다양하고 기억하기 쉽다는 것이 밝혀졌다. CodeHelp는 직접적인 코드 솔루션을 제공하지 않도록 가드레일이 설정되어 있어, 학생들이 스스로 해결책을 발견하도록 유도했다. PuzzleMakerPy 사용 시 학생들은 개인화된 문제와 맥락화된 프레임이 학습에 더 도움이 된다고 보고했다.

“AI와 함께 공부하기” – 전문가들이 제시하는 새로운 학습법
연구에 따르면 생성형 AI 통합에는 두 가지 주요 접근법이 있다. 전체 과정을 생성형 AI 중심으로 재구성하는 방법과 기존 과정에 생성형 AI 활동을 선별적으로 도입하는 방법이다. 연구진이 제시한 과제 재설계의 구체적인 예로, 기존의 “리스트의 마지막 짝수 요소에 x를 더하는 함수 작성” 과제를 “ChatGPT를 사용해 프로그래밍 개념을 파악하고, 새로운 맥락에서 각 개념의 예시를 만들어보는” 형태로 변경하는 방안을 제시했다.
생성형 AI 탐지 도구의 신뢰성 문제와 부당한 처벌 위험성이 제기됨에 따라, 과제 평가는 CodeRunner와 같은 웹 기반 자동 채점 도구를 사용하고, 해당 채점 도구에만 접근을 허용하는 방화벽을 설정하여 보안 평가를 구현했다. 이를 통해 학생들의 실제 학습 성과를 정확하게 측정할 수 있게 되었다.
AI 시대의 인재를 키우는 길 – 교육계의 고민과 도전
Computing Curriculum 2023에서는 꼼꼼함과 끈기와 같은 중요 역량을 강조하며, 생성형 AI 도구의 능력과 한계를 인식하는 교육의 필요성을 제기했다. 전 세계 CS 교육자들과의 포괄적 인터뷰 연구 결과, 생성형 AI 오용을 방지하기 위해 대면 시험을 늘리고 최종 결과물보다 과정을 평가하는 방향으로 전환해야 한다는 의견이 지배적이었다.
교육자들의 평가 작업 부담 증가 문제를 해결하기 위해, 생성형 AI 도구와의 상호작용을 저장하고 이를 자동 채점에 활용하는 방안이 제시되었다. 연구진은 새로운 교수법의 효과성을 검증하기 위한 구체적인 연구 방법론을 개발하고, 학생들의 AI 활용 능력 향상을 위한 교육과정을 지속적으로 개선해 나가야 한다고 강조했다.
해당 논문의 원문은 링크에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
관련 콘텐츠 더보기