구글(Google)의 생성형 AI 제미나이(Gemini)가 언어 학습의 패러다임을 바꾸고 있다. 개발자들이 제미나이 API를 활용해 만든 ‘작은 언어 수업(Little Language Lessons)’은 학습자 맥락에 맞춘 개인화된 언어 학습 경험을 제공한다.
29일(현지 시간) 구글 개발자 블로그에 발표된 내용에 따르면, 엔지니어로서 언어에 관심이 많은 애런 웨이드(Aaron Wade) 창의 기술자는 코딩 언어와 인간 언어 모두에 매료되어 왔다. 그는 프로그래밍 언어를 배울 때는 즉시 실습을 통해 배우는 반면, 인간 언어는 종종 실제 상황과 단절된 교과서나 연습문제를 통해 배우게 된다는 점에 주목했다.
“프로그래밍과 마찬가지로, 언어는 의미 있는 맥락을 통해 가장 잘 배울 수 있습니다. 우리가 나누는 대화, 주변 물건들, 우리가 처한 상황들을 통해서요. 전통적인 학습 도구와 달리 AI는 학습자의 맥락에 적응할 수 있어 더 자연스럽고 개인적인 방식으로 언어를 연습하는 데 특히 적합합니다.” 이러한 아이디어에서 출발해 웨이드와 동료들은 구글의 최신 생성형 모델에 접근할 수 있는 제미나이 API를 실험했고, 그 결과 ‘작은 언어 수업’이라는 세 가지 간결한 학습 실험을 개발했다.
첫 번째 실험은 ‘작은 수업(Tiny Lesson)’이다. 언어를 배울 때 가장 좌절스러운 부분 중 하나는 특정 단어나 문구가 필요한 상황에서 그것을 아직 배우지 못했을 때다. ‘작은 수업’은 이런 문제를 해결하기 위해 설계됐다. 사용자가 “길 묻기” 또는 “분실한 여권 찾기”와 같은 상황을 설명하면, 그 맥락에 맞는 유용한 어휘, 문구, 문법 팁을 받을 수 있다. 개발팀은 간단한 프롬프트 레시피를 사용해 이를 구현했다. 프롬프트는 다음과 같은 인격 설정 전문으로 시작한다:
“당신은 {목표 언어}와 {출발 언어}에 능통한 이중 언어 {목표 언어} 튜터이며, 학생들의 언어 사용 목표에 맞춤화된 교육 콘텐츠를 제작하는 전문가입니다.” 각 수업은 제미나이 API에 두 번의 호출로 이루어진다. 하나는 모든 어휘와 문구를 생성하고, 다른 하나는 관련 문법 주제를 다룬다.
두 번째 실험은 교과서처럼 들리지 않게 배우는 ‘슬랭 행(Slang Hang)’이다. 언어 학습 여정에서 어느 정도 대화가 가능해졌지만 여전히 너무 형식적이고 딱딱하게 들리는 순간이 있다. ‘슬랭 행’은 이 문제를 해결하기 위해 설계됐다. 원어민 화자 간의 실제 대화를 생성하고 사용자가 이를 통해 배우는 간단한 아이디어다. 대화가 펼쳐지는 것을 지켜보며 메시지를 하나씩 보고 익숙하지 않은 용어를 이해할 수 있다.
‘슬랭 행’ 프롬프트의 도입부는 다음과 같다. “당신은 {출발 언어}와 {목표 언어}에 능통한 이중 언어 대본 작가이며 매력적인 대화를 만드는 전문가입니다. 또한 당신은 언어학자이고 자연스러운 언어를 형성하는 문화적 뉘앙스에 매우 민감합니다.” 이 실험에서 흥미로운 점은 창발적 스토리텔링 요소다. 각 장면은 독특하고 즉석에서 생성된다. 길거리 상인과 고객의 대화, 지하철에서 만난 두 직장 동료, 혹은 이국적인 애완동물 쇼에서 우연히 재회한 오랜 친구들일 수도 있다.
다만 개발팀은 이 실험이 정확성 오류에 다소 취약하다는 점을 발견했다. 때때로 특정 표현과 속어를 잘못 사용하거나 심지어 만들어내기도 한다. 대규모 언어 모델(LLM)이 아직 완벽하지 않기 때문에 신뢰할 수 있는 출처와 교차 확인하는 것이 중요하다.
세 번째 실험은 주변 환경에서 배우는 ‘워드 캠(Word Cam)’이다. 때로는 눈앞에 있는 물건들의 이름이 필요할 때가 있다. 목표 언어로 얼마나 많은 단어를 말할 수 없는지 깨닫는 것은 매우 겸손하게 만든다. “창문”이라는 단어는 알지만 “창틀”이나 “블라인드”는 어떻게 말할까? ‘워드 캠’은 카메라를 즉석 어휘 도우미로 바꾼다. 사진을 찍으면 제미나이가 물체를 감지하고 목표 언어로 라벨을 붙이며 그것들을 설명하는 데 사용할 수 있는 추가 단어를 제공한다. 이 실험은 물체 감지를 위해 제미나이의 시각 기능을 활용한다. 모델에 이미지를 보내고 해당 이미지에 있는 다양한 물체의 경계 상자 좌표를 요청한다.
세 가지 실험 모두에 텍스트 음성 변환 기능도 통합되어 사용자가 목표 언어의 발음을 들을 수 있다. 이는 클라우드 텍스트 음성 변환 API(Cloud Text-to-Speech API)를 사용하여 구현됐으며, 널리 사용되는 언어에 대해서는 자연스러운 음성을 제공하지만 덜 일반적인 언어에 대해서는 옵션이 제한적이다.
‘작은 언어 수업’은 초기 탐색 단계지만, 이러한 실험은 미래에 대한 흥미로운 가능성을 제시한다. 이 작업은 언어학자 및 교육자와 협력하여 ‘작은 언어 수업’에서 조사한 접근 방식을 개선하는 방법과, 더 넓게는 AI가 어떻게 독립적인 학습을 더 역동적이고 개인화된 것으로 만들 수 있는지에 대한 중요한 질문을 제기한다.
현재 구글 개발팀은 계속해서 탐색하고, 반복하며, 질문을 던지고 있다. 이와 같은 더 많은 실험을 확인하려면 labs.google.com을 방문하면 된다.
해당 기사의 원문은 링크에서 확인할 수 있다.
이미지 출처: 구글
기사는 클로드와 챗gpt를 활용해 작성되었습니다.