• Home
  • AI Report
  • AI가 18세기 노예 문서 1,500p 해독… 美 대학도서관의 AI 활용법

AI가 18세기 노예 문서 1,500p 해독… 美 대학도서관의 AI 활용법

Windows - spring/summer 2025
이미지 출처: University of North Carolina

Windows – spring/summer 2025


생성형 AI, 도서관 서비스의 새로운 전환점으로 부상

노스캐롤라이나대학교(University of North Carolina at Chapel Hill)에서 발간한 매거진에 따르면, 대학의 도서관이 생성형 인공지능(Generative AI) 기술을 도입하여 학술정보 서비스 혁신에 앞장서고 있다. 마리아 에스토리노(María R. Estorino) 대학도서관장 겸 부총장은 “생성형 AI는 모든 사람에게 영향을 미칠 기술이며, 처음부터 이 대화에 참여하고 기다리기만 하지 않기를 원했다”고 밝혔다.

에스토리노 관장은 알리슨 고프닉(Alison Gopnik)의 2022년 월스트리트 저널 칼럼을 인용하며 AI를 “글쓰기, 인쇄, 도서관, 인터넷 검색 엔진 또는 언어 자체와 같은 문화적 기술”로 규정했다. 1990년대 학생들이 인터넷을 배우기 위해 도서관을 찾았듯이, 오늘날 학생들도 AI를 배우기 위해 도서관을 찾아야 한다고 강조했다.

AI 스튜디오 2층 개관 예정, 챗GPT 넘어 구글 제미나이·앤트로픽 클로드 제공

올가을 노스캐롤라이나대학교의 데이비스 도서관(Davis Library) 2층에 개관 예정인 도서관 AI 스튜디오(Library AI Studio)는 생성형 AI 기술에 대한 캠퍼스 전체의 접근성을 혁신적으로 확대할 전망이다. 총장실 AI 가속화 지원금(AI Acceleration Grant)으로 운영되는 이 스튜디오는 AI 전문가가 상주하며 모든 캠퍼스 구성원에게 개방된다.

이 스튜디오에서는 챗GPT를 넘어 구글의 제미나이(Gemini), 앤트로픽의 클로드(Claude) 등 최신 AI 도구에 접근할 수 있다. 미셸 콜리(Michelle Cawley) 보건과학 담당 부도서관장은 “우리는 이곳을 샌드박스로 생각하고 있다. 프로젝트 아이디어가 있지만 어디서 시작해야 할지 모르는 사람들이 와서 도서관의 전문성과 연결되고, 도구에 접근하며 시작할 수 있는 환경”이라고 설명했다.

1,500페이지 노예제 문서 AI 해독, ‘From the Page’ 플랫폼 활용

윌슨 특별컬렉션 도서관(Wilson Special Collections Library)에서는 AI를 활용하여 노스캐롤라이나주의 18-19세기 노예제 관련 손 글씨 문서 1,500페이지를 디지털화하는 시범 프로젝트를 진행했다. ‘From the Page’ 플랫폼을 이용한 이 프로젝트는 AI 모델을 통해 손 글씨를 해독하고 ChatGPT를 거쳐 검증하는 과정을 거친다.

재키 딘(Jackie Dean) 아카이브 처리 책임자는 “우리는 컬렉션을 극도로 접근 가능하게 만들고 싶다. AI가 건초더미에서 바늘을 찾아내도록 도와준다면, 매매 증서를 편지들 사이에서 찾아내거나 백인 농장주 편지에서 노예들의 이름을 찾아내는 데 도움이 될 것”이라고 설명했다.

연간 700명 참여 AI 리터러시 교육, CAIL 이니셔티브 운영

대학 1학년 작문 프로그램(First Year Writing Program)과 협력하여 개발된 캐롤라이나 AI 리터러시 이니셔티브(Carolina AI Literacy Initiative, CAIL)는 데이터 사이언스 앤 소사이어티 스쿨(School of Data Science and Society)의 지원을 받아 운영되고 있다. 지금까지 700명 이상이 참여한 GenAI 워크숍이 인기를 끌고 있다.

데이나 더빈(Dayna Durbin) 학부교육 및 학습 사서는 “우리가 이러한 도구들의 확산을 무시한다면 학생들에게 해를 끼치는 것”이라며 “많은 학생들이 인턴십과 직장에서 이미 이들을 사용하고 있고, 경력에서 사용할 것으로 예상한다. 이들이 직장에서 효과적이고 윤리적으로 이러한 도구를 사용할 수 있는 기술을 구축하는 데 도움이 되는 자료를 제공해야 한다”고 강조했다.

IT팀 vs AI 봇 전쟁, 분당 수천 건 공격으로 카탈로그 마비 위기

2024년 12월 2일, 대학도서관의 온라인 카탈로그가 전례 없는 AI 봇 공격을 받았다. 정상적인 동시 검색이 100건 정도인 상황에서 500건 이상의 검색이 몰리면서 시스템이 과부하에 걸렸다. 제이슨 카스덴(Jason Casden) 시스템 관리자는 “해커 영화처럼 화면에 스트리밍되는 것을 열어보고 지켜봤다. 요청이 분당 수천 건씩 날아다녔고, 이상한 패턴을 발견하기 시작했다”고 회상했다.

공격자들은 핀란드 음악과 같은 기이한 검색어를 사용했으며, 11월에는 15건에 불과했던 관련 검색이 12월 4일 하루에만 11,329건이 발생했다. IT팀은 200만 개에 가까운 IP 주소를 차단하는 등 대응에 나섰으며, 결국 AI 기반 방화벽을 도입하여 공격을 막아냈다. 팀 어러(Tim Shearer) 디지털 전략 및 정보기술 담당 부도서관장은 “이는 생성형 AI 프로그램을 훈련시키는 대규모 언어 모델 구축을 위한 광범위한 스크래핑 작업”이라고 분석했다.

FAQ

Q: 생성형 AI를 사용하는 것이 표절인가요?

A: 표절 여부는 사용 방법에 따라 달라집니다. 아이디어 발상이나 연구 키워드 찾기에는 유용하지만, AI가 작성한 내용을 그대로 사용하면 표절이 될 수 있습니다. 각 대학의 Honor Code를 확인하고 적절한 인용을 해야 합니다.

Q: 생성형 AI가 도서관 업무를 대체할까요?

A: AI는 도서관 업무를 대체하는 것이 아니라 보완하는 역할을 합니다. 반복적인 작업을 자동화하여 사서들이 전문적 지식과 인간적 통찰이 필요한 업무에 더 집중할 수 있게 해줍니다.

해당 기사에 인용한 리포트 원문은 UNC에서 확인 가능하다.

이미지 출처: UNC

이 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters_banner_article_bottom



AI가 18세기 노예 문서 1,500p 해독… 美 대학도서관의 AI 활용법 – AI 매터스 l AI Matters