스위스의 주요 기관들이 연구와 응용 프로그램의 기반 역할을 할 새로운 오픈소스 AI 모델을 공개했다. 스위스 연방공과대학교 로잔캠퍼스(EPFL), 취리히 연방공과대학교(ETH Zurich), 스위스 국립 슈퍼컴퓨팅 센터(CSCS)가 공동 개발한 이 모델의 이름은 ‘아페르투스(Apertus)’다. 라틴어로 ‘열린’을 뜻하는 이 이름은 설계와 훈련 과정의 모든 부분이 대중에게 공개된다는 핵심 원칙을 반영한다.
개발자와 기관들은 아페르투스를 활용해 챗봇, 번역 도구, 교육 중심 애플리케이션을 제작할 수 있다. 모델은 허깅페이스(Hugging Face)에서 직접 다운로드하거나 이니셔티브의 전략적 파트너인 스위스콤(Swisscom)을 통해 접근할 수 있다. 80억 매개변수 모델과 700억 매개변수의 대형 버전, 두 가지가 제공된다. 두 버전 모두 관대한 오픈소스 라이선스로 배포되어 연구, 교육, 상업 프로젝트에서 사용할 수 있다.
선별적으로만 세부 사항을 공개하는 다른 AI 시스템과 달리 아페르투스는 완전히 공개된 AI 모델로, 아키텍처, 훈련 데이터, 문서 모두를 검토할 수 있다.
EPFL의 기계학습 교수이자 스위스 AI 이니셔티브 운영위원회 멤버인 마틴 야기(Martin Jaggi) 교수는 “이번 발표로 신뢰할 수 있고 독립적이며 포용적인 AI 모델을 개발하는 방법에 대한 청사진을 제시하고자 한다”고 말했다. 그는 아페르투스가 CSCS, ETH 취리히, EPFL의 엔지니어와 연구원들로 구성된 팀에 의해 정기적으로 업데이트될 것이라고 밝혔다.
CSCS 디렉터이자 ETH 취리히 교수인 토마스 슐테스(Thomas Schulthess)는 아페르투스를 “혁신의 동력이자 연구, 사회, 산업 분야의 AI 전문성을 강화하는 수단”이라고 설명했다. 그는 이 프로젝트가 연구에서 제품으로의 일반적인 기술 이전이 아니라 장기적 사용을 위한 인프라 구축 노력이라고 말했다.
훈련 과정에는 1000개 이상의 언어로 된 15조 개의 토큰이 사용되었으며, 데이터의 약 40%는 영어가 아닌 언어였다. 아페르투스에는 대형 언어 모델(LLM)에서 종종 제외되는 스위스 독일어와 로만슈어(스위스 공용 언어 4개 중 하나) 같은 언어들도 포함되어 있다.
ETH 취리히의 연구 과학자이자 프로젝트의 기술 책임자인 이마놀 슐라그(Imanol Schlag)는 “아페르투스는 공익을 위해 만들어졌다. 이 규모에서 완전히 공개된 몇 안 되는 LLM 중 하나이며, 다국어 지원, 투명성, 규정 준수를 기본 설계 원칙으로 구현한 최초의 모델이다”라고 말했다.
스위스콤은 이미 자사의 주권적 AI 플랫폼에 아페르투스를 배포하고 있다. 스위스콤의 연구 디렉터 다니엘 도보스(Daniel Dobos)는 “이는 공익에 기여하고 스위스의 디지털 주권을 강화하는 안전하고 책임감 있는 AI 생태계를 구축하려는 우리의 의지를 보여준다”고 밝혔다.
경험 있는 사용자들에게는 아페르투스 다운로드가 간단하지만, 실제 사용에는 서버, 클라우드 리소스, 또는 전용 인터페이스가 필요하다. 개발자들은 10월 5일까지 진행되는 스위스 AI 위크(Swiss {ai} Weeks) 기간 동안 아페르투스를 테스트할 수 있다. 해커톤 참가자들은 스위스콤이 호스팅하는 인터페이스를 통해 접근할 수 있으며, 스위스콤 비즈니스 고객들도 오늘부터 회사의 AI 플랫폼을 통해 모델을 사용할 수 있다. 해외 사용자들의 경우 퍼블릭 AI 인퍼런스 유틸리티(Public AI Inference Utility)를 통해 아페르투스를 이용할 수 있다.
퍼블릭 AI 인퍼런스 유틸리티의 수석 관리자인 조슈아 탄(Joshua Tan)은 “현재 아페르투스는 최고의 공공 AI 모델이다. 공공 기관이 공익을 위해 구축한 모델이다. 이는 AI가 고속도로, 상하수도, 전기처럼 공공 인프라의 한 형태가 될 수 있다는 최고의 증거다”라고 말했다.
오픈소스 라이선스 하에 훈련 데이터, 모델 가중치, 중간 체크포인트가 모두 제공된다. 모델의 훈련 과정은 스위스 데이터 보호법, 스위스 저작권법, EU AI 법의 투명성 요건을 준수했다.
데이터셋은 공개적으로 이용 가능한 정보로 제한되었으며, 개인 데이터를 제거하고 웹사이트의 옵트아웃 요청을 존중하도록 필터링되었다. 훈련 시작 전에 원치 않는 콘텐츠를 배제하기 위한 윤리적 가이드라인도 적용되었다.
EPFL 교수이자 스위스 AI 이니셔티브 공동 책임자인 앙투안 보슬뤼(Antoine Bosselut)는 “아페르투스는 생성형 AI가 강력하면서도 개방적일 수 있음을 보여준다. 아페르투스의 발표는 마지막 단계가 아니라 시작이며, 전 세계 공익을 위한 개방적이고 신뢰할 수 있으며 독립적인 AI 기반에 대한 장기적 약속이다”라고 말했다.
향후 업데이트는 모델 패밀리 확장, 효율성 개선, 법률, 보건, 기후, 교육 등의 분야를 위한 도메인 특화 도구 개발을 목표로 하며, 엄격한 투명성 기준을 계속 유지할 예정이다.
자세한 내용은 AI News에서 확인할 수 있다.