네이버클라우드가 독자 기술로 개발한 경량화 추론모델 ‘하이퍼클로바X 시드 14B 싱크(HyperCLOVA X SEED 14B Think)’를 상업용 무료 오픈소스로 공개했다고 22일(한국 시간) 발표했다. 이번에 공개된 모델은 네이버클라우드가 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 처음부터 개발한 추론모델이다. 추론모델은 AI 에이전트 서비스의 핵심 기술로 주목받고 있으며, 기존에는 연구용으로만 제한됐지만 이번 공개로 비즈니스 영역에서도 활용할 수 있게 됐다.
하이퍼클로바X 시드 14B 싱크는 지난달 30일 발표된 추론모델 ‘하이퍼클로바X 싱크(HyperCLOVA X THINK)’를 경량화한 버전이다. 중요도가 낮은 파라미터를 제거하는 가지치기(pruning) 기법과 큰 모델의 지식을 작은 모델에 전이하는 증류(distillation) 방식을 통해 학습 비용을 대폭 줄였다.
네이버클라우드에 따르면 이 모델은 140억 개 파라미터 규모임에도 불구하고 5억 개 파라미터로 구성된 글로벌 오픈소스 모델보다 적은 비용으로 학습됐다. 동일 크기 글로벌 오픈소스 모델과 비교했을 때 1회 학습 비용은 약 100분의 1 수준이다. 성능 면에서도 한국어·한국문화와 코딩·수학 관련 평가에서 동일 크기(140억) 또는 더 큰 규모(320억) 모델과 유사하거나 높은 평균 점수를 기록했다. 평가는 KMMLU, KoBALT, HAERAE, MATH500, HumanEval, MBPP, LiveCodeBench 등을 통해 진행됐다.
네이버클라우드 하이퍼스케일 AI 성낙호 기술 총괄은 “독자적 기술로 생성형 AI 모델을 꾸준히 업그레이드하면서 구축한 고성능 플래그십 모델과 효율적인 학습 전략을 바탕으로 동일 규모에서 비용·성능 등이 더 효과적인 추론모델을 구축할 수 있었다”고 말했다. 그는 이어 “해외의 상용 모델을 개조한 기술로 그들의 생태계에 편입되기보다는, 토대부터 자체 기술로 구축한 하이퍼클로바X가 한국 AI 생태계의 본격적 성장을 이끌 수 있기를 기대한다”고 덧붙였다.
지난 4월 오픈소스로 공개된 하이퍼클로바X 경량모델 3종은 7월 누적 다운로드 100만 건을 돌파했다. 50여 개의 1차 파생모델을 바탕으로 새로운 파생모델이 생산·공유되고 있으며, 한국어 온 디바이스 AI 서비스가 출시되는 등 하이퍼클로바X 오픈소스 생태계가 빠르게 확장되고 있다.
해당 기사의 원문은 네이버 뉴스룸에서 확인 가능하다.
이미지 출처: 네이버클라우드