Search

독자 AI 출품 기업은 어떤 모델을 갖고 있을까: ‘K-AI’ 국대 선발전의 거의 모든 것

독자 AI 출품 기업은 어떤 모델을 갖고 있을까: 'K-AI' 국대 선발전의 거의 모든 것
이미지 출처: 이디오그램 생성

한국 AI의 위상, 세계 3위에서 0위 논란까지

“한국의 파운데이션 모델이 0개?” 2024년 스탠퍼드 AI 인덱스 발표는 국내 AI 업계에 충격을 안겼다. 불과 1년 전인 2023년 기준으로 한국은 11개의 파운데이션 모델을 보유해 미국(64개), 중국(42개)에 이어 세계 3위를 기록한 바 있다.

과학기술정보통신부(이하 과기정통부)는 즉각 반박했다. “파운데이션 모델 개발 0건 보도는 사실과 다르다”며 “네이버, LG AI연구원, NC AI, 삼성, 카카오, 코난테크놀로지, KT, SKT 등 주요 IT 기업들이 실제로 파운데이션 모델을 개발해 상용 서비스에 적용하고 있다”고 밝혔다.

실제로 국내에는 알려진 것만 7~10여 개, 공식 통계로는 최대 11개의 파운데이션 모델이 운영되고 있다. 세계적으로도 상당한 수준이다.



국내 주요 LLM 모델 현황

현재 국내에서 개발·운영 중인 주요 파운데이션 모델들을 살펴보면 다음과 같다.


대기업 개발 모델

네이버 하이퍼클로바X: 2023년 공개된 국내 대표 LLM으로, 해외 경쟁사 대비 6,500배 많은 순수 한국 데이터로 학습했다. KMMLU, HAERAE, KorNAT 등 벤치마크에서 우수한 성과를 보였으며, 영어·중국어·일본어 등 다국어 지원도 가능하다. 특히 추론 능력을 강화한 ‘하이퍼클로바X 씽크’는 한국어 전문가 레벨 평가에서 최고 수준을 기록했으며, 멀티모달 추론 기능도 갖췄다. 오픈소스 경량모델 ‘시드'(30억·15억·5억 파라미터)와 실용형 ‘대시’ 등 다양한 버전을 보유하고 있다.

LG AI연구원 엑사원(EXAONE): 2022년 첫 공개 후 현재 3.5 버전까지 발전했으며, 4.0 버전 개발 중이다. 초경량 2.4B, 경량 7.8B, 고성능 32B 등 3가지 모델로 구성되어 있다. 모든 모델이 장문 이해 등 7개 벤치마크에서 Qwen 2.5, Llama 3.2를 앞섰으며, 스탠포드대 AI 인덱스 2025에서 국내 유일하게 ‘주목할 만한’ 모델로 선정되었다. 추론 강화 모델 ‘엑사원 딥’도 보유하고 있다.

SK텔레콤 에이닷 엑스(A.X): 한국어 처리에 특화된 모델로 4.0과 3.1 버전을 보유하고 있다. 4.0은 알리바바 Qwen 2.5 기반에 한국어 데이터를 학습시킨 모델로 표준(720억 파라미터)과 경량(70억 파라미터) 두 종류가 있다. 자체 토크나이저 평가로 GPT-4o 대비 33% 높은 토큰 효율을 달성했으며, KMMLU에서 78.3점으로 GPT-4o(72.5점)를 앞섰다. 3.1은 프롬 스크래치 방식의 순수 자체 개발 모델이다.

KT 믿:음 2.0: ‘한국적 AI’ 철학을 담아 개발한 자체 LLM으로, 베이스(115억 파라미터)와 미니(23억 파라미터) 두 버전이 있다. 고품질 한국어 데이터의 모든 저작권을 확보해 신뢰성을 높였으며, 한국어 구조를 반영한 자체 토크나이저를 개발했다. Ko-Sovereign, KMMLU, HAERAE 등 한국어 벤치마크에서 동급 모델 대비 우수한 성능을 보인다.

카카오 카나나(KanaNA): 카카오 서비스에 최적화된 AI 모델 패밀리로 언어모델 3종, 멀티모달 3종, 비주얼 생성 2종, 음성 2종 등 총 10종으로 구성된다. 2024년 5월 공개된 카나나 1.5는 8억 파라미터 중형 모델과 2.1억 파라미터 경량 모델로 나뉘며, 8억 파라미터 모델은 호랑이 리더보드에서 8B 이하 국내 모델 중 최고 점수를 기록했다.


중견·스타트업 모델

NC AI 바르코(VARCO) LLM: 엔씨소프트의 14년 AI 연구 노하우를 바탕으로 개발된 모델로, 13억·64억·130억 파라미터 규모를 갖췄다. 기초·인스트럭션·대화형·생성형 등 4종류 모델을 보유하며, 2.0 버전은 오픈소스로 공개되었다. 게임 제작부터 콘텐츠, 패션 등 다양한 분야에서 실제 상용화 중이다.

업스테이지 솔라(SOLAR): 프로(220억→310억 파라미터), 미니(108억), 프로 2(310억) 등 3종 모델을 보유했다. 최신 프로 2는 하이브리드 모드로 챗 모드와 추론 모드를 선택할 수 있으며, MMLU-Pro, Math500, SWE-Bench 등에서 GPT-4o, 딥시크 R1, 미스트랄 스몰 3.2와 필적하는 성능을 보인다. 소형언어모델(sLLM) 특화로 특정 산업군에 최적화된 모델을 지향한다.

코난테크놀로지 코난 LLM: 2023년 출시된 131억~410억 파라미터 규모 모델로, 온디바이스(OND), 프로페셔널(PRO), 엔터프라이즈(ENT) 3가지 버전이 있다. 2024년 4월 공개된 ‘ENT-11’은 작문·추론·코딩 등 8개 항목에서 딥시크 R1을 능가했다고 발표했다. 공공기관과 금융권에 광범위하게 도입되어 있다.

솔트룩스 루시아(LUCIA) 3: 320억 파라미터 규모로 언어 생성·이해 특화 ‘LLM’, 복잡한 추론·판단 수행 ‘딥(Deep)’, 비정형 정보 분석 ‘VLM’ 등 3가지 모델로 구성된다. 질문의 복잡성에 따라 사고 시간을 조절하는 특징을 가진다.

이스트소프트 앨런(ALAN) LLM: AI 검색엔진 앨런의 노하우를 바탕으로 개발된 RAG 기반 모델로, 추론에 특화되어 있다. 2,000억 파라미터 이상의 초거대 모델부터 온디바이스용 경량 모델까지 구성되어 있다.

트릴리온랩스 트릴리온 7B: 네이버 하이퍼클로바X 핵심 연구자 출신이 설립한 스타트업의 70억 파라미터 모델이다. 핵심 기술인 ‘언어 간 상호학습 시스템(XLDA)’으로 한국어 같은 저자원 언어를 효과적으로 학습할 수 있도록 설계했다.

모티프테크놀로지스 모티프 2.6B: AI 인프라 기업 모레 자회사에서 개발한 26억 파라미터의 소형언어모델로, 70억 파라미터급 성능을 구현한다고 주장한다. 미스트랄 7B 대비 134% 성능을 보이며, AMD 기반으로 구축되어 있다.

이들 모델은 각각 고유한 특성과 적용 분야를 가지고 있으며, 한국어 처리 능력과 국내 서비스 환경에 최적화된 성능을 보여주고 있다. 하지만 글로벌 AI 패권 경쟁이 치열해지는 상황에서 단순한 보유 개수가 아닌 실질적 경쟁력이 중요해졌다.


국가 운명을 건 ‘AI 주권’ 프로젝트의 시작

정부는 2025년 6월부터 ‘독자 AI 파운데이션 모델’ 프로젝트를 본격 추진했다. 이는 단순한 R&D 사업을 넘어 한국의 AI 기술 주권을 확보하기 위한 국가 차원의 전략 사업이다.

과기정통부를 비롯해 정보통신산업진흥원(NIPA), 한국지능정보사회진흥원(NIA), 정보통신기획평가원(IITP) 등이 공동으로 추진하며, 총 2,136억 원 규모의 예산이 투입된다. 올해에만 1,936억 원이 지원되는 대형 프로젝트다.

목표는 명확하다. 글로벌 빅테크 대비 95% 수준의 성능을 확보한 ‘소버린 AI(주권형 AI)’를 구축해, 해외 의존도를 낮추고 디지털 주권을 확보하겠다는 것이다. 최종 선정된 모델은 ‘K-AI 모델’, 개발사는 ‘K-AI 기업’이라는 명칭을 사용할 수 있다.


15개 컨소시엄의 치열한 경쟁

지난 7월 21일 공모가 마감된 결과, 총 15개 컨소시엄이 지원해 높은 관심을 보였다. 대기업부터 스타트업, 주요 대학까지 국내 AI 생태계의 주요 플레이어들이 모두 참여했다.

참여 컨소시엄은 네이버클라우드, 루닛, 모티프테크놀로지스, 바이오넥서스, 사이오닉AI, 업스테이지, SK텔레콤, NC AI, LG AI연구원, 정션메드, 카카오, KT, 코난테크놀로지, 파이온코퍼레이션, KAIST 등이다.

이들은 8월 초까지 서면평가(15팀→10팀)와 발표평가(10팀→5팀)를 거쳐 최대 5개 정예팀으로 압축된다. 이후 6개월 단위로 단계평가를 실시해 성능·전략·파급효과를 기준으로 4팀→3팀→2팀 식으로 줄여나가며, 최종 1~2개 모델이 국가대표로 선정될 예정이다.

평가기준도 까다롭다. 단순한 성능 경쟁이 아닌 △프롬 스크래치(모델 구축의 첫 단계부터 끝까지 자체 개발) 기술력 △실제 사용자 서비스 경험 △오픈소스 공개 범위 △생태계 파급력 등이 종합적으로 평가된다.


주요 참여 기업 강점


SK텔레콤: 6년간의 노하우로 승부수

SK텔레콤은 이번 경쟁에서 가장 앞선 출발선에 서 있다. 2018년부터 한국어 기반 AI 모델 개발에 착수해 현재 ‘에이닷 엑스(A.X) 3.1’ 모델을 보유하고 있다. 340억 개 매개변수 규모의 이 모델은 국내에서 이 정도 규모를 오픈소스로 공개하는 첫 번째 사례가 될 예정이다.

SKT의 컨소시엄은 유명 기업들로 구성됐다. 크래프톤과는 게임 및 피지컬AI 개발을, 리벨리온과는 AI 인프라 구축, 포티투닷과는 AI 모빌리티 사업을 추진한다. 전 세계 1,000만 명 이상이 사용하는 AI 검색 서비스 라이너와의 협력으로 글로벌 경쟁력도 확보했다. 서울대, KAIST 연구실까지 합류해 산학연 협력체계를 완성했다.

SKT의 에이닷엑스의 경우 알리바바 오픈소스 모델 ‘QWEN 2.5’에 한국어 데이터를 학습시킨 모델로, 프롬 스크래치 모델이 아니므로 독자 AI 사업용으로 사용되지는 않는다.


LG AI연구원: 정부 인맥과 기술력의 결합

LG AI연구원은 배경훈 과기정통부 장관을 배출한 회사로, 정부 정책과의 높은 싱크로율을 자랑한다. 올해 초 국내 최초로 추론형 AI 모델 ‘엑사원 4.0’을 선보이며 기술력을 입증했다.

최근에는 이홍락 부사장과 임우형 상무를 공동 연구원장으로 선임하며 에이전틱 AI와 산업별 특화 영역에서의 활용도를 높이기 위한 체계를 구축했다. LG CNS, LG유플러스 등 계열사들과의 컨소시엄으로 그룹 차원의 역량을 결집했다.


네이버클라우드: 실서비스 경험이 무기

네이버클라우드는 하정우 현 AI미래기획수석이 과거 AI 혁신센터장으로 재직하며 ‘하이퍼클로바X’를 개발·운영한 경험을 보유하고 있다. 실제 검색·추천 서비스에 AI를 적용해 수많은 한국어권 사용자들로부터 피드백을 받은 경험은 다른 컨소시엄이 따라 하기 어려운 강점이다.

다만 최근 정부의 ‘AI 컴퓨팅 자원 활용 기반 강화(GPU 임차 지원)’ 사업에서 2트랙 우선협상대상자로 선정돼, 이번 프로젝트에서 1차 GPU 지원을 받을 수 없다는 제약이 있다. 이 때문에 다른 기업들과 컨소시엄을 구성하지 못하고 사실상 단독으로 참여한 것으로 알려졌다.

KT와 카카오

KT는 그동안 마이크로소프트와 손잡고 챗GPT 기반 한국어 특화 모델 개발에 집중했지만, 이번 프로젝트를 계기로 자체 모델 ‘믿:음 2.0’에 다시 힘을 주고 있다. 고려대 등과 컨소시엄을 구성했다.

카카오는 자체 개발한 LLM ‘카나나’를 앞세워 계열사의 다양한 서비스를 활용한 AI 모델 수요 창출을 경쟁력으로 내세웠다. 이번 사업에서 생태계 파급력이 중요한 평가기준인 만큼 유리한 고지에 있다는 평가다.

NC AI: 게임에서 범용까지

엔씨소프트의 14년 연구 노하우를 바탕으로 올해 2월 분사한 NC AI는 이번 경쟁의 다크호스로 떠올랐다. 자체 개발한 LLM ‘바르코 LLM’을 게임, 패션, 콘텐츠 등 다양한 산업에서 실제 상용화하고 있어 실용성을 입증했다.

특히 ‘바르코 LLM’을 학술적 용도뿐 아니라 상업적 용도까지 활용할 수 있도록 오픈소스로 공개해 ‘모두의 AI’에 기여한다는 철학을 보여주고 있다. 업계 관계자는 “NC AI는 다른 기업들과 달리 캡티브(계열사 간 내부 시장) 물량에서 자유롭다는 점에서 컨소시엄 구성에 경쟁력이 높다”고 평가했다.


업스테이지: 일론 머스크도 주목한 기술력

업스테이지는 최근 공개한 차세대 AI 모델 ‘솔라 프로2’가 글로벌 AI 분석기관 ‘아티피셜애널리시스’의 ‘지능 지표’에서 58점을 받으며 전체 12위에 올라 화제를 모았다. 특히 xAI 창업자 일론 머스크가 이 소식을 자신의 X(옛 트위터)에 공유하며 글로벌 관심을 끌었다.

반도체 업체인 퓨리오사AI 등과 컨소시엄을 구성했으며, 글로벌 빅테크와 해외 주요 투자사들도 업스테이지의 경쟁력에 주목해 대규모 투자를 검토 중인 것으로 알려졌다.


코난테크놀로지: 공공부문 강자의 도전

코난테크놀로지는 이번 컨소시엄 중 유일하게 구체적인 명단을 공개했다. 사이냅소프트, 알체라, 페블러스 등 AI 전문 중소기업 3곳과 KAIST, 고려대, 연세대, 포항공대 등 국내 대표 연구중심 대학 4곳이 참여하는 총 8개 기관 컨소시엄을 구성했다.

2023년 8월 131억 매개변수 규모의 ‘코난 LLM’을 선보인 후, 한국남부발전, 한국중부발전, 국방부, 행정안전부, 국회사무처, 인천국제공항공사 등 주요 공공기관과 한화손해보험, 신한라이프, KB증권, 제주항공 등 민간 분야에 광범위하게 구축하고 있다.

최근에는 추론 모델 ‘코난 LLM ENT-11’도 공개했으며, AI 반도체 스타트업 리벨리온과 손잡고 ‘국산 AI 인프라’ 구축에도 속도를 내고 있다.



KAIST: 공공형 AI의 새로운 모델

학계에서는 KAIST 교수진이 미국 스탠퍼드대, 위스콘신대 소속 한국인 AI 연구팀과 함께 주관기업으로 출전했다. KAIST 교원 창업기업인 딥오토, 컨피그인텔리전스와 컨소시엄을 구성해 고품질 데이터 학습 기술을 기반으로 공공서비스 및 R&D, AI 교육에 활용할 수 있는 공공형 AI 개발을 목표로 한다.

루닛: 의료 AI의 범용 도전

의료 AI 전문기업 루닛은 트릴리온랩스, 카카오헬스케어, 건강보험공단 등과 컨소시엄을 구성했다. 한국어 특화 LLM을 개발한 트릴리온랩스와 손잡고 범용 LLM과 더불어 의료 특화 LLM 모델을 동시에 개발하려는 전략이다.


모티프테크놀로지스: AI 인프라 기업

AI 인프라 기업 모레의 자회사인 모티프테크놀로지스도 서울대, KAIST 연구실을 비롯해 다수 기업 및 공공기관과 컨소시엄을 구성해 참여했다.


승부를 가를 3대 요소

전문가들은 이번 선발전에서 세 가지 요소가 승부를 가를 것으로 전망하고 있다.

첫째는 ‘프롬 스크래치’ 기술력이다. 모델의 첫 단계부터 끝까지 자체적으로 개발하는 능력으로, 진정한 독자 기술을 보유했는지를 판가름하는 기준이다. 현재 30B 이상의 대형 모델을 프롬 스크래치 방식으로 개발한 곳은 KT, 네이버클라우드, LG AI연구원, NC AI 정도로 알려져 있다.

둘째는 실제 사용자 서비스 경험이다. 정량적인 벤치마크보다는 실질적인 서비스를 통해 한국어권 사용자들로부터 피드백을 받아본 경험이 중요하다는 것이다. 이 부분에서는 하이퍼클로바를 검색·추천 서비스에 적용해온 네이버나 다양한 플랫폼을 보유한 카카오가 유리하다는 분석이다.

셋째는 오픈소스 공개 수준이다. 정부는 AI 모델의 오픈소스 수준을 정밀하게 평가하고, 정부 예산과 기업 자부담 매칭 수준도 오픈소스 평가에 따라 차등화할 계획이다. 완전 개방형 오픈소스는 AI 모델의 설계, 학습 데이터까지 낱낱이 공개하는 형태로, 이번 사업의 목표에 가장 적합하다고 평가받는다.


업계의 기대와 우려

업계에서는 이번 프로젝트에 대한 기대와 함께 우려의 목소리도 나오고 있다.

한 AI 기업 관계자는 “연간 수백억 원에 달하는 GPU·데이터·인재 등 파격적인 정부 지원을 통해 단숨에 글로벌 수준으로 기술력을 끌어올릴 수 있을 것이란 기대가 크다”면서도 “정부가 지원하는 GPU 수량이 글로벌 AI 기업만큼 많지 않은 만큼 적은 인프라로 최적의 AI 모델을 만들 수 있는 기술적 역량을 갖춘 팀이 선발돼야 할 것”이라고 말했다.

또 다른 관계자는 “정부가 대내외에서 인정받을 수 있는 공신력 있는 심사위원을 선별해 참여시킬지가 관건”이라며 “업계에서 인정받는 외국인 심사위원을 포함해 기술 중심으로 평가할 가능성이 높다”고 전망했다.


미래를 향한 대장정

이번 ‘독자 AI 파운데이션 모델’ 프로젝트는 단순한 기술 개발을 넘어 한국의 AI 미래를 결정할 중요한 분기점이다. 최종 선정된 모델은 산업, 공공, 국방 분야 등에 광범위하게 활용되며, AI 산업 전반의 경쟁력과 국민 삶의 질 향상을 이끌 것으로 기대된다.

무엇보다 오픈소스 공개를 통해 AI 생태계 전반의 기술 확산을 꾀한다는 점에서 의미가 크다. ‘K-AI 모델’과 ‘K-AI 기업’이라는 브랜드를 통해 국가 차원의 AI 경쟁력을 대내외에 알릴 수 있는 기회이기도 하다.

글로벌 AI 패권 경쟁이 치열해지는 상황에서 한국이 어떤 모델을 국가대표로 선정하고, 그 모델이 실제로 글로벌 경쟁력을 확보할 수 있을지가 주목된다. 2027년까지 이어질 이 대장정의 결과는 한국 AI의 미래를 좌우할 것이다.


이미지 출처: 이디오그램 생성




독자 AI 출품 기업은 어떤 모델을 갖고 있을까: ‘K-AI’ 국대 선발전의 거의 모든 것 – AI 매터스 l AI Matters