OLD MOATS FOR NEW MODELS: OPENNESS, CONTROL, AND COMPETITION IN GENERATIVE AI
생성형 AI 시장의 경쟁 구도에 대한 관심이 높아지고 있다. 챗GPT와 같은 대규모 언어 모델의 등장으로 AI 기술의 실용적 가치가 크게 증가했지만, 동시에 이 기술을 선도하는 기업들의 시장 지배력에 대한 우려도 커지고 있다. 미국 국가경제연구소(NBER)가 최근 발표한 연구 결과에 따르면, 생성형 AI 산업은 소수의 대형 기업들이 주도하는 과점 체제로 발전할 가능성이 큰 것으로 나타났다. 이는 기술 혁신의 특성과 보완적 자산(complementary assets)의 중요성 때문이다.
기술 혁신의 특성과 생성형 AI 시장 구조
생성형 AI 기술의 핵심은 기초 모델(foundation model)이다. 이는 대규모 데이터로 사전 학습된 AI 모델로, 다양한 downstream 애플리케이션의 기반이 된다. 대표적인 예로 오픈AI의 GPT, 구글의 제미니, 메타의 라마 등이 있다. 이러한 기초 모델들은 텍스트 생성, 이미지 인식, 음성 합성 등 다양한 분야에서 활용되고 있으며, 그 성능은 지속적으로 향상되고 있다.
연구진은 기술 혁신 경제학의 관점에서 생성형 AI 산업을 분석했다. 그 결과, 두 가지 주요 요인이 시장 구조를 결정할 것으로 예측했다. 첫째는 전유성(appropriability)으로, 기업이 혁신으로 인한 이익을 얼마나 잘 확보할 수 있는지를 나타낸다. 둘째는 보완적 자산의 통제력이다.
전유성 측면에서 생성형 AI 기술은 특허나 저작권 등 공식적인 지적재산권으로 보호받기 어려운 특성이 있다. 예를 들어, 트랜스포머 아키텍처와 같은 핵심 기술은 이미 학술 논문을 통해 공개되어 있다. 대신 기업들은 모델의 가중치나 훈련 데이터, 미세 조정 방법 등을 비밀로 유지함으로써 경쟁 우위를 확보하려 한다.
그러나 실제로 시장 지배력을 결정짓는 요인은 보완적 자산의 통제력일 가능성이 크다. 연구진은 생성형 AI 산업에서 중요한 6가지 보완적 자산을 제시했다. 이는 컴퓨팅 환경, 모델 서빙 및 추론 능력, 안전성 및 거버넌스, 벤치마크와 평가 지표, 훈련 데이터, 데이터 네트워크 효과 등이다. 이러한 보완적 자산들은 대규모 투자와 기존 인프라를 필요로 하기 때문에, 소수의 대형 기술 기업들이 유리한 위치를 차지할 가능성이 크다.
오픈소스 모델의 가능성과 한계
생성형 AI 분야에서 오픈소스 모델의 등장은 경쟁 구도에 변화를 줄 수 있는 요인으로 주목받고 있다. 특히 메타의 라마 모델이 유출된 사건은 오픈소스 AI 생태계의 잠재력을 보여주었다. 이는 기술의 민주화와 혁신 가속화의 가능성을 제시했다는 점에서 의미가 있다.
라마 모델이 공개된 후, 학계와 스타트업들은 이를 기반으로 다양한 파생 모델들을 빠르게 개발했다. 예를 들어 스탠포드 대학의 알파카, UC 버클리 등이 개발한 비쿠나 등이 등장했다. 2023년 말까지 스타트업과 학계에서 발표된 대규모 언어 모델의 30%가 라마나 그 파생 모델을 기반으로 했다는 사실은 오픈소스 모델의 영향력을 잘 보여준다.
그러나 연구진은 오픈소스 모델의 등장이 반드시 경쟁적인 시장 구조로 이어지지는 않을 것으로 예측했다. 그 이유는 앞서 언급한 보완적 자산의 중요성 때문이다. 예를 들어, 대규모 컴퓨팅 자원이나 고품질의 훈련 데이터 확보는 여전히 대형 기업들에게 유리하다. 메타의 CEO 마크 저커버그는 최근 차세대 라마 모델 개발을 위해 35만 개의 엔비디아 H100 GPU를 확보할 계획이라고 밝혔다. 이는 소규모 기업이나 학계가 쉽게 따라할 수 없는 수준의 투자다.
건전한 경쟁 환경 조성을 위한 방안
연구진은 생성형 AI 산업의 건전한 발전을 위해 여러 정책적 제언을 제시했다. 첫째, 신뢰할 수 있는 성능 평가 체계를 구축해야 한다. 정부 기관이 중립적이고 포괄적인 AI 모델 평가 기준을 개발하면, 기업들의 과장된 성능 주장을 검증하고 실제 혁신을 촉진하는 데 도움이 될 수 있다. 둘째, 저작권이 있는 데이터의 AI 훈련 목적 사용 등 핵심 법적 쟁점에 대해 정부가 적극적으로 개입하여 명확한 기준을 제시해야 한다. 이는 기업들의 투자 불확실성을 줄이는 데 기여할 수 있다.
셋째, 인프라의 ‘분할화(fractionalization)’를 장려해야 한다. 정부는 컴퓨팅 자원, 훈련 데이터 등 핵심 인프라에 대한 접근성을 높이는 정책을 추진해야 한다. 예를 들어, 대학이나 스타트업에 ‘컴퓨팅 크레딧’을 제공하는 방안을 고려할 수 있다. 넷째, 생성형 AI 기초 모델을 기반으로 한 애플리케이션 생태계 형성에 대비해 플랫폼 정책을 마련해야 한다. 기초 모델 제공 기업과 제3자 개발자 간의 공정한 관계를 보장하기 위한 정책이 필요하다.
결론적으로, 생성형 AI 산업은 기술의 특성과 보완적 자산의 중요성으로 인해 소수의 대기업이 주도하는 과점 체제로 발전할 가능성이 크다. 그러나 정부의 적절한 개입과 정책 지원을 통해 다양한 주체들이 참여하는 혁신 생태계를 조성할 수 있다. 이는 기술 발전의 속도를 높이고, 생성형 AI의 혜택을 사회 전반에 확산시키는 데 기여할 것이다.
오픈소스 모델의 등장은 이러한 노력에 긍정적인 영향을 미칠 수 있다. 비록 대기업들의 우위를 완전히 뒤집기는 어렵겠지만, 오픈소스 생태계는 다양성과 혁신의 원천으로 작용할 수 있다. 정부와 시장 참여자들은 이러한 생태계의 잠재력을 인식하고, 이를 육성하기 위한 노력을 기울여야 할 것이다.
생성형 AI 기술은 우리 사회에 큰 변화를 가져올 것이다. 이 기술이 특정 기업의 독점적 자산이 되는 것이 아니라, 사회 전체의 혁신을 이끄는 동력이 되도록 하는 것이 중요하다. 이를 위해서는 정부, 기업, 학계, 시민사회가 함께 노력해야 한다. 건전한 경쟁 환경 속에서 기술은 더욱 발전할 것이며, 그 혜택은 모든 이에게 돌아갈 수 있을 것이다.
미국 국가경제연구소의 리포트는 링크에서 확인할 수 있다.
본 기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
관련 콘텐츠 더보기