여러 종류의 정보를 동시에 이해하는 ‘멀티모달 AI’ 시장이 앞으로 10년간 해마다 약 40%씩 성장해 2035년에는 940억 달러(한화 약 138조 원) 규모가 될 전망이다. 글자, 사진, 음성, 영상 등 다양한 형태의 정보를 한꺼번에 처리하는 이 기술이 병원을 시작으로 여러 산업에서 빠르게 쓰이면서, AI 시장의 새로운 성장 엔진으로 떠오르고 있다.
33억 달러에서 940억 달러로… 10년간 28배 커진다
시장조사 전문기관 리서치앤마켓(Research and Markets)이 발표한 ‘멀티모달 AI 시장 전망 보고서 2025-2035’에 따르면, 전 세계 멀티모달 AI 시장은 2025년 32.9억 달러(한화 약 4조 7천억 원)에서 시작해 2035년 939.9억 달러(한화 약 137조 7천억원)으로 불어날 것으로 보인다. 10년 동안 약 28배 커지는 셈이다. 멀티모달 AI는 기존 AI가 한 가지 형태의 정보만 다루던 것과 달리, 글자, 음성, 사진, 영상, 센서가 감지한 데이터 등 여러 종류의 정보를 동시에 받아들이고 이해하는 기술이다. 이렇게 여러 정보를 함께 분석하면 상황을 훨씬 정확하게 파악할 수 있다.

보고서는 지난 10년간 AI 기술이 미리 정해진 규칙을 따르던 방식에서 사람처럼 생각하는 복잡한 방식으로 크게 바뀌었다고 분석했다. 최신 AI 기술들이 기계와 주변 환경이 소통하는 방법을 완전히 바꿔놓았고, 멀티모달 AI는 이런 발전의 정점에 있다. 감정을 분석하거나 의료 정보에서 중요한 내용을 찾아내는 등 복잡한 작업을 자동으로 처리하고 판단할 수 있는 이 기술이 시장 성장을 이끌고 있다.
새로운 콘텐츠 만드는 AI가 인기… 구독형 서비스로 중소기업도 쉽게 이용
멀티모달 AI 시장은 제공 방식에 따라 서비스와 제품으로 나뉘는데, 지금은 아마존웹서비스(AWS)와 마이크로소프트 애저 AI(Microsoft Azure AI) 같은 클라우드 기반 플랫폼 덕분에 제품 쪽이 시장을 이끌고 있다. 하지만 서비스 분야도 구독형 AI 서비스(AIaaS, AI-as-a-Service) 방식이 확산되면서 빠르게 성장하는 중이다. 이 구독형 서비스는 비용 부담 없이 멀티모달 AI를 쓸 수 있게 해서, 중소기업들에 새로운 기회를 열어주고 있다.
AI 종류별로 보면 새로운 콘텐츠를 만들어내는 ‘생성형 멀티모달 AI’가 시장을 주도하고 있다. 여러 형식의 창작물을 만들 수 있는 생성형 AI의 능력이 시장을 이끄는 핵심 요인이다. 다양한 데이터를 통합해서 입력받는 방식을 통해 여러 형태의 콘텐츠를 만들어내는 능력이 기업과 소비자 모두에게 큰 관심을 받고 있다. 정보 형식별로는 현재 글자 정보가 가장 많이 쓰인다. 언어를 이해하는 기술과 의미 검색 같은 분야가 글자 정보의 강세를 뒷받침한다. 하지만 사진과 영상 정보의 활용이 소매업, 병원, 자율주행 기술 분야에서 빠르게 늘어나고 있어, 앞으로 시장 판도가 바뀔 가능성이 크다.
병원에서 가장 빠르게 성장… AI 의료 영상 기술이 진단 정확도 높여
기술별로는 머신러닝이 가장 앞서 있다. 여러 종류의 정보를 연결하고 AI가 자동으로 작업하고 개인에게 맞춤 서비스를 제공하는 데 머신러닝 기술이 핵심 역할을 한다. 산업별로 봤을 때 가장 눈에 띄는 점은 병원 분야의 급성장이다. AI를 활용한 의료 영상 기술이 진단 정확도를 크게 높이면서 병원 분야가 가장 빠른 속도로 성장할 것으로 예상된다.
지역별로는 북미 지역이 전 세계 시장을 이끌고 있다. 탄탄한 기술 기반과 AI 분야에 대한 대규모 투자가 북미의 시장 주도권을 뒷받침한다. 구글, 마이크로소프트, 아마존, IBM, 오픈AI 같은 세계적인 AI 선도 기업들이 북미에 모여 있다는 점도 이 지역의 강점이다. 보고서에는 에이베리(Aiberry), 에임소프트(Aimsoft), 비원트(Beewant), 호퍼(Hoppr), 지나 AI(Jina AI), 모비스랩스(Mobis Labs) 등 다양한 멀티모달 AI 전문 기업들이 소개되어 있다.
한국 기업, 병원과 제조업에서 멀티모달 AI 기회 찾아야
이번 보고서가 보여주는 멀티모달 AI 시장의 빠른 성장은 한국 AI 산업에 중요한 의미를 준다.
첫째, 의료 분야의 급성장은 국내 의료 AI 기업들에 큰 기회다. 한국은 우수한 병원 시설과 전자의료기록 시스템을 갖추고 있어, 멀티모달 AI 기반 진단 기술을 개발하기 좋은 환경이다. 대형 의료기관과 협력해서 실제 진료 데이터를 활용한 멀티모달 AI 모델을 개발한다면, 세계 시장에서도 경쟁력을 갖출 수 있을 것이다.
둘째, 제조업이 강한 한국의 특성을 고려할 때, 공장에서 멀티모달 AI를 활용하는 것도 주목해야 한다. 카메라 시스템, 센서 데이터, 품질 점검 기록을 함께 분석하는 멀티모달 AI는 스마트 공장의 핵심 기술이 될 수 있다. 국내 제조 대기업들이 이미 AI 기반 제조 혁신을 추진하고 있지만, 멀티모달 방식을 적용하면 불량품 검출과 예측 정비를 더욱 정교하게 수행할 수 있을 것이다.
셋째, 구독형 AI 서비스의 등장은 국내 중소기업들에도 멀티모달 AI를 쓸 수 있는 기회를 준다. 국내 클라우드 플랫폼 사업자들이 멀티모달 AI를 서비스 형태로 제공한다면, 자체 AI 개발 능력이 부족한 중소기업들도 첨단 AI 기술을 활용할 수 있다.
마지막으로, 세계 시장에서 북미가 주도권을 쥐고 있는 상황에서, 한국 기업들은 아시아 시장에 특화된 전략을 세워야 한다. 아시아 언어와 문화에 최적화된 멀티모달 AI 모델을 개발하고, 아시아 비즈니스 환경에 맞는 솔루션을 제공한다면 차별화된 경쟁력을 확보할 수 있을 것이다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q1. 멀티모달 AI는 일반 AI와 어떻게 다른가요?
A. 일반 AI는 글이나 사진 같은 한 가지 형태의 정보만 처리하지만, 멀티모달 AI는 글, 사진, 음성, 영상을 동시에 이해하고 분석할 수 있다. 예를 들어 병원에서 환자의 의료 영상과 진료 기록을 함께 분석해 더 정확한 진단을 내릴 수 있다.
Q2. 멀티모달 AI 시장이 빠르게 성장하는 이유는 무엇인가요?
A. 병원, 자율주행차, 소매업 등 여러 산업에서 다양한 종류의 정보를 동시에 분석할 필요가 커지고 있기 때문이다. 특히 클라우드 기반 구독형 AI 서비스가 나오면서 중소기업도 저렴한 비용으로 멀티모달 AI를 이용할 수 있게 되어 시장이 급성장하고 있다.
Q3. 멀티모달 AI는 어떤 분야에서 가장 많이 쓰이나요?
A. 현재 의료 분야에서 가장 빠르게 도입되고 있다. AI가 의료 영상 분석을 통해 진단 정확도를 높이는 데 활용되고 있다. 이 밖에도 자율주행차, 소매업, 감정 분석 등 여러 분야에서 사용되고 있다.
해당 기사에 인용된 리포트 원문은 Research and Markets 에서 확인 가능하다.
리포트명: Multimodal AI Market, Till 2035: Distribution by Type of Offering, Type of Multimodal, Type of Modality, Type of Technology, Type of Vertical, and Geographical Regions: Industry Trends and Global Forecasts
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다






