피지컬 AI의 현황과 시사점
생성형 AI를 넘어선 차세대 AI 혁명, 글로벌 시장 350% 급성장
SPRi가 발표한 리포트에 따르면, 피지컬 AI(Physical AI)가 차세대 AI 기술 트렌드로 급부상하며 전 세계적으로 주목받고 있다. 인공지능이 디지털 영역을 넘어 현실 세계로 확장되는 새로운 패러다임 전환이 시작된 것이다. 글로벌 IT 시장 조사 기관 Statista에 따르면, AI 로보틱스(AI Robotics) 시장 규모는 2020년 약 50억 달러에서 2025년 225억 달러로 350% 성장했으며, 향후 5년간 연평균 성장률(CAGR) 23.3%를 기록해 2030년에는 약 643억 달러(한화 약 85조 원)에 이를 전망이다.
피지컬 AI는 AI가 물리적 실체 안에 구현되어 센서와 액추에이터(Actuator) 등을 통해 현실 세계를 인식하고, 자율적으로 판단·행동함으로써 환경과 유기적으로 상호작용할 수 있는 시스템으로 정의된다.
엔비디아 코스모스 플랫폼으로 시뮬레이션 기반 학습 혁신
엔비디아(NVIDIA) CEO 젠슨 황은 CES 2025 기조연설에서 “AI의 다음 프론티어는 피지컬 AI”라고 선언하며 업계의 관심을 집중시켰다. 엔비디아는 피지컬 AI 개발을 강화하도록 설계된 플랫폼인 ‘코스모스(Cosmos)’를 공개했다. 일반적인 언어모델이 방대한 양의 텍스트를 기반으로 학습하는 반면, 코스모스는 물리적 세계의 이미지와 3D 모델을 생성하도록 설계됐다. 예를 들어, 코스모스는 창고 내부의 선반에서 상자가 떨어지는 사실적인 비디오 영상을 생성할 수 있으며, 이를 통해 로봇이 사고를 인식하도록 학습할 수 있다.
엔비디아는 휴머노이드용 범용 기반모델 ‘Project GR00T’를 통해 3단계 컴퓨팅 아키텍처(NVIDIA DGX, NVIDIA OVX, NVIDIA AGX)로 구성된 생태계를 구축했다. 이 시스템은 대규모 AI 학습, 시뮬레이션 기반 강화 학습, 실시간 실행 및 센서 데이터 처리를 통합적으로 지원한다.
테슬라 옵티머스부터 중국 유니트리까지, 글로벌 휴머노이드 경쟁 가속화
모건 스탠리(Morgan Stanley)의 ‘The Humanoid 100’ 분석에 따르면, 현재 휴머노이드 산업에 직접 참여하고 있는 기업 비율은 52%이며, 나머지 48%는 가까운 미래에 진출할 가능성이 높은 기업들로 분석됐다. 테슬라는 범용 휴머노이드 로봇 옵티머스(Optimus)를 통해 시장을 주도하고 있다. 옵티머스는 총 50개의 자유도(DoF)를 제공하며, 테슬라의 완전 자율주행(FSD) 하드웨어 및 소프트웨어를 활용한 중앙 컴퓨터를 탑재했다. 특히 생체 모방형 손은 11개의 자유도를 제공하며, 최대 20파운드(약 9kg) 무게를 들 수 있다.
중국 기업들의 약진도 눈에 띈다. 유니트리(Unitree)의 G-1은 경쟁사보다 훨씬 저렴한 1만 6000달러(약 2,130만 원)로 책정되어 가격 경쟁력을 앞세우고 있다. 중국은 글로벌 휴머노이드 부품 공급망의 63%를 통제하며, 국제 경쟁사 대비 절반 이하의 가격으로 로봇을 생산할 수 있는 가격 경쟁력을 확보했다.
4대 유형별 특화 발전, 자율주행차형이 2050년 18억 대 전망
피지컬 AI는 기술 수준과 형태에 따라 휴머노이드형, 자율주행차형, 드론형, AGV & AMR형으로 분류된다. Citi Group의 전망에 따르면, 2050년까지 자율주행차형이 18억 5,800만 대, 휴머노이드형이 6억 4,800만 대, AGV & AMR형이 1억 8,100만 대, 드론형이 1억 4,900만 대 보급될 것으로 예상된다.
자율주행차 분야에서는 테슬라의 오토파일럿(Autopilot)과 구글 웨이모(Waymo)가 선도하고 있다. 웨이모는 2024년 주당 10만 건 이상의 유상 운행을 달성했으며, 구글이 개발한 멀티모달 대규모 언어모델 ‘Gemini’를 기반으로 한 종단 간 멀티모달 모델 ‘EMMA’를 공개했다. 드론 분야에서는 중국 DJI의 Matrice 4 시리즈가 AI 모델을 내장하여 실시간으로 차량, 선박, 사람 등을 자동으로 감지·추적하며, 주변 환경에 따라 비행경로와 속도를 자동으로 설정하고 조정하는 지능형 시스템으로 발전했다.
미국 75% 직업 대체 전망에도 3가지 현실적 한계 존재, 비용·안전·윤리 과제 산적
피지컬 AI의 장밋빛 전망에도 불구하고 현실적인 한계와 과제들이 산적해 있다. 특히 기술적 한계, 경제적 부담, 사회적 충격이라는 3대 과제가 상용화의 걸림돌로 작용하고 있다. 먼저 기술적 측면에서 현재의 기반 모델은 다양한 환경과 복합 과제를 일반화할 수 있는 인지·제어 통합 구조가 아직 충분히 구현되지 않았다. 시뮬레이션에서 학습된 로봇의 행동은 현실 환경의 변화나 예외 상황에 민감하게 반응하며, 예기치 못한 상황 발생 시 이를 안전하게 대응하는 메커니즘이 미흡한 상태다. 또한 배터리 에너지 밀도의 연간 개선 속도(5~8%)보다 AI 모델의 전력 수요 증가 속도가 더 빨라 에너지 수요와 공급 간 격차가 확대되고 있다.
경제적 측면에서는 막대한 개발 비용이 대중적 확산을 제약하고 있다. 고성능 부품 사용, 맞춤형 설계, 복잡한 시스템 통합에 이르는 전 과정에서 상당한 자본 투입이 요구되며, 수십억 개 파라미터 규모의 파운데이션 모델 학습 및 운용에는 GPU, NPU, TPU 등 고성능 반도체 칩의 사용이 필수적이다.
사회적 충격도 우려된다. 모건 스탠리는 장기적으로 미국 내 직업의 약 75%, 근로자의 약 40%가 휴머노이드 로봇에 의해 대체될 수 있다고 분석했다. 피지컬 AI 도입의 경제적 이득이 자본 소유자나 주주에게만 집중되고, 실직 노동자에 대한 보완책이 미흡할 경우 사회적 불평등 심화 및 디지털 격차 확대로 이어질 가능성이 존재한다.
윤리적·법적 과제도 복잡하다. 자율적으로 판단·행동하는 특성상 사고 발생 시 법적 책임 주체(운영자, 개발자, 제조사 등)가 불분명해질 가능성이 있으며, 피지컬 AI는 영상·음성·위치 등 실시간 데이터를 지속해서 수집하기 때문에 민감한 개인정보 유출 또는 무단 저장의 우려도 존재한다.
FAQ
Q1: 피지컬 AI가 기존 로봇과 다른 점은 무엇인가요?
A1: 기존 로봇이 사전에 프로그래밍된 작업만 수행했다면, 피지컬 AI는 AI 기반모델을 탑재해 실시간으로 환경을 인식하고 자율적으로 판단·행동할 수 있습니다. 또한 멀티모달 AI를 통해 시각, 언어, 음성 정보를 통합적으로 처리할 수 있어 인간과 자연스러운 상호작용이 가능합니다.
Q2: 피지컬 AI 시장이 급성장하는 이유는 무엇인가요?
A2: AI 기반모델 기술의 발전, 고성능 센서 및 액추에이터의 소형화, 엣지 컴퓨팅 기술 향상이 복합적으로 작용했습니다. 특히 생성형 AI 기술이 물리적 행동으로 확장되면서 제조업, 물류, 의료, 서비스업 등 다양한 산업에서 자동화 수요가 급증하고 있습니다.
Q3: 피지컬 AI 도입 시 주요 과제는 무엇인가요?
A3: 높은 개발·운영 비용, 실제 환경에서의 안전성 확보, 일자리 대체에 따른 사회적 문제, 법적 책임 소재 불분명 등이 주요 과제입니다. 또한 배터리 수명과 에너지 효율성, 복잡한 실제 환경에서의 기술적 한계 극복도 해결해야 할 문제입니다.
해당 기사에서 인용한 보고서는 링크에서 확인할 수 있다.
이미지 출처: 이디오그램 생성
기사는 클로드와 챗GPT를 활용해 작성되었습니다.