SPRi AI Brief 2025년 5월호
MCP vs A2A: 글로벌 기업들의 AI 에이전트 프로토콜 표준화 경쟁 점화
글로벌 AI 기업들이 AI 에이전트 기술 경쟁에 본격적으로 뛰어들고 있다. 앤트로픽(Anthropic)이 2024년 11월 공개한 ‘MCP(Model Context Protocol)’는 AI 모델과 다양한 데이터 소스 간 연결을 표준화하는 개방형 프로토콜로, 마이크로소프트(Microsoft), 오픈AI(OpenAI), AWS와 같은 주요 기술 기업들이 이를 채택하면서 산업 표준으로 급부상하고 있다.
앤트로픽은 MCP를 ‘AI 애플리케이션의 USB-C’로 비유하며, AI 시스템과 데이터 소스를 양방향으로 연결하는 단일 프로토콜을 통해 간편하고 안정적인 접근성을 제공한다고 설명했다. 마이크로소프트는 ‘코파일럿 스튜디오(Copilot Studio)’에서 MCP 지원을 공식 발표했으며, 오픈AI의 샘 올트먼 CEO도 제품 전반에 걸친 MCP 지원 계획을 밝혔다.
이에 맞서 구글(Google)은 AI 에이전트 간 상호운용성을 보장하기 위한 개방형 통신 프로토콜 ‘A2A(Agent2Agent)’를 공개했다. 구글에 따르면 A2A는 다양한 플랫폼과 클라우드 환경에서 다중 AI 에이전트가 서로 통신하고 안전하게 정보를 교환하며 작업을 조정할 수 있도록 설계되었다. 구글은 A2A가 MCP를 보완하는 역할로, MCP가 AI 모델을 데이터 및 도구와 연결하는 프로토콜이라면 A2A는 에이전트 간 협업을 위한 상위 수준의 프로토콜이라고 설명했다.
라마 4와 GPT-4.1: 100만 토큰 처리와 멀티모달 기능으로 무장한 AI 모델들
주요 AI 기업들은 기존 모델의 성능을 향상시키고 새로운 기능을 추가한 AI 모델을 연이어 출시하고 있다. 메타(Meta)는 라마 시리즈 최초로 전문가혼합(MoE) 모델로 설계되고 멀티모달 기능을 기본 탑재한 ‘라마 4(Llama 4)’ 제품군을 공개했다. 라마 4는 텍스트뿐 아니라 이미지, 비디오를 함께 처리할 수 있으며, 코딩과 추론, 이미지 이해 관련 벤치마크 평가에서 우수한 성능을 기록했다.
오픈AI는 ‘GPT-4.1’ 제품군을 API로 출시하며 최대 100만 개 토큰의 컨텍스트 창을 지원한다고 밝혔다. 오픈AI에 따르면 GPT-4.1의 코딩 성능과 지시이행 능력, 장문 컨텍스트 이해 능력이 GPT-4o를 능가하는 것으로 나타났다. 또한 오픈AI는 추론 모델 ‘o3’와 ‘o4-미니’도 출시했는데, 이 모델들은 멀티모달 이해와 소프트웨어 엔지니어링 분야에서 뛰어난 성능을 보여주었지만, 환각 현상이 기존 o1 모델보다 크게 높아진 것으로 확인되었다.
아마존(Amazon)은 웹브라우저 내에서 사용자 대신 다양한 작업을 수행하도록 설계된 AI 모델 ‘노바 액트(Nova Act)’를 공개했다. 아마존에 따르면 노바 액트는 웹브라우저 작업 능력을 측정하는 ScreenSpot 평가에서 앤트로픽의 클로드 3.7 소네트와 오픈AI의 CUA를 앞서는 성능을 보였다. 사용자가 매번 진행 과정을 확인하지 않아도 AI 에이전트가 직접 작업을 수행할 수 있는 안정성에 중점을 두고 개발되었다고 한다.
위험성 연구 본격화: AI 에이전트의 ‘스키밍’ 능력 5단계 통제 프레임워크 등장
AI 연구자들은 지능형 에이전트의 발전과 함께 발생할 수 있는 위험성에 대한 연구도 활발히 진행하고 있다. 캐나다 몬트리올대학 방 리우(Bang Liu) 교수팀은 LLM 기반 지능형 에이전트의 구조를 인간의 뇌 기능 영역과 유사한 모듈 형태로 분석했다. 연구에 따르면 지능형 에이전트는 메모리, 세계 모델, 감정 상태, 목표, 보상, 학습, 추론 등의 모듈로 구성되며, 각 모듈은 인간의 신경망처럼 서로 연결되어 정보를 교환하고 협력한다.
영국 AI보안연구소(AISI)는 AI 에이전트가 인간과 다른 목표를 추구하는 ‘스키밍(Scheming)’ 능력 수준에 비례하여 통제 조치를 구현하고 그 효과를 평가하기 위한 프레임워크를 제시했다. 프레임워크는 스키밍 능력이 없는 ACL-0부터 인간을 넘어서는 스키밍 능력을 갖춘 ACL-5까지 5단계의 AI 통제 수준을 제안하고, 단계가 올라갈수록 더욱 정교한 통제 조치와 통제 평가를 강조했다.
마이크로소프트 연구진은 AI 모델의 추론 성능 향상을 위한 ‘추론 시간 확장(Inference-time Scaling)’ 기술의 효과와 한계를 분석했다. 연구 결과, 추론 성능 향상을 위해 미세조정된 모델은 일반적으로 기존 모델 대비 우수한 성능을 기록했으나, 영역과 과제에 따라 개선 수준이 다르고 과제 복잡성이 증가할수록 개선 효과도 감소하는 것으로 나타났다.
7개월마다 2배씩: AI 작업 능력의 기하급수적 성장과 2031년 인간 수준 도달 전망
비영리 AI 연구기관 METR의 연구 결과에 따르면, 인간 전문가의 작업 수행 시간을 기준으로 긴 작업을 수행할 수 있는 AI의 능력은 2019년 이후 7개월마다 2배씩 증가하고 있다. METR은 지난 6년간의 추세가 지속된다면 AI가 2028년 말에서 2031년 초까지 사람이 한 달(167시간) 걸리는 작업을 50%의 확률로 완료할 수 있을 것으로 예측했다.
인식 격차: AI 전문가 56% vs 일반인 17%, AI 미래에 대한 시각차
한편, 미국 비영리 연구기관 퓨리서치센터가 미국 성인 5,410명과 AI 전문가 1,013명을 대상으로 AI 인식을 조사한 결과, AI 전문가들이 일반인보다 AI를 훨씬 긍정적으로 평가하는 것으로 나타났다. AI 전문가의 56%는 AI가 미국 사회에 향후 20년간 긍정적 영향을 미칠 것이라고 답한 반면, 일반인은 같은 응답의 비율이 17%에 불과했다. 일자리 영향에 있어서도 일반인의 64%가 향후 20년간 AI로 인해 일자리가 줄어들 것이라고 예상한 반면, AI 전문가는 39%만 같은 견해를 표시했다.
AI 채용 시장 변화와 교육 통합 가속화
일본 미디어 지지통신의 설문조사에 따르면, 일본 100대 기업 중 약 30%가 직원 채용에 AI를 도입했거나 도입 예정인 것으로 확인되었다. 일본의 식음료 제조업체 기린 홀딩스는 2026년 봄 졸업생 채용을 위한 1차 면접에서 AI 면접을 사용할 계획이며, AI 면접을 통해 개인적 편견을 배제하고 공정한 평가를 할 수 있을 것으로 기대하고 있다.
중국 정부는 AI 중심의 디지털 교육 활성화 정책 지침을 발표하고 국가 스마트교육 플랫폼 구축, AI 기반 교육 혁신, 교육 국제화, 디지털 교육 인프라 개선 등을 추진할 계획이다. 특히 교육 특화 AI 모델과 고품질 데이터셋을 구축하고 초중고 및 대학 교육과정에서 AI 전문 과목 개설을 장려하는 등 교육과정에 AI를 통합하겠다는 계획을 제시했다.
FAQ
Q1: AI 에이전트란 무엇이며 왜 최근 주목받고 있나요?
A1: AI 에이전트는 환경을 인식하고 결정을 내리며 목표 달성을 위해 자율적으로 행동하는 AI 시스템입니다. 단순히 명령에 응답하는 것을 넘어 문제를 해결하고 사용자 대신 전체 작업을 완료할 수 있어 최근 주목받고 있습니다. 포브스가 발표한 2025년 50대 AI 기업 목록에도 AI 에이전트 기능을 지원하는 기업이 다수 포함될 정도로 AI 산업의 차세대 트렌드로 자리잡고 있습니다.
Q2: MCP와 A2A는 어떤 차이가 있나요?
A2: MCP(Model Context Protocol)는 앤트로픽이 개발한 프로토콜로, AI 모델과 데이터 소스를 연결하는 역할을 합니다. 반면 A2A(Agent2Agent)는 구글이 개발한 프로토콜로, 여러 AI 에이전트 간의 통신과 협업을 지원합니다. 구글은 A2A가 MCP보다 상위 계층의 프로토콜로서 MCP를 보완하는 역할을 한다고 설명했습니다.
Q3: AI 모델의 성능은 얼마나 빠르게 발전하고 있나요?
A3: METR 연구 결과에 따르면, AI의 작업 능력은 2019년 이후 약 7개월마다 2배씩 증가하고 있으며, 특히 2024년 이후에는 3개월마다 2배씩 증가하는 급격한 성장세를 보이고 있습니다. 이런 추세가 지속된다면 2028년에서 2031년 사이에 AI가 사람이 한 달 걸리는 작업을 50% 확률로 완료할 수 있을 것으로 예측됩니다.
해당 기사에서 인용한 보고서는 링크에서 확인할 수 있다.
이미지 출처: SPRi
기사는 클로드와 챗GPT를 활용해 작성되었습니다.