마이크로소프트가 5월 26일 코파일럿 스튜디오(Copilot Studio) 5월 업데이트를 공개하며 ‘컴퓨터 사용 에이전트(computer-using agents)’를 정식(GA)으로 전환했다. 사람이 하듯 화면을 보고 클릭하고 양식을 채우며 데이터를 추출하는 AI 에이전트로, 시각적 인터페이스만 있으면 API가 없는 앱에서도 작동한다.
이 기능의 의미는 ‘연결할 수 없던 소프트웨어’를 연결한다는 데 있다. 대다수 조직은 프로그래밍 연동을 염두에 두지 않고 만들어진 10~50개의 핵심 내부 도구를 쓴다. 컴퓨터 사용 에이전트는 벤더가 API를 새로 만들거나 기업이 별도 커넥터를 개발하지 않아도, 에이전트가 화면을 직접 보고 조작해 작업을 처리한다.
이번 업데이트에는 세 가지 개선도 함께 담겼다. 첫째, 조건 분기와 병렬 실행 경로를 지원하고 단계별 행동 추적을 보여주는 디버깅 콘솔을 갖춘 새 워크플로 캔버스다. 둘째, 마이크로소프트 비바 워크 IQ(Viva Work IQ)의 신호를 에이전트 판단 로직에 반영하는 ‘Work IQ 확장’ 기능이다. 셋째, 500밀리초 미만의 응답 지연으로 실시간 음성 통화를 처리하는 기능으로, 그동안 음성에 쓰기엔 느렸던 고객 서비스·IT 헬프데스크 활용을 가능하게 했다.
이 모든 행보는 한 방향을 가리킨다. 마이크로소프트는 2026년 들어 코파일럿을 대화형 비서에서 ‘에이전트 우선’ 멀티모델 플랫폼으로 재구축하고 있다. 애저 AI 파운드리에 앤트로픽의 클로드를 추가하고, 컴퓨터 사용 에이전트를 정식 출시하며, 워크 IQ 신호를 통합하는 것은 모두 ‘어떤 모델이 추론을 맡든 애저를 기업 AI 에이전트의 거버넌스·보안 계층으로 만든다’는 전략의 일환이다.
에이전트가 사람처럼 화면을 조작한다는 개념은 본지 독자들의 관심이 가장 높은 주제 중 하나다. ‘AI 에이전트 성능 한계’ 관련 기사가 꾸준히 상위 조회수를 기록해 온 만큼, 실제 기업 현장에서 컴퓨터 사용 에이전트가 어디까지 안정적으로 일하는지가 다음 검증 무대가 될 전망이다.
마이크로소프트는 6월 2~3일 빌드 2026 개발자 행사에서 이 전략을 한층 구체화할 것으로 보인다. 애저 AI 파운드리의 멀티모델 지원 공식화, 깃허브 코파일럿의 멀티 에이전트 오케스트레이션, 자율 에이전트의 행동을 감사·통제하는 ‘에이전트 365’ 기능 등이 거론된다. 사티아 나델라 CEO가 ‘코파일럿은 단순 기능이 아니라 어떤 모델이든 올라탈 수 있는 플랫폼’이라는 메시지를 얼마나 설득력 있게 전달하느냐가 핵심이다. 컴퓨터 사용 에이전트는 그 서사를 뒷받침하는 가장 가시적인 무기가 될 가능성이 크다.
자세한 내용은 마이크로소프트 공식 블로그(Microsoft)에서 확인할 수 있다.
이미지 출처: 이디오그램 생성




![[스페이스X 상장 SEC 조건 신고서 몰아보기 #5] 공모 자금, 스타십·스타링크·AI 컴퓨트에 사용](https://aimatters.co.kr/wp-content/uploads/2026/06/spacex_fwp_SpaceX_FWP_5.jpg)

![[스페이스X 상장 SEC 조건 신고서 몰아보기 #1] ‘SPCX’로 결정… 나스닥·나스닥 텍사스 동시 상장](https://aimatters.co.kr/wp-content/uploads/2026/06/spacex_fwp_SpaceX_FWP_1.jpg)