Search

Mobile-Agent-v3: Foundamental Agents for GUI Automation

알리바바, 사람처럼 화면 보고 조작하는 AI 에이전트 개발……

9월 2, 2025

중국 알리바바 그룹의 통이랩(Tongyi Lab)이 개발한 GUI-Owl과 Mobile-Agent-v3가 컴퓨터 화면 자동 조작 분야에서 획기적인 성과를 거두었다. 이 시스템은…

OmniParser for Pure Vision Based GUI Agent

마이크로소프트의 혁신, GUI 이해하는 AI 도구 ‘옴니파서’ 공개…GPT-4V…

10월 28, 2024

마이크로소프트가 순수 컴퓨터 비전 기술만으로 사용자 인터페이스(UI)의 모든 상호작용 요소를 정확하게 인식하고 처리할 수 있는 ‘옴니파서(OmniParser)’를 개발했다. 이는…

GUI 자동화 – AI 매터스