오픈AI(OpenAI)가 23일(현지 시간) 자사의 컴퓨터 사용 에이전트(Computer Using Agent, CUA) 모델인 오퍼레이터(Operator)를 업그레이드했다고 발표했다. 기존 GPT-4o 기반 모델을 최신 o3 모델로 교체하여 더욱 향상된 성능을 제공한다. 오픈AI에 따르면, 2025년 1월 연구 프리뷰로 출시된 오퍼레이터는 사용자를 위해 웹에서 작업을 수행할 수 있는 에이전트 모델이다. 이 모델은 자체 브라우저를 사용하여 웹페이지를 보고, 사람처럼 타이핑, 클릭, 스크롤 등의 방식으로 상호작용할 수 있다.
새로운 o3 오퍼레이터는 기존 4o 버전 오퍼레이터에 사용된 것과 동일한 다층 안전 접근법을 적용했다. 오픈AI는 원래 오퍼레이터 시스템 카드에서 이 접근법을 상세히 설명한 바 있다. o3 패밀리의 다른 모델들과 비교했을 때, o3 오퍼레이터는 컴퓨터 사용을 위한 추가 안전 데이터로 미세 조정되었다. 여기에는 확인 및 거부에 대한 결정 경계를 모델에 가르치도록 설계된 안전 데이터셋이 포함되어 있다.
o3 오퍼레이터는 o3의 코딩 능력을 계승했지만, 코딩 환경이나 터미널에 대한 네이티브 접근 권한은 없다. API 버전은 여전히 4o 기반으로 유지된다. 이번 업그레이드는 오픈AI가 AI 에이전트 기술 발전에 지속적으로 투자하고 있음을 보여준다. 컴퓨터 사용 에이전트는 사용자가 복잡한 온라인 작업을 자동화할 수 있도록 도와주는 차세대 AI 도구로 주목받고 있다.
오픈AI는 이번 발표를 통해 o3 오퍼레이터의 향상된 성능과 함께 안전성 강화에도 중점을 두었다고 강조했다. 특히 컴퓨터 사용 시나리오에서 발생할 수 있는 다양한 위험 요소들을 사전에 차단하기 위한 안전 장치들을 추가로 구축했다고 설명했다.
해당 기사의 원문은 링크에서 확인할 수 있다.