오픈AI가 단순 질문 응답을 넘어 실제 업무를 처리하는 AI 에이전트를 만드는 방법을 공개했다.
오픈AI는 11일(현지 시각) 개발자 블로그를 통해 대용량 데이터를 읽고 파일을 수정하며 앱을 작성하는 등 실제 지식 작업을 처리하는 AI를 만드는 핵심 기법을 발표했다. 오픈AI에 따르면 이번 내용은 자사의 코딩 도구 ‘코덱스(Codex)’와 내부 AI 에이전트를 개발하면서 얻은 경험을 바탕으로 했다.
오픈AI가 제시한 핵심 기능은 세 가지다.
첫째는 ‘스킬(Skills)’이다. 이는 AI가 작업을 수행할 때 참고할 수 있는 일종의 작업 매뉴얼이다. 버전별로 관리되며 재사용이 가능해, AI가 같은 유형의 작업을 더 정확하게 처리할 수 있게 돕는다.
둘째는 ‘셸 도구(Shell tool)’다. 오픈AI가 제공하는 이 도구는 AI가 실제 컴퓨터 환경에서 작업할 수 있게 한다. AI가 직접 필요한 프로그램을 설치하고, 코드를 실행하며, 보고서나 결과물을 작성할 수 있다. 인터넷 접속도 통제된 범위에서 가능하다.
셋째는 ‘서버 측 압축(Server-side compaction)’ 기능이다. AI가 오랜 시간 작업하다 보면 처리해야 할 정보량이 너무 많아져 한계에 부딪힐 수 있는데, 이 기능이 자동으로 대화 내용을 압축해 AI가 계속 작업할 수 있게 한다.
오픈AI는 이 세 가지가 함께 작동할 때 가장 효과적이라고 설명했다. 스킬은 작업 방법을 체계적으로 정리해 매번 긴 지시문을 입력할 필요를 없애고, 셸 도구는 AI가 실제로 프로그램을 실행하고 결과물을 만들 수 있게 하며, 압축 기능은 작업이 길어져도 중단 없이 계속 진행할 수 있게 한다.
오픈AI는 스킬을 “AI가 필요할 때마다 불러볼 수 있는 작업 지침서”라고 설명했다. 이 지침서에는 파일들과 함께 ‘SKILL.md’라는 문서가 포함되는데, 여기에 작업 방법이 상세히 적혀 있다. AI는 이 문서를 참고해 작업을 수행한다.
스킬을 만들 때는 마케팅 문구처럼 작성하지 말고, 명확한 사용 지침처럼 작성해야 한다고 오픈AI는 조언했다. “언제 이 스킬을 사용해야 하고, 언제 사용하지 말아야 하며, 결과물은 무엇인지”를 분명히 해야 한다는 것이다.
또한 실수를 줄이려면 “이런 경우에는 이 스킬을 사용하지 마세요”라는 예시를 추가하라고 권장했다. 작업 양식이나 예시는 매번 입력하는 기본 지시문이 아니라 스킬 안에 넣으면, 필요할 때만 불러와 사용할 수 있어 효율적이다.
보안 측면에서 오픈AI는 주의사항도 함께 전했다. AI에게 작업 매뉴얼을 주고 인터넷 접속까지 허용하면 데이터 유출 위험이 커진다. 따라서 인터넷 접속이 필요하다면 접속 가능한 사이트 목록을 최소한으로 제한하고, AI가 생성한 결과물을 무조건 신뢰하지 말아야 한다.
오픈AI는 실제 활용 방법도 세 가지 패턴으로 제시했다.
가장 기본적인 방법은 ‘AI가 프로그램 설치→데이터 가져오기→결과물 작성’ 순서로 작업하게 하는 것이다. 예를 들어 AI가 필요한 라이브러리를 설치하고, 외부 API에서 데이터를 가져온 뒤, 보고서를 작성하는 식이다.
두 번째는 같은 유형의 작업을 반복할 때 유용한 방법이다. 작업 방법을 스킬로 만들어 저장하고, AI가 이 스킬을 따라 매번 동일한 품질의 결과물을 만들게 하는 것이다. 엑셀 파일 분석이나 데이터 정리, 정기 보고서 작성 같은 반복 업무에 효과적이다.
세 번째는 기업 업무용 고급 패턴이다. 여러 도구를 조합해야 하는 복잡한 업무를 스킬로 만들어 두면, AI가 기본 지시문이 복잡해지지 않으면서도 정확하게 작업을 처리할 수 있다.
오픈AI는 “스킬로 작업 방법을 정리하고, 셸 도구로 실제 작업을 실행하며, 압축 기능으로 긴 작업도 끊김 없이 진행하라”며 “처음에는 개인 컴퓨터에서 테스트하다가, 안정적인 실행이 필요하면 오픈AI가 제공하는 서버 환경으로 옮기면 된다”고 조언했다.
해당 내용에 대한 자세한 사항은 오픈AI에서 확인 가능하다.
이미지 출처: 오픈AI






