OpenAI가 개발자들의 요청에 부응해 GPT-4o 모델의 파인튜닝(Fine-tuning) 기능을 출시했다. 이를 통해 개발자들은 자신의 특정 사용 사례에 맞춰 GPT-4o의 성능을 높이고 비용을 낮출 수 있게 됐다.
OpenAI에 따르면 파인튜닝을 통해 모델의 응답 구조와 톤을 사용자에 맞추거나 복잡한 도메인별 지침을 따르도록 할 수 있다. 개발자들은 훈련 데이터셋에 단 몇 십 개의 예시만으로도 자신의 애플리케이션에 강력한 결과를 얻을 수 있다고 한다.
GPT-4o 파인튜닝은 현재 모든 유료 사용 티어의 개발자들이 이용할 수 있다. 훈련 비용은 100만 토큰당 25달러, 추론 비용은 입력 토큰 100만 개당 3.75달러, 출력 토큰 100만 개당 15달러다.
OpenAI는 9월 23일까지 모든 조직에 하루 100만 훈련 토큰을 무료로 제공한다고 밝혔다. 또한 GPT-4o 미니 버전에 대해서는 같은 기간 동안 하루 200만 훈련 토큰을 무료로 제공한다.
파인튜닝으로 프로젝트를 성공적으로 전환한 사례도 나오고 있다.
코사인이 개발한 AI 소프트웨어 엔지니어링 어시스턴트인 지니는 GPT-4o 미세조정을 통해 뛰어난 성과를 거뒀다. 지니는 자율적으로 버그를 식별하고 해결하며, 새로운 기능을 구축하고 코드를 리팩토링하는 능력을 갖추고 있다.
지니는 SWE-bench(Software Engineering Benchmark) 검증 벤치마크에서 43.8%의 최고 점수를 달성했다. 특히 SWE-bench Full 벤치마크에서는 이전 최고 점수인 19.27%를 크게 뛰어넘어 30.08%를 기록했다.
포춘 500대 기업의 AI 솔루션 파트너인 디스틸은 GPT-4o 미세조정을 통해 텍스트-SQL 변환 분야에서 주목할 만한 성과를 거뒀다. 디스틸의 미세조정된 GPT-4o 모델은 BIRD-SQL 벤치마크에서 1위를 차지했다. BIRD-SQL은 텍스트를 SQL 쿼리로 변환하는 능력을 평가하는 주요 벤치마크다. 이 모델은 71.83%의 실행 정확도를 기록했다.
특히 이 모델은 쿼리 재구성, 의도 분류, 사고 체인, 자체 수정 등의 작업에서 뛰어난 성능을 보였으며, SQL 생성에서 특히 높은 성능을 보였다.
이러한 성과들은 GPT-4o 미세조정이 특정 도메인에서 AI 모델의 성능을 크게 향상시킬 수 있음을 보여준다. 코딩부터 창의적 글쓰기까지 다양한 분야에서 미세조정은 모델 성능에 큰 영향을 미칠 수 있다는 점이 입증됐다.
OpenAI는 미세조정된 모델에 대한 개발자들의 완전한 제어권과 데이터 소유권을 보장한다고 밝혔다. 또한 자동화된 안전성 평가를 지속적으로 실시하고 사용 현황을 모니터링하여 애플리케이션이 사용 정책을 준수하도록 한다고 덧붙였다.
오픈 AI의 파인튜닝 정보는 오픈AI 홈페이지에서 확인할 수 있다.
관련 콘텐츠 더보기