오픈AI(OpenAI)가 8월 5일(현지시간) 오픈소스 언어모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’를 공개했다. 이는 GPT-2 이후 오픈AI가 내놓은 첫 번째 오픈 웨이트 언어모델이다. 두 모델은 아파치 2.0 라이선스(Apache 2.0 license) 하에서 제공되며, 비슷한 크기의 다른 오픈 모델들보다 추론 작업에서 뛰어난 성능을 보인다.
gpt-oss-120b는 총 1170억 개 매개변수를 보유하며 80GB GPU 한 대에서 구동된다. 핵심 추론 벤치마크에서 오픈AI의 o4-mini와 거의 동등한 성능을 달성했다. 코딩 경쟁, 일반 문제 해결, 도구 호출 분야에서 o3-mini를 능가하고 건강 관련 질의와 수학 경쟁에서는 o4-mini보다도 더 나은 결과를 보였다.
gpt-oss-20b는 총 210억 개 매개변수를 가지며 16GB 메모리만으로도 작동 가능해 엣지 디바이스용으로 적합하다. 일반적인 벤치마크에서 o3-mini와 비슷한 결과를 보였으며, 수학 경쟁과 건강 분야에서는 o3-mini를 앞서기도 했다.
두 모델 모두 도구 사용, 소수샷 함수 호출(few-shot function calling), 사고 연쇄 추론(CoT reasoning) 기능을 지원하며 최대 12만8천 토큰의 맥락 길이를 제공한다. 낮음, 보통, 높음의 세 가지 추론 노력 수준을 설정해 지연 시간과 성능 간 균형을 조절할 수 있다.
오픈AI는 안전성 확보를 위해 화학, 생물학, 방사선, 핵(CBRN) 관련 유해 데이터를 사전 훈련 과정에서 필터링했다. 악의적인 미세조정 가능성에 대비한 테스트에서도 안전 기준을 통과했다고 밝혔다. 모델 가중치는 허깅페이스(Hugging Face)에서 무료로 다운로드할 수 있으며, Azure, AWS, 엔비디아(NVIDIA), AMD 등 주요 플랫폼과의 파트너십을 통해 광범위한 접근성을 제공한다.

샘 알트만 오픈AI CEO는 엑스(X)를 통해 “gpt-oss는 큰 의미가 있다”며 “최첨단 오픈 웨이트 추론 모델로, 자신의 컴퓨터나 작은 크기 모델의 경우 휴대폰에서도 로컬로 실행할 수 있다”고 밝혔다. 그는 “이것이 세계 최고이자 가장 사용하기 쉬운 오픈 모델이라고 믿는다”며 “수십억 달러의 연구 결과인 이 모델을 세계에 공개해 가능한 한 많은 사람들이 AI를 사용할 수 있게 하려 한다”고 강조했다. 알트만 CEO는 “개인의 권한 부여를 믿는다”며 “대부분의 사람들이 챗GPT 같은 편리한 서비스를 원하겠지만, 필요할 때 자신만의 AI를 직접 제어하고 수정할 수 있어야 하며, 프라이버시 혜택도 분명하다”고 말했다.
해당 모델에 대한 자세한 사항은 오픈AI 웹사이트에서 확인 가능하다.
이미지 출처: 오픈AI