오픈AI(OpenAI)가 역대 가장 큰 규모의 최신 AI 모델 ‘GPT-4.5’를 공개했다. 27일(현지 시간) 오픈AI 웹사이트에 올라온 게시물에 따르면, 이 모델은 비지도 학습(unsupervised learning) 방식을 대폭 확장해 더 깊은 지식과 이해력을 갖추면서도 환각(hallucination) 현상을 크게 줄인 것이 특징이다. 오픈AI는 GPT-4.5를 우선 ChatGPT 프로 사용자와 API 개발자들에게 연구 프리뷰로 출시했다. 다음 주부터는 플러스 사용자, 교육기관, 팀 계정 사용자들에게도 순차적으로 제공할 예정이다.
오픈AI 연구 책임자 미아는 “AI 역량을 확장하는 두 가지 패러다임은 비지도 학습과 추론”이라고 설명했다. 추론은 모델이 응답 전에 생각하는 능력을 길러 과학, 수학 등 복잡한 문제 해결에 효과적이다. 반면 비지도 학습은 모델의 정확성과 직관력을 향상시킨다. GPT-4.5는 단계별 추론을 하는 오픈AI의 ‘o1’ 시리즈와 달리, 비지도 학습 확장에 초점을 맞췄다. 이를 통해 세계에 대한 지식과 직관을 증가시키고 환각을 줄이는 데 성공했다.
오픈AI의 합성 데이터 담당자 라파는 데모를 통해 GPT-4.5의 특징을 보여주었다. 친구와의 갈등 상황에서 조언을 구했을 때, GPT-4.5는 사용자의 감정을 인식하고 건설적인 대화 방향을 제안했다. 반면 o1은 지시를 그대로 따라 화난 메시지를 생성하는 차이를 보였다.
정렬(alignment) 담당자 쥬니에 따르면, GPT-4.5는 GPT 계열 중 가장 높은 정확도와 가장 낮은 환각률을 기록했다. 또한 인간 테스터들의 평가에서도 모든 카테고리에서 이전 모델들을 능가했다. 특히 ‘바이브(Vibes)’ 테스트라는 새로운 평가 척도에서 창의적 지능과 감성적 뉘앙스 측정에서 좋은 성과를 보였다.
대규모 모델 개발을 위해 오픈AI는 새로운 훈련 메커니즘과 인프라를 구축했다. 저정밀 훈련을 적극 활용하고, 여러 데이터 센터에서 동시에 사전 훈련을 진행했으며, 대규모 모델을 빠르게 서빙하기 위한 새로운 추론 시스템도 개발했다.
GPT-4.5는 다양한 벤치마크에서 GPT-4보다 큰 성능 향상을 보였다. 특히 심층적인 세계 지식이 중요한 코딩 평가에서는 추론 기능을 갖춘 o3 미니보다도 우수한 성능을 기록했다. 이는 비지도 학습과 추론이 서로 보완적임을 보여준다.
오픈AI는 “앞으로의 모델에서 추론은 핵심 기능이 될 것이지만, 비지도 학습과 추론은 서로 보완한다”고 강조했다. GPT-4.5와 같이 더 많은 세계 지식을 가진 모델은 미래 추론 모델과 에이전트의 강력한 기반이 될 것이라고 전망했다.
자세한 내용은 링크에서 확인할 수 있다.
기사는 클로드와 챗GPT를 활용해 작성되었습니다.
관련 콘텐츠 더보기