Search

샘 알트만 “멍청한 GPT-5 출시 인정”… 4o 복귀와 ‘차트 조작’ 해명

샘 알트만 "삐걱거린 GPT-5 출시 인정"... 4o 복귀와 '차트 조작' 해명
이미지 출처: 오픈AI

오픈AI(OpenAI) CEO 샘 알트만이 금요일 레딧(Reddit) 질의응답 세션에서 새로운 GPT-5 모델의 ‘삐걱거린’ 출시 과정을 인정하며 사용자들의 불만에 직접 답변했다. 테크크런치(TechCrunch)가 8일(현지 시간) 보도한 내용에 따르면, 알트만과 GPT-5 팀 핵심 멤버들은 r/ChatGPT 레딧 커뮤니티에서 새로운 모델에 대한 질문과 이전 모델인 GPT-4o 복귀 요청을 받았다. 또한 프레젠테이션에서 가장 당황스럽고 웃음거리가 된 실수인 ‘차트 참사’에 대한 질문도 쏟아졌다.

GPT-5가 새롭게 도입한 기능 중 하나는 특정 프롬프트에 대해 어떤 모델을 사용할지 결정하는 실시간 라우터다. 이 기능은 빠르게 응답하거나 답변을 ‘생각’하는 데 추가 시간을 투자할지 판단한다. 하지만 레딧 질의응답에서 여러 사용자가 GPT-5가 4o만큼 잘 작동하지 않는다고 불평했다. 알트만은 GPT-5가 ‘더 멍청해’ 보이는 이유가 목요일 출시 당시 라우터가 제대로 작동하지 않았기 때문이라고 설명했다.

알트만은 “GPT-5가 오늘부터 더 똑똑해 보일 것이다. 어제 심각한 장애가 발생해 하루 중 상당 시간 동안 자동 전환기가 작동하지 않았고, 그 결과 GPT-5가 훨씬 멍청해 보였다”며 “또한 결정 경계가 작동하는 방식에 일부 개입을 하고 있어 적절한 모델을 더 자주 받을 수 있도록 도울 것이다. 특정 쿼리에 어떤 모델이 답변하는지 더 투명하게 만들 예정이다”라고 약속했다.

그럼에도 불구하고 질의응답 참가자들이 플러스(Plus) 구독자들을 위해 4o를 다시 가져달라고 강력히 요청하자, 알트만은 이를 검토하겠다고 약속했다. 그는 “플러스 사용자들이 계속 4o를 사용할 수 있도록 하는 방안을 검토하고 있다. 절충안에 대한 더 많은 데이터를 수집하려고 노력하고 있다”고 적었다. 알트만은 또한 “출시를 완료하면서 플러스 사용자들의 사용량 제한을 두 배로 늘릴 예정이다”라고 약속했다. 이는 사람들이 월간 프롬프트 부족 걱정 없이 새로운 모델을 플레이하고 학습하며 자신의 사용 사례에 적용할 기회를 제공할 것이다.

예상대로 그는 라이브 프레젠테이션에서 팀이 제시한 부정확한 차트에 대한 질문도 받았다. 이 차트는 빠르게 많은 ‘차트 참사’ 농담의 표적이 되었다. 해당 차트는 낮은 벤치마크 점수를 훨씬 높은 막대로 표현했다. 알트만은 질의응답에서 차트에 대한 질문에는 답하지 않았지만, 목요일 엑스(X)에서 이 차트를 “메가 차트 실수”라고 불렀다. 다른 사람들은 공개된 블로그 포스트의 차트는 정확했다고 지적했다.

하지만 이미 피해는 발생했다. 기업 프레젠테이션에서 GPT를 사용해 차트를 만드는 것에 대한 농담이 이어졌다. 조기 접근 권한을 받아 모델 성능을 전반적으로 좋게 평가했던 GPT-5 리뷰어 사이먼 윌리슨(Simon Willison)도 데이터를 표로 변환하는 것이 “GPT-5 실패의 좋은 예”라고 지적했다. 어쨌든 알트만은 사람들이 가장 우려하는 항목들에 대한 수정을 약속했다. 그는 질의응답을 “안정화를 위해 계속 노력하고 피드백을 계속 들을 것이다”라는 약속으로 마무리했다.

해당 기사의 원문은 테크크런치에서 확인 가능하다.

이미지 출처: 오픈AI




샘 알트만 “멍청한 GPT-5 출시 인정”… 4o 복귀와 ‘차트 조작’ 해명 – AI 매터스 l AI Matters