오픈AI(OpenAI)가 새로운 AI 모델 시리즈인 GPT-4.1을 출시하면서 안전성 보고서 없이 진행해 논란이 일고 있다. 특히 최근 AI 업계의 안전 관행에 대한 우려가 커지는 시점에서 이러한 결정은 주목을 받고 있다.
테크크런치(TechCrunch)가 15일(현지 시간) 보도한 내용에 따르면, 오픈AI는 14일 새로운 AI 모델 시리즈인 GPT-4.1을 출시했다. 이 모델은 기존 모델들보다 특정 테스트, 특히 프로그래밍 벤치마크에서 더 나은 성능을 보이는 것으로 알려졌다. 그러나 GPT-4.1은 일반적으로 오픈AI의 모델 출시를 동반하는 안전성 보고서(모델 카드 또는 시스템 카드)와 함께 제공되지 않았다. 15일 아침까지도 오픈AI는 GPT-4.1에 대한 안전성 보고서를 발표하지 않았으며, 발표할 계획도 없어 보인다. 오픈AI 대변인 샤오키 앰도(Shaokyi Amdo)는 테크크런치와의 인터뷰에서 “GPT-4.1은 프런티어 모델이 아니기 때문에 별도의 시스템 카드가 출시되지 않을 것”이라고 밝혔다.
일반적으로 AI 연구소들은 특정 모델의 안전성을 평가하기 위해 내부적으로 그리고 제3자 파트너와 함께 수행한 테스트 유형을 보여주는 안전성 보고서를 발표한다. 이러한 보고서는 때때로 모델이 인간을 속이는 경향이 있거나 위험할 정도로 설득력이 있다는 등의 불리한 정보를 드러내기도 한다. 대체로 AI 커뮤니티는 이러한 보고서를 AI 연구소가 독립 연구와 레드 팀(취약점 발견 테스트)을 지원하기 위한 선의의 노력으로 인식하고 있다.
그러나 최근 몇 개월 동안 주요 AI 연구소들이 보고 기준을 낮추는 것으로 보이면서 안전 연구자들의 반발을 불러일으켰다. 구글(Google)과 같은 일부 업체는 안전성 보고서 발표를 지연시켰고, 다른 업체들은 통상적인 세부 정보가 부족한 보고서를 발표했다.
오픈AI의 최근 기록도 예외는 아니다. 지난 12월, 이 회사는 생산 환경에 배포한 버전과 다른 모델에 대한 벤치마크 결과를 포함하는 안전성 보고서를 발표해 비판을 받았다. 지난달에는 ‘딥 리서치(deep research)’라는 모델을 출시한 후 수주 후에야 해당 모델의 시스템 카드를 발표했다.
오픈AI의 전 안전성 연구원인 스티븐 애들러(Steven Adler)는 테크크런치에 안전성 보고서가 어떤 법이나 규제에 의해 의무화되지 않았다고 지적했다. 그럼에도 불구하고 오픈AI는 모델에 대한 투명성을 높이기 위해 여러 정부에 약속을 했다. 2023년 영국 AI 안전 정상회의를 앞두고 오픈AI는 블로그 게시물에서 시스템 카드를 책임성 접근 방식의 “핵심 부분”이라고 칭했다. 그리고 2025년 파리 AI 액션 서밋을 앞두고는 시스템 카드가 모델의 위험에 대한 귀중한 통찰을 제공한다고 언급했다.
애들러는 테크크런치에 보낸 이메일에서 “시스템 카드는 AI 업계의 주요 투명성 도구이자 어떤 안전성 테스트가 수행되었는지 설명하는 도구”라고 말했다. “오늘날의 투명성 규범과 약속은 궁극적으로 자발적인 것이므로, 특정 모델에 대한 시스템 카드를 공개할지 또는 언제 공개할지는 각 AI 기업이 결정해야 한다.”
GPT-4.1이 시스템 카드 없이 출시되는 시점은 현직 및 전직 직원들이 오픈AI의 안전성 관행에 대한 우려를 제기하고 있는 때와 맞물린다. 지난주, 애들러와 다른 11명의 전 오픈AI 직원들은 일론 머스크(Elon Musk)의 오픈AI에 대한 소송에서 영리를 추구하는 오픈AI가 안전성 작업에서 지름길을 택할 수 있다고 주장하는 법정 조언서를 제출했다. 파이낸셜 타임스(Financial Times)는 최근 ChatGPT 제작사인 오픈AI가 경쟁 압력에 밀려 안전성 테스터에 할당하는 시간과 자원을 대폭 삭감했다고 보도했다.
GPT-4.1이 오픈AI의 제품군 중 최고 성능의 AI 모델은 아니지만, 효율성과 지연 시간 측면에서 상당한 향상을 보인다. 시큐어 AI 프로젝트(Secure AI Project)의 공동 창립자이자 정책 분석가인 토마스 우드사이드(Thomas Woodside)는 테크크런치에 이러한 성능 향상으로 안전성 보고서가 더욱 중요해졌다고 말했다. 모델이 더 정교해질수록 더 높은 위험을 초래할 수 있다는 것이다.
해당 기사의 원문은 링크에서 확인할 수 있다.
이미지 출처: 이디오그램 생성
기사는 클로드와 챗gpt를 활용해 작성되었습니다.