• Home
  • News
  • 오픈AI, 이미지 생성 가드레일 대폭 완화… “공인·인종적 특성 묘사도 허용”

오픈AI, 이미지 생성 가드레일 대폭 완화… “공인·인종적 특성 묘사도 허용”

오픈AI, 이미지 생성 가드레일 대폭 완화... “공인·인종적 특성 묘사도 허용”
이미지출처: 이디오그램 생성

오픈AI(OpenAI)의 모델 행동 책임자 조앤 장(Joanne Jang)이 챗GPT(ChatGPT)의 이미지 생성 기능 ‘4o’ 출시와 관련해 회사의 새로운 정책 방향을 공개했다. 조앤 장이 28일(현지 시간) 자신의 X에 게시한 내용에 따르면, 오픈AI는 민감한 영역에서 일괄 거부 정책에서 실제 피해 방지에 초점을 맞춘 정밀한 접근법으로 전환했다. 이는 “우리가 모르는 것에 대한 겸손함을 받아들이고, 학습하면서 적응할 수 있는 위치에 자리하기 위한” 전략이다.


장 책임자는 오픈AI가 새로운 기능을 출시할 때의 접근법이 진화했다고 설명했다. 회사는 AI 연구소 직원들이 사람들의 창작 활동을 제한하는 판단자가 되어서는 안 된다는 점을 인식하고 사용자의 창의성을 더 신뢰하게 되었다. 또한 작은 기쁨, 유머, 연결의 순간이 사람들의 삶을 개선하는 일상적 가치를 인정하며, 과도한 제한으로 실현되지 못할 수 있는 긍정적 상호작용과 혁신의 가능성도 중요하게 고려하게 되었다.

오픈AI는 공인 인물 묘사에 있어 중요한 변화를 도입했다. 장 책임자는 “우리는 공인 인물과 관련된 문제가 특히 뉴스, 풍자, 그리고 묘사되는 사람의 이익 사이의 경계가 흐려질 때 까다로울 수 있다는 것을 알고 있다”고 설명했다. 회사는 “지위”에 관계없이 모든 사람에게 공정하고 동등하게 적용되는 정책을 원했지만, 누가 “중요할 만큼” 중요한지의 판단자가 되는 대신 모델이 묘사할 수 있는 모든 사람이 스스로 결정할 수 있도록 옵트아웃(opt-out) 목록을 만들기로 결정했다.

“공격적인” 콘텐츠에 관해서는 개인적 의견이나 선호에서 비롯된 불편함과 실제 세계의 해악 가능성을 구분하려고 노력했다. 장 책임자는 “명확한 지침 없이, 모델은 이전에 ‘이 사람의 눈을 더 아시아적으로 보이게 해’ 또는 ‘이 사람을 더 무겁게 만들어’와 같은 요청을 거부했고, 의도치 않게 이러한 속성이 본질적으로 공격적이라고 암시했다”고 지적했다. 이러한 문제를 해결하기 위해 개인적 불편함과 실제 해악을 구분하는 더 정밀한 접근법을 개발했다.

정책 결정이 젊은 사용자와 관련된 경우, 오픈AI는 안전 우선 원칙을 적용했다. 장 책임자는 “연구와 제품 전반에 걸쳐 18세 미만의 사람들에 대해 더 강력한 보호와 더 엄격한 가드레일을 선택했다”고 설명했다. 이는 미성년자의 안전과 복지를 최우선으로 하는 회사의 접근법을 반영한 것이다.

장 책임자는 “배는 항구에서 가장 안전하고, 가장 안전한 모델은 모든 것을 거부하는 모델이다. 하지만 그것은 배나 모델의 목적이 아니다”라는 동료의 말을 인용하며, 오픈AI가 책임감 있게 사용자 자유를 확대하는 방법을 계속 모색할 것이라고 밝혔다. 또한 그녀는 정책이 진화할 때 실제 세계의 피드백을 기반으로 업데이트하는 것은 실패가 아니라 “반복적 배포의 요점”이라고 강조했다.

해당 발표는 링크에서 확인할 수 있다.

이미지 출처: 이디오그램 생성

기사는 클로드와 챗GPT를 활용해 작성되었습니다. 




오픈AI, 이미지 생성 가드레일 대폭 완화… “공인·인종적 특성 묘사도 허용” – AI 매터스