테크크런치(TechCrunch)가 23일(현지 시간) 보도한 내용에 따르면, 오픈AI(OpenAI)가 지난 수요일 챗GPT(ChatGPT)의 새롭고 향상된 이미지 생성 기능 기술을 API를 통해 제공하기 시작했다. 이로써 개발자들은 자신의 앱과 서비스에 이 기능을 통합할 수 있게 되었다.
지난 3월 말 대부분의 챗GPT 사용자에게 출시된 오픈AI의 새로운 이미지 생성기는 현실적인 지브리 스타일 사진과 AI 액션 피규어를 만드는 능력으로 인해 폭발적인 인기를 얻었다. 이는 오픈AI에게 축복과 도전을 동시에 가져왔다. 챗GPT에 수백만 명의 신규 가입자를 유치하는 동시에 회사의 서버 용량에 큰 부담을 주고 있다. 회사에 따르면, 도구가 출시된 첫 주에만 1억 3천만 명 이상의 챗GPT 사용자들이 7억 개 이상의 이미지를 생성했다.
오픈AI의 API에서 이미지 생성 기능은 “gpt-image-1″이라는 AI 모델을 통해 구현된다. 기본적으로 멀티모달 모델인 gpt-image-1은 다양한 스타일의 이미지를 생성하고, 맞춤 가이드라인을 따르며, 세계 지식을 활용하고, 텍스트를 렌더링할 수 있다. 개발자들은 gpt-image-1을 사용하여 한 번에 여러 이미지를 생성할 수 있으며, 생성 품질과 속도를 조절할 수 있다.
오픈AI에 따르면, gpt-image-1은 챗GPT의 이미지 생성과 동일한 안전 가드레일을 적용하여 회사의 정책을 위반하는 콘텐츠 생성을 제한하는 안전장치를 포함한다. 개발자는 검열 감도를 제어할 수 있으며, 이는 표준 필터링을 위한 “자동” 또는 덜 제한적인 필터링을 위한 “낮음”으로 설정할 수 있다. 낮은 필터링은 연령 제한이 필요한 콘텐츠의 범주를 더 적게 제한한다고 테크크런치에 제공된 오픈AI 문서에 명시되어 있다.
오픈AI는 또한 gpt-image-1로 생성된 모든 이미지가 C2PA 메타데이터로 워터마크 처리되어 지원되는 플랫폼과 앱에서 AI 생성 이미지로 식별될 수 있다고 밝혔다. 가격은 텍스트의 경우 입력 토큰 백만 개당 5달러, 이미지의 경우 입력 토큰 백만 개당 10달러, 그리고 이미지 출력 토큰 백만 개당 40달러다. (토큰은 모델이 처리하는 원시 데이터 비트다.) 오픈AI에 따르면, 이는 저품질, 중품질, 고품질의 정사각형 이미지 생성 시 각각 약 2센트, 7센트, 19센트에 해당한다.
이번 서비스 확장은 생성형 AI 이미지 시장에서 오픈AI의 입지를 더욱 강화할 것으로 보인다. 개발자들이 자신의 애플리케이션에 고품질 이미지 생성 기능을 쉽게 통합할 수 있게 되면서, 다양한 산업 분야에서 AI 이미지 생성의 활용이 더욱 확대될 전망이다.
해당 기사의 원문은 링크에서 확인할 수 있으며, 해당 API는 링크를 통해 사용할 수 있다.
이미지 출처: 오픈AI
기사는 클로드와 챗gpt를 활용해 작성되었습니다.