AI 이미지 생성 기업 스태빌리티AI(Stability AI)가 자사의 최신 AI 모델 ‘스테이블 디퓨전 3.5(Stable Diffusion 3.5)’를 공개했다. 이번 버전은 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 즉시 다운로드가 가능하며, 일반 PC에서도 구동할 수 있도록 최적화됐다.
스태빌리티AI는 이번 신규 모델을 통해 전문가부터 일반 사용자까지 모두가 사용할 수 있는 강력한 이미지 생성 도구를 제공하게 됐다. 스테이블 디퓨전 3.5는 80억 개의 파라미터를 가진 ‘라지(Large)’ 모델과 이를 경량화한 ‘라지 터보(Large Turbo)’, 그리고 25억 개의 파라미터를 가진 ‘미디엄(Medium)’ 모델로 구성됐다.
라지 모델은 1메가픽셀 해상도를 지원하는 전문가용 모델이며, 라지 터보는 4단계만에 고품질 이미지를 생성할 수 있는 것이 특징이다. 29일 출시 예정인 미디엄 모델은 일반 PC 환경에서도 원활한 구동이 가능하도록 설계됐다.
스태빌리티AI는 모델 개발 과정에서 사용자 맞춤화 기능을 최우선 과제로 삼았다. 트랜스포머 블록에 쿼리-키 정규화(Query-Key Normalization)를 도입해 모델 훈련 과정을 안정화했으며, 추가 미세 조정을 쉽게 할 수 있도록 했다.
이번 버전의 가장 큰 특징은 사용자 맞춤형 기능과 효율적인 성능이다. 특정 창작 요구에 맞게 쉽게 미세 조정이 가능하며, 일반 PC에서도 원활하게 구동된다. 또한 광범위한 프롬프트 입력 없이도 다양한 피부톤과 특징을 가진 이미지를 생성할 수 있으며, 3D, 사진, 회화, 라인아트 등 다양한 시각적 스타일을 구현할 수 있다.
스태빌리티AI는 이번 모델을 커뮤니티 라이선스로 제공한다고 밝혔다. 비상업적 용도로는 무료로 사용할 수 있으며, 연간 매출 100만 달러 이하의 기업들도 무료로 이용할 수 있다. 생성된 미디어에 대한 소유권은 사용자가 보유하게 된다.
한편 스태빌리티AI는 “지난 6월 출시한 스테이블 디퓨전 3 미디엄이 기대에 미치지 못했다”며 “이번에는 커뮤니티의 소중한 피드백을 반영해 시각 미디어를 변혁하는 우리의 미션을 발전시키는 데 주력했다”고 설명했다.
스테이블 디퓨전 3.5에 대한 정보는 링크에서 확인할 수 있다.
관련 콘텐츠 더보기