• Home
  • AI Report
  • “AI만으로 상업 포스터 완성” 바이트댄스, 풀스택 편집 가능한 디자인 시스템 공개

“AI만으로 상업 포스터 완성” 바이트댄스, 풀스택 편집 가능한 디자인 시스템 공개

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation
이미지 출처: CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation


바이트댄스(ByteDance)가 개발한 CreatiPoster는 기존 AI 그래픽 디자인 도구의 한계를 극복한 혁신적인 시스템이다. 바이트댄스 연구진이 공개한 연구 논문에 따르면, 해당 시스템은 사용자가 제공한 텍스트 지시사항이나 이미지 자료를 바탕으로 완전히 편집 가능한 다층 구조의 포스터를 자동 생성할 수 있다. 이 시스템은 프로토콜 모델(Protocol Model)과 배경 모델(Background Model)의 이중 구조로 설계되어, 각 레이어의 정확한 배치와 스타일을 JSON 형태로 명시하면서도 시각적으로 매력적인 배경을 함께 생성한다.

CreatiPoster Towards Editable and Controllable Multi-Layer Graphic Design Generation


마이크로소프트·캔바 모든 평가 지표에서 압도적 성능 입증

CreatiPoster는 그래픽 디자인 자동화에서 가장 중요한 네 가지 요소인 텍스트 정확도, 에셋 충실도, 편집 가능성, 미적 매력을 모두 충족하는 첫 번째 AI 시스템이다. 연구진이 진행한 벤치마크 평가에서 CreatiPoster는 마이크로소프트 디자이너(Microsoft Designer), 캔바 매직 디자인(Canva Magic Design) 등 기존 상용 서비스와 오픈콜(OpenCOLE) 같은 오픈소스 방법론을 모든 평가 지표에서 상회했다. 특히 사용자가 제공한 브랜드 로고나 제품 이미지 등의 에셋을 정확히 보존하면서도 자연스럽게 통합하는 능력에서 뛰어난 성능을 보였다.

JSON 프로토콜로 포토샵급 레이어 편집 자유도 구현

CreatiPoster의 핵심 혁신은 프로토콜 기반 아키텍처에 있다. 시스템은 먼저 대형 멀티모달 모델을 활용한 프로토콜 모델이 사용자 입력을 분석해 각 레이어의 위치, 크기, 폰트, 색상, 회전각 등을 세밀하게 명시한 JSON 형태의 프로토콜을 생성한다. 이 프로토콜은 스키아(Skia) 같은 렌더링 엔진을 통해 즉시 시각화될 수 있으며, 사용자는 GUI 편집기에서 모든 요소를 자유롭게 수정할 수 있다. 이후 배경 모델이 렌더링된 전경 레이어와 배경 설명을 바탕으로 조화로운 배경을 생성하여 최종 디자인을 완성한다.

중국어·영어 학습만으로 일본어·프랑스어·아랍어까지 지원

CreatiPoster는 텍스트 프롬프트만 사용하는 방식부터 사용자 제공 에셋과 텍스트를 조합하는 방식, 그리고 캔버스 모드에서 특정 요소의 위치를 미리 지정하는 방식까지 다양한 입력 모드를 지원한다. 또한 텍스트 오버레이, 포스터 리레이아웃, 반응형 크기 조정, 다국어 적응, 애니메이션 포스터 제작 등 실용적인 응용 프로그램들을 제공한다. 연구진은 특히 다국어 지원 능력을 강조하며, 중국어와 영어로만 훈련했음에도 불구하고 일본어, 프랑스어, 아랍어 등 다른 언어로도 일반화할 수 있음을 입증했다.

저작권 없는 10만 개 샘플과 GPT-4.1 기반 평가 벤치마크 무료 공개

연구진은 AI 기반 그래픽 디자인 연구를 촉진하기 위해 저작권이 없는 10만 개의 다층 디자인 샘플로 구성된 데이터셋과 포괄적인 벤치마크를 공개했다. 이 벤치마크는 레이아웃, 색상, 그래픽 스타일, 준수도 등 네 가지 차원에서 자동화된 평가 지표를 제공하며, GPT-4.1을 활용한 정량적 평가와 인간 평가자의 정성적 평가를 모두 포함한다. 다만 연구진은 작은 아이콘의 왜곡과 텍스트-에셋 레이어 간의 정렬 오류 등 일부 한계가 여전히 존재한다고 인정하며, 이는 향후 4K 해상도 확산 모델과 개선된 레이아웃 모델링을 통해 해결될 수 있을 것이라고 전망했다.

FAQ

Q: CreatiPoster가 기존 캔바나 어도비 같은 디자인 도구와 다른 점은 무엇인가요?

A: CreatiPoster는 사용자가 제공한 이미지나 로고를 정확히 보존하면서 자동으로 디자인을 생성하고, 생성된 모든 요소를 완전히 편집할 수 있다는 점에서 차별화됩니다. 기존 도구들이 템플릿 기반으로 제한적인 편집만 가능한 반면, CreatiPoster는 각 레이어를 독립적으로 수정할 수 있습니다.

Q: 일반인도 쉽게 사용할 수 있나요?

A: 네, CreatiPoster는 간단한 텍스트 설명만으로도 전문적인 포스터를 생성할 수 있도록 설계되었습니다. 복잡한 디자인 지식 없이도 “화장품 광고 포스터, 분홍색 배경”과 같은 간단한 설명으로 고품질 디자인을 얻을 수 있습니다.

Q: 상업적으로 활용할 수 있나요?

A: 연구진이 공개한 데이터셋은 저작권이 없는 샘플들로 구성되어 있으며, 시스템 자체도 오픈소스로 공개될 예정입니다. 다만 상업적 활용 시에는 해당 라이선스 조건을 확인하시기 바랍니다.

해당 기사에 인용된 논문 원문은 arxiv에서 확인 가능하다.

이미지 출처: CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation




“AI만으로 상업 포스터 완성” 바이트댄스, 풀스택 편집 가능한 디자인 시스템 공개 – AI 매터스 l AI Matters