최근 구글의 제미나이 2.5 Pro 업데이트를 비롯해 다양한 AI 모델 발표가 쏟아지는 가운데, 상대적으로 주목받지 않던 오픈AI가 갑작스레 이미지 생성 성능 업데이트를 선보여 화제를 모으고 있습니다. 출시 직후부터 GPT 4o 이미지를 활용한 다양한 결과물이 SNS를 중심으로 빠르게 확산되고 있는데요. 해외에서는 GPT를 활용해 캐릭터 스티커나 4컷 웹툰 등을 간편하게 제작했다는 긍정적 후기가 이어지는 동시에, 지브리풍 이미지 생성으로 인한 저작권 문제가 새롭게 부각되고 있습니다. 관련 기사 보기
반면, 한국 사용자들 사이에서는 “한글 텍스트 출력이 크게 개선됐다”는 평가가 화제로 떠오르고 있는데요. AI매터스는 이 흐름에 주목하여 최신 업데이트된 GPT 4o 이미지 생성 기능을 직접 살펴보고, 그 한계와 가능성을 분석해 보았습니다.
한글 텍스트 출력, 짧은 건 OK! 긴 문장은 Bad…?


AI매터스가 가장 먼저 주목한 부분은 한글 텍스트 랜더링이었습니다. 실제로 짧은 한글 문장은 비교적 깔끔하게 표현되지만, 4컷 이상의 웹툰처럼 긴 문장이 들어가면 글자가 깨지거나 폰트가 뒤틀리는 현상이 잦았습니다. 영어에 비해 한글 데이터셋이 부족하다는 점이 원인으로 보이는데, 아직까지는 긴 한국어 대사를 안정적으로 처리하기가 쉽지 않은 것으로 확인됩니다.
그러나 여러 차례 실험해 본 결과, 이전에 멀쩡히 출력되던 활자도 반복 작업을 거치면 뒤틀려 나타나는 등 예측하기 어려운 결과가 발생했습니다. 문장의 길이가 출력값의 완성도를 결정하는 것은 아니라는 의미였습니다. 한글을 영어처럼 복잡한 문장까지 자연스럽게 처리할 수 있을지에 대해서는, 향후 추가 업데이트와 데이터 확장을 통해 얼마나 보완될지 지켜봐야 할 것 같습니다.
프롬프트 하나로 컨셉 유지 & 수정 사항 반영 가능


실제로 GPT 이미지 생성 모델의 가장 큰 장점은, 추가되는 텍스트 프롬프트에 따라 전체 콘셉트를 유지하면서도 원하는 수정 사항을 빠르게 반영할 수 있다는 점입니다. 예컨데, 단군 신화 콘셉트로 “호랑이와 곰이 동굴 벽에 걸린 커다란 메뉴판을 보고 있는 모습”을 요청했다가, 후속 프롬프트로 “호랑이 머리 뒤에 땀방울 두 개, 곰은 줄거워하며 흥얼거리는 음표 두 개를 추가해 달라”고 지시하면, 원본 콘셉트(동굴, 호랑이, 곰, 메뉴판)를 그대로 살리면서도 호랑이와 곰의 표정을 세부적으로 조정한 그림이 생성됩니다.
이를 통해 복잡한 수정을 직접 손으로 그리지 않아도, 간단한 문장만 입력하면 그림에 변화를 줄 수 있다는 것이 GPT 이미지 생성의 가장 큰 매력입니다. 또한 텍스트만으로 직관적인 디테일을 풍부하게 반영할 수 있어, 일러스트레이터나 그래픽 디자이너가 아닌 사람도 쉽고 빠르게 결과물을 만들어낼 수 있습니다.
차분한 색감 & 단조로운 타이포그래피


GPT 4o가 생성하는 이미지들은 전반적으로 차분하고 은은한 색감을 주로 사용한다는 인상을 줍니다. 예컨대 ‘경양식’ 간판이 등장하는 빈티지 콘셉트 일러스트를 살펴보면, 복고풍 분위기를 자아내면서도 채도가 높지 않은 파스텔 톤이나 무채색에 가까운 팔레트를 활용해 깔끔함을 강조합니다. ‘학교 종’ 문구가 들어간 삽화에서도 폰트 컬러나 배경색이 튀지 않고, 시선을 분산시키지 않는 차분한 분위기를 유지한다는 공통점이 확인됩니다.
문제는 이러한 색감이 지나치게 단조롭고 반복적이라는 점입니다. 배경 색감, 채색 방식, 폰트 구조가 비슷하다 보니, 한두 장의 이미지는 세련돼 보일 수 있으나 여러 장을 연달아 감상하면 흥미가 빠르게 식죠. 특히 타이포그래피 측면에서, 출력되는 텍스트가 거의 동일한 스타일의 서체·굵기·자간을 유지하는 경향이 있습니다. 이는 빠른 프로토타이핑에는 장점이 될 수 있지만, 독자적인 화풍과 스토리텔링을 중시하는 웹툰 작가나 그래픽 디자이너에게는 창의적 확장성을 가로막는 요소가 될 수 있습니다.
결론적으로, GPT 4o가 제공하는 일관된 색감과 폰트가 차분하고 깔끔한 ‘첫인상’을 주는 반면, 반복적이고 획일적인 결과물이 쌓이면서 장기적으로는 또다른 ‘AI 스타일’, ‘GPT 스타일’로 여겨질 수 있다는 점이 지적됩니다.
챗GPT 이미지 생성에 관심 있는 사람들을 위한 팁!
GPT 4o를 활용해 이미지를 만들고 싶다면, 먼저 원하는 콘셉트와 스타일을 구체적으로 잡아두는 것이 좋습니다. 프롬프트 작성 시에는 핵심 이미지를 결정짓는 키워드를 명료하게 제시하는 것이 중요합니다. 예를 들어, “복고풍 경양식 간판이 보이는 밤거리”라는 식의 문장을 사용하면, AI가 이미지 전체 분위기(복고풍), 구도(간판), 시간대(밤거리) 등을 한꺼번에 고려하게 됩니다. 이후 “간판 밑에는 강아지가 앉아 있고, 간판 폰트는 모던 고딕체로 바꿔줘” 같은 후속 프롬프트를 통해 세부 사항을 차근차근 수정할 수 있습니다.
또한, 눈썰미가 있는 분들이라면 이미 눈치채셨겠지만, 챗GPT는 아직 이미지 비율을 제대로 맞추지 못한다는 제한도 있습니다. 예를 들어 16:9 비율을 요구해도 3:2 비율로 생성된다거나, 3:4 비율을 부탁했는데 2:3 비율로 만들어지는 식입니다. 따라서 정확한 작업 지침을 가지고 있는 디자이너나 크리에이터라면 2차 가공이 불가피할 수밖에 없습니다.
결국 챗GPT 이미지 생성의 강점은 간단한 텍스트만으로도 원하는 그림에 점진적인 수정을 더해나갈 수 있다는 점입니다. 스케치 단계를 대신하는 아이디어 보드나 프로토타입 차원에서 활용하면, 작업 효율을 크게 높일 수 있을 것입니다.