Search

나노바나나 정체 밝혀졌다… 구글, 캐릭터 일관성 유지하는 ‘제미나이 2.5 플래시 이미지’ API 공개

나노바나나 정체 밝혀졌다… 구글, 캐릭터 일관성 유지하는 '제미나이 2.5 플래시 이미지' 공개
이미지 출처: 구글

구글이 차세대 이미지 생성 및 편집 모델 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’를 26일(현지 시간) 공개했다. 이 모델은 개발자들이 여러 이미지를 하나로 합성하고, 스토리텔링을 위한 캐릭터 일관성을 유지하며, 자연어를 통해 정확한 이미지 변환을 수행할 수 있도록 지원한다.

제미나이 2.5 플래시 이미지의 핵심 기능 중 하나는 캐릭터 일관성 유지다. 이미지 생성에서 오랫동안 해결하기 어려웠던 문제인 여러 프롬프트와 편집 과정에서 캐릭터나 객체의 외형을 일관되게 유지하는 기능을 제공한다. 사용자는 같은 캐릭터를 다양한 환경에 배치하거나, 새로운 배경에서 제품을 여러 각도로 보여주거나, 일관된 브랜드 자산을 생성할 수 있다.

또한 이 모델은 자연어 기반 이미지 편집 기능을 지원한다. 사용자는 간단한 프롬프트만으로 이미지 배경을 흐리게 하거나, 티셔츠의 얼룩을 제거하거나, 사진에서 사람을 완전히 삭제하거나, 피사체의 자세를 변경하거나, 흑백 사진에 색상을 입히는 등의 정밀한 편집 작업을 수행할 수 있다.

특히 주목할 점은 제미나이 2.5 플래시 이미지가 제미나이의 세계 지식을 활용한다는 것이다. 기존 이미지 생성 모델들이 미적으로 아름다운 이미지 제작에는 뛰어났지만 현실 세계에 대한 깊이 있는 의미론적 이해가 부족했던 반면, 이 모델은 실제 세계에 대한 지식을 바탕으로 교육적 활용 등 새로운 사용 사례를 가능하게 한다.

다중 이미지 융합 기능도 새롭게 추가됐다. 사용자는 여러 입력 이미지를 이해하고 합성해 객체를 장면에 배치하거나, 색상 구성이나 질감으로 공간을 재구성하거나, 단일 프롬프트로 이미지들을 융합할 수 있다.

구글은 개발자들의 접근성을 높이기 위해 구글 AI 스튜디오의 ‘빌드 모드(build mode)’를 대폭 개선했다고 밝혔다. 개발자들은 맞춤형 AI 앱으로 모델 기능을 빠르게 테스트하거나, 단일 프롬프트만으로 아이디어를 구현할 수 있으며, 완성된 앱을 구글 AI 스튜디오에서 바로 배포하거나 깃허브(GitHub)에 코드를 저장할 수 있다.

새로운 모델은 제미나이 API(Gemini API)와 개발자용 구글 AI 스튜디오(Google AI Studio), 기업용 버텍스 AI(Vertex AI)를 통해 즉시 이용할 수 있다. 가격은 출력 토큰 100만 개당 30달러로 책정됐으며, 각 이미지는 1290개의 출력 토큰에 해당해 이미지당 약 0.039달러의 비용이 발생한다. 이 모델은 현재 제미나이 API와 구글 AI 스튜디오를 통해 프리뷰 버전으로 제공되며, 몇 주 내에 정식 버전이 출시될 예정이다.

해당 모델에 대한 자세한 사항은 구글에서 확인 가능하다.

이미지 출처: 구글




나노바나나 정체 밝혀졌다… 구글, 캐릭터 일관성 유지하는 ‘제미나이 2.5 플래시 이미지’ API 공개 – AI 매터스 l AI Matters