구글 딥마인드, 제미나이 2.0 플래시에 네이티브 이미지 생성 기능 탑재

구글 딥마인드(Google DeepMind)가 13일(현지 시간) 자사 X에 발표한 내용에 따르면, 구글 딥마인드가 제미나이 2.0 플래시(Gemini 2.0 Flash) 모델에 네이티브 이미지 생성 기능을 새롭게 추가했다. 이번 업데이트를 통해 사용자들은 구글 AI 스튜디오(Google AI Studio)에서 텍스트 프롬프트만으로 이미지를 생성할 수 있게 됐다. 이번 발표는 생성형 AI 시장에서 구글이 OpenAI와 미드저니(Midjourney) 같은 주요 경쟁자들과의 격차를 좁히려는 노력을 보여준다.

제미나이 2.0 플래시는 구글 딥마인드가 개발한 최신 AI 모델로, 텍스트, 코드, 이미지, 오디오, 비디오 등 다양한 형식의 콘텐츠를 이해하고 처리할 수 있는 멀티모달 기능을 갖추고 있다. 이번 네이티브 이미지 생성 기능 추가로 사용자들은 별도의 이미지 생성 도구 없이도 제미나이 모델 내에서 직접 이미지를 만들 수 있게 됐다.

Say hello to native image generation with Gemini 2.0 Flash Experimental 🎨

Try it now in @Google AI Studio → https://t.co/6ToDu4GSvj pic.twitter.com/yr3Mr21KkL
— Google DeepMind (@GoogleDeepMind) March 12, 2025

구글 AI 스튜디오는 개발자와 사용자들이 구글의 AI 기술을 쉽게 활용할 수 있도록 돕는 플랫폼이다. 이번 업데이트를 통해 사용자들은 구글 AI 스튜디오에서 제미나이 API를 활용해 5분 이내에 강력한 AI 기능을 자신의 애플리케이션에 통합할 수 있게 됐다. 구글 AI 스튜디오는 무료로 시작할 수 있으며, 사용량에 따라 지불하는 유연한 요금제를 제공한다. 또한 200만 토큰의 컨텍스트 윈도우, 컨텍스트 캐싱, 검색 기반 응답 등의 기능을 통해 더 깊은 이해와 정확한 응답을 제공한다.

구글 AI 스튜디오는 사용자들이 영감을 얻을 수 있도록 다양한 예시를 제공한다. 비디오 이해, 구조화된 출력, 코딩 등 다양한 분야에서 제미나이 모델의 활용 방법을 보여준다. 이러한 예시들은 사용자들이 자신의 프로젝트에 AI 기능을 어떻게 통합할 수 있는지 이해하는 데 도움을 준다. 이번 네이티브 이미지 생성 기능 추가는 제미나이 모델이 단순한 텍스트 생성을 넘어 다양한 형태의 콘텐츠를 생성할 수 있는 종합적인 AI 시스템으로 발전하고 있음을 보여준다. 구글의 이러한 움직임은 OpenAI의 DALL-E나 미드저니 같은 전문 이미지 생성 모델과의 경쟁에서 중요한 진전으로 평가받고 있다.

사용자들은 구글 AI 스튜디오를 통해 이 새로운 기능을 실험해볼 수 있으며, 개발자들은 제미나이 API를 통해 자신의 애플리케이션에 이미지 생성 기능을 통합할 수 있게 됐다. 이를 통해 콘텐츠 제작, 디자인, 마케팅 등 다양한 분야에서 AI 기반 이미지 생성의 활용이 더욱 확대될 것으로 전망된다.

해당 기능은 링크에서 확인할 수 있다.

이미지출처: 구글 딥마인드

기사는 클로드와 챗GPT를 활용해 작성되었습니다.