• Home
  • News
  • 구글, 이미지로 프롬프트를 생성하는 AI 도구 ‘위스크(Whisk)’ 공개

구글, 이미지로 프롬프트를 생성하는 AI 도구 ‘위스크(Whisk)’ 공개

구글, 이미지로 프롬프트를 생성하는 AI 도구 ‘위스크(Whisk)’ 공개
이미지출처: 구글 블로그

구글(Google)이 16일(현지시간) 미국에서 새로운 생성형 AI 실험 서비스 ‘위스크(Whisk)’를 공개했다. 위스크는 긴 텍스트 프롬프트 대신 이미지를 활용해 새로운 이미지를 생성하는 도구다.

구글 블로그에 따르면, 위스크는 피사체용 이미지, 배경용 이미지, 스타일용 이미지 등 총 3개의 이미지를 입력하면 이를 조합해 완전히 새로운 이미지를 만들어낸다. 사용자는 이를 통해 디지털 인형, 에나멜 핀, 스티커 등 다양한 형태의 창작물을 제작할 수 있다.

위스크의 핵심 기술은 구글의 최신 생성형 AI 모델인 제미나이(Gemini)와 이마젠3(Imagen 3)의 결합이다. 제미나이가 입력된 이미지를 자동으로 상세 설명으로 변환하면, 이마젠3가 이 설명을 바탕으로 새로운 이미지를 생성한다. 이 과정에서 원본 이미지를 그대로 복제하는 대신 핵심 특징만을 추출해 새로운 방식으로 재구성한다.


위스크는 이미지에서 몇 가지 주요 특징만을 추출하기 때문에, 생성된 이미지가 사용자의 기대와 다를 수 있다. 예를 들어, 생성된 피사체는 원본과 키, 체중, 헤어스타일, 피부톤 등이 다를 수 있다. 구글은 이러한 특징들이 사용자의 프로젝트에 중요할 수 있다는 점을 인지하고 있어, 사용자가 언제든지 기본 프롬프트를 확인하고 수정할 수 있도록 했다.

아티스트와 크리에이터들을 대상으로 한 초기 테스트에서 위스크는 전통적인 이미지 편집 도구가 아닌 새로운 형태의 창의적 도구로 평가받았다. 구글은 위스크가 픽셀 단위의 완벽한 편집이 아닌, 빠른 시각적 탐색을 위해 설계되었다고 설명했다. 사용자들은 수십 가지의 옵션을 탐색하고 마음에 드는 결과물을 다운로드할 수 있다.

위스크는 현재 미국 내에서만 이용 가능하며, labs.google/whisk에서 체험할 수 있다. 구글 랩스(Google Labs)는 제미나이, 이마젠, 베오(Veo) 등 최신 생성형 AI 모델을 실험하는 공간으로, 새로운 제품과 기능에 대한 사용자 피드백을 수집하고 있다.

위스크와 다른 실험들에 대한 최신 소식은 구글 랩스의 뉴스레터 구독과 X(구 트위터), 레딧(Reddit), 디스코드(Discord) 등의 소셜 미디어 채널을 통해 확인할 수 있다.

해당 기사의 원문은 구글 블로그에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




구글, 이미지로 프롬프트를 생성하는 AI 도구 ‘위스크(Whisk)’ 공개 – AI 매터스