• Home
  • News
  • 루마 AI, 이미지 생성 모델 ‘포톤’ 출시…캐릭터 재사용 기능 제공

루마 AI, 이미지 생성 모델 ‘포톤’ 출시…캐릭터 재사용 기능 제공

루마 AI, 이미지 생성 모델 '포톤' 출시…"경쟁 모델 대비 8배 더 빨라"
이미지출처: 루마AI

루마 AI가 새롭게 발표한 텍스트-이미지 생성기 ‘포톤(Photon)’이 디자이너와 크리에이터를 위한 혁신적인 기능을 제시하며 주목받고 있다. 루마 AI는 자사의 드림 머신(Dream Machine) 비디오 생성기를 기반으로 개발된 포톤이 “현존하는 유사 모델 중 가장 빠르고 저렴하다”고 주장했다.

루마의 포톤은 디자이너, 영화 제작자, 소규모 기업, 교육자를 포함해 다양한 창작자를 지원하도록 설계됐다. 패션부터 건축까지 폭넓은 분야에서 활용 가능하며, 사용자는 여러 장의 이미지를 동시에 생성하거나 텍스트와 이미지의 조합을 통해 정밀한 결과물을 얻을 수 있다. 특히 루마가 자체 개발한 유니버설 트랜스포머 아키텍처(Universal Transformer Architecture)를 통해 기존 모델보다 800% 더 빠르고 비용 효율적이라는 점이 특징이다.

포톤은 사용자 입력에 따라 이미지를 실시간으로 조정하거나 커스터마이징할 수 있는 기능도 제공한다. 또한, 사용자가 사진을 업로드해 특정 인물의 특징을 바탕으로 재사용 가능한 캐릭터를 만들 수 있는 기능이 추가됐다. 이 캐릭터는 다양한 이미지 시나리오에서 활용 가능해 광고 캠페인 기획 등에서 큰 도움이 될 것으로 기대된다.

루마는 “포톤은 각 사용자의 고유한 창작 DNA를 반영하고, 이들의 스타일과 히스토리를 기반으로 학습해 발전한다”며 창작 과정에서 협력자로서의 역할을 강조했다.

루마는 2024년 말까지 확장 가능한 포톤 API를 출시할 계획이라고 밝혔다. 이를 통해 개발자는 텍스트-이미지 및 이미지-이미지 콘텐츠를 제작할 수 있게 된다. 또, 드림 머신의 웹 및 iOS 인터페이스도 새롭게 업데이트됐다. 자연어 기반 인터페이스를 적용해 사용자는 복잡한 프롬프트 기술 없이도 손쉽게 디자인 아이디어를 탐색하거나 협업할 수 있다.

포톤은 데모 중 일부 자세나 표정 렌더링에서 부자연스러운 결과를 보이며 기술적 한계를 드러냈다. 이는 딥페이크와 같은 잠재적 악용 가능성에 대한 우려를 낳았다. 루마는 생성 이미지에 대해 콘텐츠 조정 정책을 마련해 부적절한 콘텐츠는 삭제한다고 밝혔다.

그러나 훈련 데이터셋에 대한 질문에는 구체적인 답변을 피했다. 루마의 CEO 아밋 제인(Amit Jain)은 “인터넷에서 크롤링된 데이터나 라이선스 콘텐츠 포함 여부를 공개할 수 없다”고 밝혔다. 회사는 사용자의 입력 및 출력 데이터를 모델 훈련에 사용하지 않는다고 덧붙였다.

저작권 문제와 관련해 루마는 사용자가 “저작권 또는 상표권을 침해하는 콘텐츠를 요청하거나 생성하지 말아야 한다”며 지적 재산권을 존중할 것을 요청했지만, 세부적인 가이드라인은 다소 모호하다.

포톤은 무료 및 유료 구독 모델로 제공되며, 유료 서비스는 월 $10부터 시작한다. 새롭게 개선된 드림 머신 인터페이스는 프롬프트에서 핵심 키워드를 추출해 유사 옵션을 제안하는 드롭다운 메뉴를 제공, 사용자가 아이디어를 확장하거나 다양한 변형을 탐색할 수 있도록 지원한다.

루마 AI의 최신 이미지 생성 서비스는 창작자들에게 강력한 도구를 제공하며 AI 기술의 새로운 가능성을 열었다. 그러나 기술적 한계와 윤리적 문제는 여전히 해결해야 할 과제로 남아 있다.

해당 기사의 원문은 지디넷에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




루마 AI, 이미지 생성 모델 ‘포톤’ 출시…캐릭터 재사용 기능 제공 – AI 매터스