프랑스 AI 스타트업 미스트랄(Mistral)이 이미지와 텍스트를 동시에 처리할 수 있는 첫 번째 모델을 출시했다.
미국 테크매체 테크크런치에 따르면 ‘픽스트랄 12B(Pixtral 12B)’라 명명된 이 모델은 120억 개의 매개변수를 가진 약 24GB 크기의 AI 모델이다. 매개변수는 모델의 문제 해결 능력과 대략적으로 일치하며, 일반적으로 매개변수가 많을수록 성능이 우수하다.
미스트랄의 텍스트 모델인 네모 12B(Nemo 12B)를 기반으로 구축된 이 새로운 모델은 URL이나 base64로 인코딩된 이미지를 통해 임의의 크기와 수량의 이미지에 대한 질문에 답할 수 있다. 앤트로픽(Anthropic)의 클로드(Claude) 계열이나 오픈AI(OpenAI)의 GPT-4와 같은 다른 멀티모달 모델처럼 픽스트랄 12B도 이미지 캡션 생성이나 사진 속 물체 수 세기 등의 작업을 수행할 수 있을 것으로 예상된다.
깃허브(GitHub)와 AI 및 기계학습 개발 플랫폼인 허깅 페이스(Hugging Face)에서 토렌트 링크를 통해 다운로드할 수 있는 픽스트랄 12B는 아파치 2.0 라이선스 하에 제한 없이 다운로드, 미세 조정 및 사용이 가능하다. 미스트랄 대변인은 이메일을 통해 픽스트랄 12B에 적용되는 라이선스를 확인했다.
미스트랄의 개발자 관계 책임자인 소피아 양(Sophia Yang)은 X(구 트위터)에서 픽스트랄 12B가 곧 미스트랄의 챗봇 플랫폼인 르 샤(Le Chat)와 API 서비스 플랫폼인 르 플라테폼(Le Plateforme)에서 테스트할 수 있게 될 것이라고 밝혔다.
미스트랄이 픽스트랄 12B 개발에 어떤 이미지 데이터를 사용했는지는 불분명하다.
미스트랄의 다른 모델을 포함한 대부분의 생성형 AI 모델은 웹에서 수집한 방대한 양의 공개 데이터로 학습되는데, 이 데이터 중 상당수가 저작권이 있는 것으로 알려져 있다. 일부 모델 개발사들은 ‘공정 사용’ 권리에 따라 모든 공개 데이터를 수집할 수 있다고 주장하지만, 많은 저작권 소유자들은 이에 동의하지 않으며 오픈AI와 미드저니(Midjourney) 같은 대형 개발사들을 상대로 소송을 제기해 이러한 관행을 중단시키려 하고 있다.
픽스트랄 12B의 출시는 미스트랄이 제너럴 카탈리스트(General Catalyst)가 주도한 6억 4500만 달러 규모의 투자 유치를 마무리한 직후에 이루어졌다. 설립 1년 남짓 된 미스트랄은 마이크로소프트(Microsoft)가 소수 지분을 보유하고 있으며, AI 커뮤니티에서 유럽의 오픈AI로 여겨지고 있다. 이 신생 기업의 전략은 지금까지 무료 ‘오픈’ 모델을 공개하고, 이들 모델의 관리 버전에 대해 요금을 부과하며, 기업 고객들에게 컨설팅 서비스를 제공하는 것이었다.
미스트랄의 12B모델에 대한 정보는 링크에서 확인할 수 있다.
관련 콘텐츠 더보기