OpenVision : A Fully-Open, Cost-Effective Family of Advanced Vision Encoders for Multimodal Learning

구글과 오픈AI 넘어선 오픈소스 AI 비전 기술 ‘OpenVision’…

5월 19, 2025

OpenVision : A Fully-Open, Cost-Effective Family of Advanced Vision Encoders for Multimodal Learning 독점에서 개방으로: OpenVision, 25종 이상의…

BONGARD IN WONDERLAND: Visual Puzzles that Still Make AI Go Mad?

최신 AI도 해결 못하는 시각 퍼즐의 비밀 –…

10월 30, 2024

최근 OpenAI의 GPT-4o와 같은 시각-언어 모델(Vision-Language Models, VLMs)이 텍스트와 이미지를 함께 처리하는 능력에서 놀라운 발전을 보이고 있다. 이러한…

LLaVA – AI 매터스 l AI Matters