• Home
  • 시각 언어 모델

시각 언어 모델

Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds

로봇에게 “왼쪽 물건 가져와”라고 하면 정말 이해할까? 로봇의…

6월 2, 2025

Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds “왼쪽 물건 가져와” 명령을 이해하는 로봇의 핵심 기술,…

BONGARD IN WONDERLAND: Visual Puzzles that Still Make AI Go Mad?

최신 AI도 해결 못하는 시각 퍼즐의 비밀 –…

10월 30, 2024

최근 OpenAI의 GPT-4o와 같은 시각-언어 모델(Vision-Language Models, VLMs)이 텍스트와 이미지를 함께 처리하는 능력에서 놀라운 발전을 보이고 있다. 이러한…

시각 언어 모델 – AI 매터스 l AI Matters