Search

  • Home
  • 시각 언어 모델

시각 언어 모델

Benchmarking Visual LLMs Resilience to Unanswerable Questions on Visually Rich Documents

“챗GPT도 속았다”… AI에게 ‘답 없는 질문’하자 60% 이상 틀려

11월 18, 2025

문서를 읽고 질문에 답하는 AI가 크게 발전했지만, 정작 “이 질문은 답할 수 없다”는 사실을 알아채는 능력은 형편없는 것으로 드러났다. 이탈리아 토리노 공대 연구팀이 GPT-4를…

어도비, 핀터레스트와 AI 기반 '스타일 리딩' 체험 선보여

어도비, 핀터레스트와 개인화 AI 스타일 분석 ‘스타일 리딩’ 체험 선보여

6월 20, 2025

어도비(Adobe)가 19일(현지 시간) 자사 블로그에 발표한 내용에 따르면, 어도비와 핀터레스트(Pinterest)가 칸 라이언스 국제 창의성 축제에서 AI 기술을 활용한 독특한 몰입형 체험을 공동으로 선보였다.  참석자들은…

Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds

로봇에게 “왼쪽 물건 가져와”라고 하면 정말 이해할까? 로봇의 공간 인지 기술

6월 2, 2025

Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds “왼쪽 물건 가져와” 명령을 이해하는 로봇의 핵심 기술, VPT란? 이탈리아 기술연구소(Italian Institute of Technology)와…

BONGARD IN WONDERLAND: Visual Puzzles that Still Make AI Go Mad?

최신 AI도 해결 못하는 시각 퍼즐의 비밀 – 본가드 문제로 본 AI의 한계

10월 30, 2024

최근 OpenAI의 GPT-4o와 같은 시각-언어 모델(Vision-Language Models, VLMs)이 텍스트와 이미지를 함께 처리하는 능력에서 놀라운 발전을 보이고 있다. 이러한 모델들은 이미지 설명, 객체 인식, 시각적…

시각 언어 모델 – AI 매터스