시각 언어 모델

Benchmarking Visual LLMs Resilience to Unanswerable Questions on Visually Rich Documents

“챗GPT도 속았다”… AI에게 ‘답 없는 질문’하자 60% 이상 틀려

11월 18, 2025

문서를 읽고 질문에 답하는 AI가 크게 발전했지만, 정작 “이 질문은 답할 수 없다”는 사실을 알아채는 능력은 형편없는 것으로 드러났다. 이탈리아 토리노 공대 연구팀이 GPT-4를…

어도비, 핀터레스트와 개인화 AI 스타일 분석 ‘스타일 리딩’ 체험 선보여

6월 20, 2025

어도비(Adobe)가 19일(현지 시간) 자사 블로그에 발표한 내용에 따르면, 어도비와 핀터레스트(Pinterest)가 칸 라이언스 국제 창의성 축제에서 AI 기술을 활용한 독특한 몰입형 체험을 공동으로 선보였다. 참석자들은…

Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds

로봇에게 “왼쪽 물건 가져와”라고 하면 정말 이해할까? 로봇의 공간 인지 기술

6월 2, 2025

Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds “왼쪽 물건 가져와” 명령을 이해하는 로봇의 핵심 기술, VPT란? 이탈리아 기술연구소(Italian Institute of Technology)와…

BONGARD IN WONDERLAND: Visual Puzzles that Still Make AI Go Mad?

시각 언어 모델

“챗GPT도 속았다”… AI에게 ‘답 없는 질문’하자 60% 이상 틀려

어도비, 핀터레스트와 개인화 AI 스타일 분석 ‘스타일 리딩’ 체험 선보여

로봇에게 “왼쪽 물건 가져와”라고 하면 정말 이해할까? 로봇의 공간 인지 기술

최신 AI도 해결 못하는 시각 퍼즐의 비밀 – 본가드 문제로 본 AI의 한계

Trending

엑셀에 클로드 들어왔다… “복잡한 재무제표, 이제 AI한테…

앤트로픽, ‘클로드 팀’ 요금제 최대 20% 인하……

“AI 100명이 동시에 일한다”… 중국 AI 신기술…