Search

  • Home
  • 비전언어모델
Embodied AI Agents: Modeling the World

메타 AI, 인간처럼 보고 듣는 AI 로봇 공개……

7월 1, 2025

Embodied AI Agents: Modeling the World 메타 AI 연구소가 차세대 인공지능 기술 발전을 위해 수행한 대규모 연구 프로젝트에서,…

Are Vision-Language Models Ready for Dietary Assessment?

AI는 튀김과 구이를 구별할 수 있을까? AI 모델들의…

4월 11, 2025

Are Vision-Language Models Ready for Dietary Assessment? 비공개 소스 AI 모델, 식품 인식에서 90% 이상의 정확도 달성 인공지능(AI)…

큐웬, AI 비전-언어 모델 ‘Qwen2.5-VL-32B’ 출시… “주관적 경험과 수학적 추론에 최적화”

큐웬, AI 비전-언어 모델 ‘Qwen2.5-VL-32B’ 출시… “주관적 경험과…

3월 26, 2025

알리바바의 Qwen 팀은 24일(현지 시간) 자사 블로그를 통해 새로운 시각-언어 모델인 Qwen2.5-VL-32B-Instruct를 오픈소스로 공개했다. 이 모델은 기존 Qwen2.5-VL…

과기정통부, 공공 분야 AI 확산 가속화… 2025년 신규 과제 10개 선정

과기정통부, 공공 분야 AI 확산 가속화… 2025년 신규…

3월 19, 2025

과학기술정보통신부(장관 유상임, 이하 ‘과기정통부’)가 공공 분야에 인공지능(AI) 기술을 확산하기 위한 신규 사업을 본격 추진한다. 과기정통부는 18일(한국 시간), 10개…

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control

웹 데이터로 학습한 로봇 RT-2, ‘안경 쓴 사람에게…

2월 25, 2025

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control 웹 규모 데이터로 훈련된 비전-언어 모델, 로봇 제어에 혁신적…

"로봇아, 커피 한잔 만들어줘" ... 허깅페이스, 로봇에 말로 지시하는 파운데이션 모델 전격 공개

“로봇아, 커피 한잔 만들어줘” … 허깅페이스, 로봇에 말로…

2월 10, 2025

허깅페이스(Hugging Face)가 로봇을 자연어로 제어할 수 있는 비전-언어-액션 플로우 모델 ‘Pi0(파이제로)’를 오픈소스로 공개했다. 이는 로봇 제어 전문 기업…

[CES 2025]엔비디아, 영상도 보고 언어도 이해하는 '네모트론' 모델군 공개... AI 에이전트 시대 연다

[CES 2025]엔비디아, 영상도 보고 언어도 이해하는 ‘네모트론’ 모델군…

1월 7, 2025

엔비디아가 CES 2025 키노트를 통해 기업용 에이전트형 AI 개발을 위한 ‘라마 네모트론(Llama Nemotron)’ 대규모 언어 모델군을 공개했다. 이는…

비전언어모델 – AI 매터스 l AI Matters