Search

멀티모달AI

구글, ‘제미나이 2.5 Pro’ API 요금 공개... 개발자 접근성 확대한다

구글, ‘제미나이 2.5 Pro’ API 요금 공개… 개발자…

4월 7, 2025

구글(Google)이 4일(현지 시간) 자사의 최신 AI 모델인 제미나이 2.5 Pro(Gemini 2.5 Pro)를 공개 프리뷰 버전으로 출시했다. 이로써 더…

오픈AI, 챗GPT-5 출시 연기… 대신 o3와 o4-미니 모델 몇 주 내 출시

오픈AI, 챗GPT-5 출시 연기… 대신 o3와 o4-미니 모델…

4월 7, 2025

오픈AI 최고경영자 샘 알트만(Sam Altman)이 4일(현지 시간) 자사 X를 통해, 자사의 대규모 언어 모델 출시 계획을 변경했다고 발표했다.…

아마존, AI 에이전트 '노바 액트' 출시... “가격 대비 성능 업계 최고 수준”

아마존, AI 에이전트 ‘노바 액트’ 출시… “가격 대비…

4월 2, 2025

아마존(Amazon)이 1일(현지 시간) 자사 웹사이트를 통해 새로운 기반 모델(foundation models) 시리즈인 ‘노바(Nova)’를 공개했다. 최첨단 지능과 업계 최고 수준의…

마누스AI, 클로드 3.7 전면 도입하며 모바일 앱 등 대규모 업데이트 발표

마누스AI, 모바일 앱 출시 등 대규모 업데이트 발표……

4월 2, 2025

마누스AI(ManusAI)가 클로즈드 베타 출시 3주 만에 주요 업데이트를 발표했다. 이번 업데이트에는 모바일 앱 출시와 클로드 3.7(Claude 3.7) 기반…

Evaluating Multimodal Language Models as Visual Assistants for Visually Impaired Users

AI는 점자를 읽을 수 있을까? 시각장애인을 위한 언어…

4월 1, 2025

Evaluating Multimodal Language Models as Visual Assistants for Visually Impaired Users 87%가 원하는 AI 시각 도우미: 부정확성이 가장…

한국형 AI 전략의 갈림길에 선 네이버와 카카오

한국형 AI 전략의 갈림길에 선 네이버와 카카오

3월 27, 2025

2025년 3월 26일, 국내 대표 IT 기업 네이버와 카카오가 각각 주주총회를 열었습니다. 네이버가 이번 주총을 통해 AI 전략을…

큐웬, AI 비전-언어 모델 ‘Qwen2.5-VL-32B’ 출시… “주관적 경험과 수학적 추론에 최적화”

큐웬, AI 비전-언어 모델 ‘Qwen2.5-VL-32B’ 출시… “주관적 경험과…

3월 26, 2025

알리바바의 Qwen 팀은 24일(현지 시간) 자사 블로그를 통해 새로운 시각-언어 모델인 Qwen2.5-VL-32B-Instruct를 오픈소스로 공개했다. 이 모델은 기존 Qwen2.5-VL…

네이버, 검색·숏텐츠·플레이스·쇼핑까지 서비스 전반에 'AI 브리핑' 도입

네이버, 검색·숏텐츠·플레이스·쇼핑까지 서비스 전반에 ‘AI 브리핑’ 도입

3월 25, 2025

네이버(NAVER)가 생성형 AI 기술을 적용한 ‘AI 브리핑’을 3월 27일부터 모든 사용자에게 제공한다. 별도 가입 절차 없이 네이버 검색창을…

LLMs can see and hear without any training

AI, 이제 훈련 없이도 사진과 영상을 이해한다? 메타의…

3월 18, 2025

LLMs can see and hear without any training 대형 언어 모델(LLM), 훈련 없이 시각·청각 능력 발휘 메타 AI와…

구글 딥마인드, 제미나이 2.0 플래시에 네이티브 이미지 생성 기능 탑재

구글 딥마인드, 제미나이 2.0 플래시에 네이티브 이미지 생성…

3월 13, 2025

구글 딥마인드(Google DeepMind)가 13일(현지 시간) 자사 X에 발표한 내용에 따르면, 구글 딥마인드가 제미나이 2.0 플래시(Gemini 2.0 Flash) 모델에…

멀티모달AI – 페이지 4 – AI 매터스