멀티모달 AI

2025 AI 혁명: 스타트업이 주목해야 할 게임체인저

3월 11, 2025

Future of AI: Perspectives for Startups 2025 구글 클라우드(Google Cloud)는 최신 리포트 ‘Future of AI: Perspectives for Startups 2025’를 통해 AI 혁신의 최전선에 있는…

Can Large Language Models Grasp Concepts in Visual Content? A Case Study on YouTube Shorts about Depression

AI한테 우울증 관련 유튜브 숏츠 분석 시켰더니… 인간과 다른 시선 드러나

3월 10, 2025

Can Large Language Models Grasp Concepts in Visual Content? A Case Study on YouTube Shorts about Depression 725개 키프레임 분석 결과: AI도 영상 속…

Magma: A Foundation Model for Multimodal AI Agents

디지털-현실 모두 지배하는 AI ‘마그마’ 등장… UI 탐색부터 로봇 조작까지 한 번에

2월 25, 2025

Magma: A Foundation Model for Multimodal AI Agents 디지털과 물리 환경 모두 지배하는 AI 에이전트, 성공률 70%까지 기록 마이크로소프트 리서치 연구팀이 발표한 논문에 따르면,…

구글, 비디오 AI '비오 2' 요금제 공개..."영상 1분에 43000원, 한시간에 258만원"

구글, 비디오 AI ‘비오 2’ 요금제 공개…”영상 1분에 4만3천원, 한시간에 258만원”

2월 25, 2025

구글 클라우드(Google Cloud)가 생성형 AI 서비스 ‘버텍스 AI(Vertex AI)’의 최신 요금제를 공개했다. 특히 고품질 비디오 생성 모델인 ‘비오 2(Veo 2)’의 가격은 초당 0.5달러로 책정됐다.…

네이버, 하이퍼클로바X 신모델 공개… 저비용 고성능 ‘온 서비스 AI’로 새 시대 연다

2월 21, 2025

네이버(NAVER)가 자사 뉴스룸을 통해 기존 모델 대비 40% 수준의 크기로 더 강력한 성능을 구현한 하이퍼클로바X(HyperCLOVA X) 신모델을 20일(한국 시간) 공개했다. 신모델은 대표적인 AI 성능…

AI, 미국·중국·한국 3강 구도 뚜렷… 글로벌 초거대 AI 모델 현황 분석 보고서

2월 17, 2025

글로벌 초거대 AI 모델 현황 분석(2024년 조사) 5년간 271개 출시된 초거대 AI, 연평균 성장률 179.5% 기록 소프트웨어정책연구소가 발간한 ‘글로벌 초거대 AI 모델 현황 분석’…

바이두, 올해 하반기 차세대 AI 모델 ‘어니5’ 출시 예고… 딥시크 뛰어넘을까

2월 13, 2025

중국의 대표적인 기술기업 바이두(Baidu)가 2025년 하반기에 차세대 인공지능 모델을 출시할 예정이다. 로이터가 12일(현지 시간) 보도한 내용에 따르면 바이두의 새로운 AI 모델인 ‘어니5(Ernie 5)’는 텍스트,…

구글과 신경전? 딥시크, API 요금 5배 인상… AI 가격 경쟁 ‘후끈’

2월 10, 2025

중국의 인공지능 스타트업 딥시크(DeepSeek)가 자사 API 요금을 대폭 인상했다. 8일 오후 4시(현지시간)부터 시행된 이번 가격 정책으로 기존 할인 혜택이 종료됐다. 딥시크는 자사 홈페이지를 통해…

바이트댄스, 한 개의 이미지로 자연스러운 영상 제작하는 ‘옴니휴먼-1’ 출시

2월 6, 2025

바이트댄스(ByteDance)에 따르면, 단일 이미지와 음성만으로 자연스러운 인간 영상을 생성할 수 있는 AI 모델 ‘옴니휴먼-1(OmniHuman-1)’을 개발했다. 옴니휴먼-1은 하나의 인물 이미지와 음성 또는 영상 신호만으로 고품질의…

중국 AI 기업 딥시크, 달리3·스테이블 디퓨전에 도전장… 차세대 이미지 생성 AI ‘야누스 프로’ 공개

1월 30, 2025

중국의 신흥 인공지능 기업 딥시크(DeepSeek)가 새로운 AI 이미지 생성 모델 ‘야누스 프로(Janus-Pro)’를 전격 공개했다. 이번 출시는 오픈AI(OpenAI)의 달리3(DALL-E 3)와 스테이블AI(StableAI)의 스테이블 디퓨전(Stable Diffusion) 등…