Search

멀티모달 AI

네이버, 하이퍼클로바X 신모델 공개… 저비용 고성능 ‘온 서비스 AI’로 새 시대 연다

네이버, 하이퍼클로바X 신모델 공개… 저비용 고성능 ‘온 서비스 AI’로 새 시대 연다

2월 21, 2025

네이버(NAVER)가 자사 뉴스룸을 통해 기존 모델 대비 40% 수준의 크기로 더 강력한 성능을 구현한 하이퍼클로바X(HyperCLOVA X) 신모델을 20일(한국 시간) 공개했다. 신모델은 대표적인 AI 성능…

글로벌 초거대 AI 모델 현황 분석(2024년 조사)

AI, 미국·중국·한국 3강 구도 뚜렷… 글로벌 초거대 AI 모델 현황 분석 보고서

2월 17, 2025

글로벌 초거대 AI 모델 현황 분석(2024년 조사) 5년간 271개 출시된 초거대 AI, 연평균 성장률 179.5% 기록 소프트웨어정책연구소가 발간한 ‘글로벌 초거대 AI 모델 현황 분석’…

바이두, 올해 하반기 차세대 AI 모델 '어니5' 출시 예고... 딥시크 뛰어넘을까

바이두, 올해 하반기 차세대 AI 모델 ‘어니5’ 출시 예고… 딥시크 뛰어넘을까

2월 13, 2025

중국의 대표적인 기술기업 바이두(Baidu)가 2025년 하반기에 차세대 인공지능 모델을 출시할 예정이다. 로이터가 12일(현지 시간) 보도한 내용에 따르면 바이두의 새로운 AI 모델인 ‘어니5(Ernie 5)’는 텍스트,…

구글과 신경전? 딥시크, API 요금 5배 인상... AI 가격 경쟁 '후끈'

구글과 신경전? 딥시크, API 요금 5배 인상… AI 가격 경쟁 ‘후끈’

2월 10, 2025

중국의 인공지능 스타트업 딥시크(DeepSeek)가 자사 API 요금을 대폭 인상했다. 8일 오후 4시(현지시간)부터 시행된 이번 가격 정책으로 기존 할인 혜택이 종료됐다. 딥시크는 자사 홈페이지를 통해…

바이트댄스, 한 개의 이미지로 자연스러운 영상 제작하는 ‘옴니휴먼-1’ 출시

바이트댄스, 한 개의 이미지로 자연스러운 영상 제작하는 ‘옴니휴먼-1’ 출시

2월 6, 2025

바이트댄스(ByteDance)에 따르면, 단일 이미지와 음성만으로 자연스러운 인간 영상을 생성할 수 있는 AI 모델 ‘옴니휴먼-1(OmniHuman-1)’을 개발했다. 옴니휴먼-1은 하나의 인물 이미지와 음성 또는 영상 신호만으로 고품질의…

딥시크 야누스 프로

중국 AI 기업 딥시크, 달리3·스테이블 디퓨전에 도전장… 차세대 이미지 생성 AI ‘야누스 프로’ 공개

1월 30, 2025

중국의 신흥 인공지능 기업 딥시크(DeepSeek)가 새로운 AI 이미지 생성 모델 ‘야누스 프로(Janus-Pro)’를 전격 공개했다. 이번 출시는 오픈AI(OpenAI)의 달리3(DALL-E 3)와 스테이블AI(StableAI)의 스테이블 디퓨전(Stable Diffusion) 등…

엔비디아, AI 리테일 쇼핑 어시스턴트에 대한 청사진 발표

엔비디아, AI 리테일 쇼핑 어시스턴트에 대한 청사진 발표

1월 13, 2025

엔비디아(NVIDIA)가 10일(현지시간) AI 기반 리테일 쇼핑 어시스턴트 개발을 위한 참조 워크플로인 ‘엔비디아 AI 쇼핑 어시스턴트 청사진(AI Blueprint for Retail Shopping Assistants)’을 발표했다. 해당 청사진은…

Gen-AI for User Safety: A Survey

피싱에서 딥페이크까지, 생성형 AI가 지키는 당신의 온라인 안전

11월 25, 2024

생성형 AI(Gen-AI)가 사용자 안전 보호의 새로운 패러다임을 제시하고 있다. 구글(Google) 연구진이 발표한 최신 연구에 따르면, 생성형 AI는 기존 머신러닝과 데이터 마이닝 기술이 가진 자연어…

State-of-the-Art Multimodal Generative AI Model Development with NVIDIA NeMo

NVIDIA, 차세대 멀티모달 AI 개발 플랫폼 ‘NeMo’ 대폭 강화

11월 12, 2024

생성형 AI가 텍스트 기반에서 멀티모달 기능으로 빠르게 진화하고 있다. 이제 AI는 이미지 캡셔닝과 시각적 질의응답 같은 작업을 수행할 수 있게 되었으며, 이는 더욱 인간다운…

Generative AI and Its Impact on Personalized Intelligent Tutoring Systems

생성형 AI로 진화하는 맞춤형 교육, 개인별 학습 경험 혁신 나선다

11월 8, 2024

지능형 튜터링 시스템(Intelligent Tutoring Systems, ITS)이 생성형 AI의 도입으로 새로운 전환점을 맞이했다. 특히 GPT-4와 같은 대규모 언어 모델(Large Language Models, LLMs)을 활용한 ITS는 학습자…

Soniox

오디오 AI의 혁신, 옴니오(Omnio) 등장… GPT-4 수준의 텍스트 처리 능력도 갖춰

10월 21, 2024

인공지능(AI) 기술 분야에 새로운 혁신이 등장했다. 인간처럼 오디오를 이해하고 추론할 수 있는 최초의 AI 모델 ‘옴니오(Omnio)’가 공개됐다. 옴니오는 대화와 인간 행동을 오디오를 통해 포괄적으로…

MEGA-BENCH : SCALING MULTIMODAL EVALUATION TO OVER 500 REAL-WORLD TASKS

MEGA-BENCH, AI 모델 평가의 새 지평을 열다

10월 16, 2024

일리노이 대학교 어바나-샴페인과 마이크로소프트 연구소가 공동 개발한 MEGA-BENCH가 AI 모델 평가 방식에 혁신을 가져올 것으로 기대를 모으고 있다. MEGA-BENCH는 500개 이상의 다양한 실제 작업을…

구글 제미나이(Google Gemini)

구글 제미나이(Google Gemini)

8월 23, 2024

Google Gemini는 Google AI에서 개발한 멀티모달 인공지능이며, 텍스트, 이미지, 오디오, 동영상 등 다양한 형식의 정보를 이해하고 처리할 수 있는 기능을 제공합니다. 텍스트 생성: 텍스트를 입력하면 AI가 자동으로 다양한 형식의 텍스트 콘텐츠를…

멀티모달 AI – 페이지 2 – AI 매터스