멀티모달AI

아마존·테슬라가 주목한 ‘피지컬 AI’… NIA가 분석한 글로벌 동향 및 한국 대응 전략

10월 29, 2025

디지털 세계를 넘어 물리적 현실과 직접 상호작용하는 피지컬 AI(Physical AI)가 차세대 산업 혁신의 핵심 기술로 부상하고 있다. 한국지능정보사회진흥원(NIA)이 발표한 리포트에 따르면, 피지컬 AI는 센서를…

"Humor, Art, or Misinformation?": A Multimodal Dataset for Intent-Aware Synthetic Image Detection

AI 잡는 AI로 생성 이미지 진짜 정체 밝힌다? 예술, 유머, 가짜뉴스는 구분 가능해져

8월 29, 2025

생성형 AI 기술이 급속도로 발전하면서 누구나 손쉽게 사실적인 이미지를 만들 수 있는 시대가 됐다. 어도비 파이어플라이(Adobe Firefly), 달리(DALL·E), 미드저니(Midjourney) 같은 도구들이 널리 보급되면서 기술적…

Has GPT-5 Achieved Spatial Intelligence? An Empirical Study

GPT-5, 공간 감각 테스트에서 사람과 겨뤄보니… “거리 측정은 사람보다 정확해”

8월 20, 2025

오픈AI(OpenAI)에서 내놓은 GPT-5가 ‘공간을 이해하는 능력’에서 놀라운 발전을 보였지만, 여전히 사람만큼은 못 한다는 연구 결과가 나왔다. 홍콩 인공지능 회사 센스타임 연구소에서 진행한 대규모 실험에…

‘K-AI’ 5개 정예팀 발표… LG·네이버·업스테이지·SKT·엔씨

8월 4, 2025

과학기술정보통신부(과기정통부)가 ‘독자 인공지능 기초 모형(AI 파운데이션 모델)’ 사업에 참여할 5개 정예팀을 최종 선정했다고 4일(한국 시간) 발표했다. 선정된 5개 팀은 ▲네이버클라우드 ▲업스테이지 ▲에스케이텔레콤(SK텔레콤) ▲엔씨에이아이(NCAI) ▲엘지경영개발원(LG경영개발원)…

국가대표 AI '독자 AI 파운데이션 모델' 사업 최종 선정 5개 팀 집중분석

독자 AI 파운데이션 모델’ 사업 최종 선정 5개 팀 집중분석 – 각팀 강점과 약점

8월 4, 2025

소버린 AI 실현 위한 ‘네이버클라우드·업스테이지·SK텔레콤·엔씨에이아이·LG경영개발원’ 세부 현황 총정리 2025년 8월 4일, 과학기술정보통신부(장관 배경훈, 이하 과기정통부)가 ‘독자 인공지능(AI) 기초 모형(파운데이션 모델)’ 사업에 참여할 5개 정예팀을…

InSight: AI Mobile Screening Tool for Multiple Eye Disease Detection using Multimodal Fusion

당뇨망막병증부터 녹내장까지, 사진 한 장으로 5가지 눈병 진단하는 AI 앱 등장

7월 21, 2025

전 세계 수억 명이 앓고 있는 눈병을 조기에 발견할 수 있는 혁신적인 AI 기술이 나왔다. 미국 캘리포니아 쿼리 레인 스쿨(Quarry Lane School)과 존스홉킨스대학교, 캘리포니아대학교…

[AI 매터스 뉴스레터 #92] 그게 왜 갤럭시 AI인가 싶지만 가장 뛰어난 AI 폰, 갤럭시 Z 폴드 7·플립 7

7월 14, 2025

안녕하세요, AI 매터스 입니다.AI 매터스는 생성형 AI 분야에서 수없이 쏟아져 나오는 소식 중에서 꼭 참고해야 할 내용을 엄선해 매일 기사를 발행하고 있습니다. 그 가운데 놓치지 말아야 할 중요한…

그게 왜 갤럭시 AI인가 싶지만 가장 뛰어난 AI 폰, 갤럭시 Z 폴드 7·플립 7

7월 11, 2025

갤럭시 Z 폴드 7과 플립 7이 삼성 언팩에서 공개됐다. 삼성은 지난 해부터 갤럭시가 ‘AI 폰’임을 끊임없이 강조해 왔다. 이번 발표 핵심도 여전히 AI였는데, 삼성은…

Pensieve Grader: An AI-Powered, Ready-to-Use Platform for Effortless Handwritten STEM Grading

AI로 조교들 쉬게 만든다… 손글씨도 채점하고 피드백도 주는 AI 채점 인기

7월 7, 2025

30만 학생 답안 채점한 AI 플랫폼, 20개 대학에서 실전 활용 펜시브(Pensieve)라는 이름의 AI 채점 플랫폼이 미국 대학가에서 조용한 혁명을 일으키고 있다. 이 시스템은 이미…

“웃음소리에서 슬픔을 읽어낸다” 감정 읽는 AI 공개… 40가지 미묘한 감정 구분

6월 30, 2025

DO THEY SEE WHAT WE SEE? Building Emotionally Intelligent AI with EmoNet 인공지능 연구 관련 비영리 단체 라이온(LAION)이 인텔(Intel)과의 협력을 통해 개발한 EmoNet은 AI가…

딜로이트 글로벌 금융서비스산업 트렌드 - 미래 금융의 축을 바꾸는 8가지 메가트렌드

“AI로 송금·EFT 설계” 딜로이트가 분석한 금융 AI 트렌드 5가지

6월 24, 2025

딜로이트 글로벌 금융서비스산업 트렌드 – 미래 금융의 축을 바꾸는 8가지 메가트렌드 딜로이트가 공개한 보고서에 따르면, 인공지능(AI)과 토큰화(tokenization)가 글로벌 금융산업에 구조적인 변화를 일으키고 있다. 특히…

Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts

“감정은 이해·촉각과 후각은 이해 못해” LLM의 감각에 대한 연구 결과 공개

6월 16, 2025

Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts GPT-4와 제미나이(Gemini) 같은 거대언어모델(LLM)들이 감각-운동 경험 없이도 감정이나 추상적 개념에서는…

내 캐릭터로 애니메이션 제작 가능… 캐릭터AI, 씬·아바타FX·스트림 등 멀티모달 창작 기능 공개

6월 4, 2025

캐릭터AI(Character.AI)가 창작자들의 창의적 잠재력을 끌어내는 새로운 기능 모음을 공개했다고 2일(현지 시간) 자사 블로그를 통해 발표했다. 캐릭터AI는 특정 페이소스를 갖고 있는 캐릭터들과 대화할 수 있는…

일레븐랩스, 차세대 대화형 AI 2.0 출시… 기업용 음성 에이전트 시장 공략

6월 4, 2025

일레븐랩스(ElevenLabs)가 대화형 AI 2.0(Conversational AI 2.0)을 출시했다고 지난달 30일(현지 시간) 발표했다. 이번 새로운 플랫폼은 기존 버전 출시 5개월 만에 선보이는 것으로, 세계에서 가장 정교하고…

What's Next After ChatGPT? Tesla and Google's Physical AI War

“챗GPT 다음은 ㅇㅇㅇㅇㅇ” 테슬라·구글이 뛰어든 ‘움직이는 AI’ 전쟁… 5년새 시장 350% 폭증

5월 26, 2025

피지컬 AI의 현황과 시사점 생성형 AI를 넘어선 차세대 AI 혁명, 글로벌 시장 350% 급성장 SPRi가 발표한 리포트에 따르면, 피지컬 AI(Physical AI)가 차세대 AI 기술…

[MS 빌드 2025] 오픈AI CEO “AI 코딩 에이전트는 프로그래밍 역사상 가장 큰 변화”

5월 20, 2025

마이크로소프트 빌드 2025 컨퍼런스에서 오픈AI(OpenAI)의 CEO 샘 알트만(Sam Altman)이 가상으로 참여해 AI 코딩 에이전트가 소프트웨어 개발 방식을 혁신적으로 변화시키고 있다고 강조했다. 사티아 나델라(Satya Nadella)…

OpenVision : A Fully-Open, Cost-Effective Family of Advanced Vision Encoders for Multimodal Learning

구글과 오픈AI 넘어선 오픈소스 AI 비전 기술 ‘OpenVision’ 등장

5월 19, 2025

OpenVision : A Fully-Open, Cost-Effective Family of Advanced Vision Encoders for Multimodal Learning 독점에서 개방으로: OpenVision, 25종 이상의 완전 공개형 비전 인코더로 멀티모달 AI…