Search

멀티모달 AI

Automated Hazard Detection in Construction Sites Using Large Language and Vision-Language Models

건설 현장 사망사고 20%가 ‘추락’… AI가 안전모 미착용까지 잡아낸다

11월 27, 2025

건설업은 전 세계적으로 가장 위험한 산업 중 하나로 꼽힌다. 미국 노동통계국에 따르면 2023년 전체 산업재해 사망의 약 5분의 1이 건설 현장에서 발생했으며, 그중 38.5%가…

Short-Window Sliding Learning for Real-Time Violence Detection via LLM-based Auto-Labeling

“AI가 CCTV 속 폭력 포착”… 제미나이가 ‘주먹 드는 순간’ 95% 정확도로 잡는다

11월 18, 2025

멀티모달 AI 영상 분석 솔루션 기업 PIA-SPACE가 구글의 인공지능 ‘제미나이’를 활용해 CCTV에서 폭력 상황을 실시간으로 찾아내는 기술을 개발했다. 해당 연구 논문에 따르면, 정확도는 95.25%에…

AI 모델끼리 '생각'을 직접 주고받는다… 텍스트 없이 소통하는 신기술 등장

AI 모델끼리 ‘생각’을 직접 주고받는다… 텍스트 없이 소통하는 신기술 등장

11월 5, 2025

인공지능 언어모델들이 서로 협력할 때 텍스트 메시지 대신 ‘생각’을 직접 교환하는 새로운 방법이 개발됐다. 중국 칭화대학교와 인피니전스 AI 연구팀은 여러 AI 모델이 함께 일할…

삼성 무한 '갤럭시 XR', 제미나이 AI로 음성·시선·제스처 제어…269만원에 출시

삼성 무한 ‘갤럭시 XR’, 제미나이 AI로 음성·시선·제스처 제어…269만원에 출시

10월 23, 2025

삼성전자가 22일 AI 기반 XR 헤드셋 ‘갤럭시 XR(Galaxy XR)’을 국내에 출시했다. 삼성전자에 따르면 이 제품은 삼성전자와 구글(Google), 퀄컴(Qualcomm)이 공동 개발한 ‘안드로이드 XR(Android XR)’ 플랫폼을…

AI for Service: Proactive Assistance with AI Glasses

“먼저 알아서 도와준다”는 AI 안경, 과연 축복일까 재앙일까

10월 20, 2025

상하이교통대 연구팀이 사용자가 요청하기 전에 먼저 필요를 파악해 서비스를 제공하는 AI 시스템 ‘알파서비스’를 공개했다. AI 안경만 쓰면 블랙잭 게임 조언부터 박물관 가이드, 쇼핑 추천까지…

Machine precision, human intuition: A new era in human-machine understanding

“AI가 당신의 스트레스까지 감지한다”… 인간 행동 패턴 분석하는 HMU 기술 주목

9월 22, 2025

글로벌 컨설팅 회사 캡제미니(Capgemini)가 발표한 리포트에 따르면, 인공지능 기술이 단순한 작업 수행을 넘어 인간의 감정과 맥락을 이해하는 새로운 단계로 진입하고 있다. 이른바 ‘인간-기계 이해(Human-Machine…

AI 투자왕 봤더니 1위는 ‘엘라드 길’… 퍼플렉시티·코그니션 등 36곳 투자

AI 투자왕 봤더니 1위는 ‘엘라드 길’… 퍼플렉시티·코그니션 등 36곳 투자

9월 9, 2025

AI 시장이 급성장하면서 조기 투자로 큰 수익을 올릴 것으로 예상되는 엔젤 투자자들의 순위가 공개됐다. 비즈니스 분석 플랫폼 CB 인사이트(CB Insights)가 지난달 22일(현지 시간) 발표한…

엔비디아, 488만원짜리 로봇용 AI 컴퓨팅 플랫폼 '젯슨 토르' 판매 시작

엔비디아, 488만원짜리 로봇용 AI 컴퓨팅 플랫폼 ‘젯슨 토르’ 판매 시작

8월 27, 2025

엔비디아(NVIDIA)가 로봇공학과 물리적 AI 분야를 겨냥한 새로운 컴퓨팅 플랫폼 젯슨 토르(Jetson Thor)를 출시했다고 25일(현지 시간) 발표했다. 블랙웰(Blackwell) 아키텍처 기반의 이 제품은 2,070 FP4 테라플롭스…

‘빛 바랜 문화재 고퀄리티로 재현한다’… 국가유산청, 한국형 '창작 AI' 개발 본격화

‘빛 바랜 문화재 고퀄리티로 재현한다’… 국가유산청, 한국형 ‘창작 AI’ 개발 본격화

8월 19, 2025

국가유산청이 한국의 문화유산을 기반으로 한 ‘멀티모달 인공지능’ 개발에 나선다고 14일(한국 시간) 발표했다. 이번 사업은 ‘2025년 민간클라우드 기반 AI·데이터레이크 활용지원 사업’에 선정된 것으로, 국가유산청·국가유산진흥원·모티프테크놀로지스가 컨소시엄을…

요즘 대세 AI는 ‘그록’… 생성형 AI 웹사이트 성장률 1위 등극

요즘 대세 AI는 ‘그록’… 생성형 AI 웹사이트 성장률 1위 등극

8월 12, 2025

생성형 AI 시장에서 새로운 강자가 등장했다. 일론 머스크(Elon Musk)의 xAI가 개발한 AI 챗봇 그록(Grok)이 7월 주요 생성형 AI 웹사이트 중 가장 높은 월간 성장률을…

NASA-구글, 화성 우주비행사용 AI 의료 도우미 공동 개발

NASA-구글, 화성 우주비행사용 AI 의료 도우미 공동 개발

8월 11, 2025

나사(NASA)와 구글(Google)이 화성 탐사 임무를 수행하는 우주비행사들의 건강을 지키기 위한 인공지능 의료 도우미를 공동 개발하고 있다고 테크크런치(TechCrunch)가 8일(현지 시간) 보도했다. 인간의 우주 탐사 임무가…

핀터레스트 CEO “AI 쇼핑, 비서까지는 가능하지만, 대리 구매는 멀었다”

핀터레스트 CEO “AI 쇼핑 비서 가능하지만, 대리 AI 구매는 아직 멀었다”

8월 11, 2025

핀터레스트(Pinterest) CEO 빌 레디(Bill Ready)가 AI 에이전트가 사용자를 대신해 쇼핑하는 에이전틱 웹(agentic web) 시대는 아직 먼 미래의 일이라고 밝혔다. 테크크런치(TechCrunch)가 8일(현지 시간) 보도한 내용에…

가트너 “2025년 AI 기술 중 최고 성장세는 AI 에이전트와 AI 레디 데이터”

가트너 “2025년 AI 기술 중 최고 성장세는 AI 에이전트와 AI 레디 데이터”

8월 8, 2025

글로벌 IT 리서치 기업 가트너(Gartner)가 5일(현지 시간) 발표한 2025년 인공지능 하이프 사이클에 따르면, AI 에이전트(AI Agents)와 AI 레디 데이터(AI-ready Data)가 올해 가장 빠르게 발전하는…

애플, 이미지 처리 속도 85배 향상한 AI 모델 'FastVLM' 공개

애플, 이미지 처리 속도 85배 향상 AI 모델 ‘FastVLM’ 공개…아이폰 17 탑재되나

8월 6, 2025

애플이 이미지와 텍스트를 함께 이해하는 새로운 AI 모델 ‘FastVLM’을 공개했다. 이 모델은 기존 AI보다 3.2배 빠르게 이미지를 분석하고 답변을 생성할 수 있으면서도 정확도는 그대로…

LG, 기업용 AI 챗봇 '챗엑사원' 베타 서비스 공개... 런던증권거래소와 AI 투자보고서 협력

LG, 기업용 AI 챗봇 ‘챗엑사원’ 베타 공개… 런던증권거래소와 AI 투자보고서 협력

7월 23, 2025

LG그룹이 자체 개발한 인공지능 챗봇 ‘챗엑사원(ChatExaone)’을 외부 사용자에게 공개하며 B2B AI 시장 진출을 본격화했다. 국내 4대 그룹 중 하나인 LG그룹의 AI 싱크탱크인 LG AI연구원은…

머스크 “그록4, 내년에는 새로운 물리학 발견할 것”… 코딩 전용 모델도 곧 공개

머스크 “그록4, 내년에는 새로운 물리학 발견할 것”… 코딩 전용 모델도 곧 공개

7월 10, 2025

일론 머스크(Elon Musk)의 인공지능 기업 xAI가 9일(현지 시간) 라이브스트림을 통해 차세대 AI 모델 그록-4(Grok-4)와 그록-4 헤비(Grok-4 Heavy)를 공개했다. 이번 발표에서 가장 주목받은 것은 그록-4가…

[갤럭시 언팩 2025] 삼성전자, '멀티모달 AI' 탑재 신제품 공개

[갤럭시 언팩 2025] 삼성, ‘멀티모달 AI’ 탑재 갤럭시 폴드 7·플립 7 공개… 내가 보는 그대로를 폰이 이해한다

7월 10, 2025

삼성전자가 10일(한국 시간) 자사 뉴스룸을 통해 7월 9일 뉴욕 브루클린에서 열린 ‘갤럭시 언팩 2025’에서 진화된 AI 기술을 탑재한 차세대 갤럭시 제품군을 공개했다. 노태문 삼성전자…

가트너 "5년 내 기업 소프트웨어 80%가 멀티모달 AI 탑재될 것"

가트너 “5년 내 기업 소프트웨어 80% 멀티모달 AI 탑재될 것”

7월 4, 2025

글로벌 IT 리서치 기업 가트너(Gartner)가 2일(현지 시간) 2030년까지 기업용 소프트웨어와 애플리케이션의 80%가 멀티모달 기능을 갖출 것이라고 예측했다. 이는 2024년 10% 미만에서 8배 이상 증가한…

“챗GPT, 공개 하루 전에 이름 지어”... 오픈AI, 챗GPT 개발 비하인드 공개

“챗GPT, 공개 하루 전 이름 지었다”… 오픈AI, 챗GPT 개발 비하인드 공개

7월 2, 2025

젊은 엔지니어들의 반전 드라마로 시작된 챗GPT의 성공 뒤에는 출시 직전까지도 내부 논란이 있었다. 오픈AI(OpenAI)가 1일(현지 시간) 공개한 팟캐스트에서 챗GPT 개발 과정의 생생한 뒷이야기가 공개됐다.…

캐릭터AI, 메타 전 부사장 카란디프 아난드 CEO로 선임… “올 여름 신기능 공개”

캐릭터AI, 메타 전 부사장 카란디프 아난드 CEO로 선임… “올 여름 신기능 공개”

6월 23, 2025

AI 대화형 플랫폼 캐릭터AI(Character.AI)가 카란딥 아난드(Karandeep Anand)를 신임 최고경영자(CEO)로 선임했다고 20일(현지 시간) 발표했다. 아난드는 지난 9개월간 캐릭터AI 이사회 고문으로 활동하며 제품 전략과 사용자 경험…

NAVER Ventures into Silicon Valley to Build Global AI Investment Ecosystem

네이버, 실리콘밸리 글로벌 AI 투자 생태계 구축, “미래에 투자한다”

6월 9, 2025

네이버가 AI 시대를 겨냥한 글로벌 투자 전략의 교두보로 실리콘밸리에 ‘네이버 벤처스(NAVER Ventures)’를 설립한다. 이번 투자법인 설립은 생성형 AI와 비디오 AI 등 차세대 AI 기술…

오픈AI, 이번주 GPT-4.1 출시 유력... 미니, 나노 버전 등 다양한 신규 모델 공개 예정

오픈AI, 이번주 GPT-4.1 출시 유력… 미니, 나노 버전 등 다양한 신규 모델 공개 예정

4월 14, 2025

오픈AI(OpenAI)가 다수의 새로운 AI 모델 공개를 준비 중이다. 회사 내부 정보에 정통한 소식통에 따르면, 이 신규 모델 중에는 ‘GPT-4.1’로 브랜딩될 것으로 예상되는 제품이 포함되어…

Tracking AI: Monitoring Artificial Intelligence

AI 모델 IQ 테스트 결과는? 구글 제미나이 2.5 프로, IQ 130으로 1등

4월 1, 2025

구글 제미나이 2.5 프로, IQ 130으로 AI 모델 중 최고 지능 입증 생성형 AI 기술이 빠르게 발전하면서 각 모델의 성능을 객관적으로 평가하는 지표의 중요성이…

오픈AI, 소라 신규 사용자 대상 영상 생성 기능 일시 중단

오픈AI, 소라 신규 사용자 대상 영상 생성 기능 일시 중단

4월 1, 2025

오픈AI(OpenAI)가 최근 출시한 이미지 생성 기능의 폭발적인 인기로 인해 서버 과부하 문제에 직면하면서, 자사의 젠 AI 미디어 도구인 ‘소라(Sora)’에서 일부 사용자에 대한 영상 생성…

구글, 모바일 어시스턴트를 제미나이로 전면 업그레이드

구글, 모바일 어시스턴트를 제미나이로 전면 업그레이드

3월 17, 2025

구글(Google)이 모바일 기기의 구글 어시스턴트(Google Assistant)를 제미나이(Gemini)로 전면 업그레이드한다고 발표했다. 인공지능 기술의 발전으로 사용자에게 더 강력하고 개인화된 도움을 제공하기 위한 전략적 변화다. 14일(현지 시간)…

바이두, 추론-멀티모달 2가지 AI 모델 출시… 딥시크 성능에 가격은 반

바이두, 추론-멀티모달 2가지 AI 모델 출시… 딥시크 성능에 가격은 반

3월 17, 2025

중국 인터넷 대기업 바이두(Baidu)가 치열한 AI 경쟁에서 두각을 나타내기 위해 두 가지 새로운 인공지능 모델을 출시했다. 특히 그중 하나는 추론에 중점을 둔 모델로, 중국…

2025 AI 혁명: 스타트업이 주목해야 할 게임체인저

2025 AI 혁명: 스타트업이 주목해야 할 게임체인저

3월 11, 2025

Future of AI: Perspectives for Startups 2025 구글 클라우드(Google Cloud)는 최신 리포트 ‘Future of AI: Perspectives for Startups 2025’를 통해 AI 혁신의 최전선에 있는…

Can Large Language Models Grasp Concepts in Visual Content? A Case Study on YouTube Shorts about Depression

AI한테 우울증 관련 유튜브 숏츠 분석 시켰더니… 인간과 다른 시선 드러나

3월 10, 2025

Can Large Language Models Grasp Concepts in Visual Content? A Case Study on YouTube Shorts about Depression 725개 키프레임 분석 결과: AI도 영상 속…

Magma: A Foundation Model for Multimodal AI Agents

디지털-현실 모두 지배하는 AI ‘마그마’ 등장… UI 탐색부터 로봇 조작까지 한 번에

2월 25, 2025

Magma: A Foundation Model for Multimodal AI Agents 디지털과 물리 환경 모두 지배하는 AI 에이전트, 성공률 70%까지 기록 마이크로소프트 리서치 연구팀이 발표한 논문에 따르면,…

구글, 비디오 AI '비오 2' 요금제 공개..."영상 1분에 43000원, 한시간에 258만원"

구글, 비디오 AI ‘비오 2’ 요금제 공개…”영상 1분에 4만3천원, 한시간에 258만원”

2월 25, 2025

구글 클라우드(Google Cloud)가 생성형 AI 서비스 ‘버텍스 AI(Vertex AI)’의 최신 요금제를 공개했다. 특히 고품질 비디오 생성 모델인 ‘비오 2(Veo 2)’의 가격은 초당 0.5달러로 책정됐다.…

멀티모달 AI – AI 매터스