Search

엔비디아, AI 기반 동영상 검색·요약 서비스 ‘AI 블루프린트’ 공개

엔비디아
이미지출처: 엔비디아 블로그

엔비디아가 생성형 AI 기술을 활용한 동영상 검색 및 요약 서비스 ‘AI 블루프린트(AI Blueprint)’를 공개했다. 엔비디아(NVIDIA) 블로그에 따르면, 이 서비스는 시각 언어 모델(VLM)과 대규모 언어 모델(LLM)을 결합해 장시간 동영상을 자동으로 이해하고 분석하는 기능을 제공한다.

엔비디아의 AI 블루프린트는 NIM(NVIDIA NIM) 마이크로서비스를 기반으로 구축됐다. NIM은 업계 표준 API와 도메인별 코드, 최적화된 추론 엔진을 포함하는 마이크로서비스 세트로 구성됐다. 이 서비스는 REST API를 통해 동영상 요약 생성과 대화형 질의응답, 실시간 스트리밍 영상에서 특정 이벤트를 감지하고 알림을 제공하는 기능을 제공한다.

AI 블루프린트는 기존 동영상 분석 도구의 한계를 극복하기 위해 최신 AI 기술들을 통합했다. 주요 기술로는 문맥 인식 검색 증강 생성(CA-RAG)과 그래프 기반 검색 증강 생성(Graph-RAG)이 있다. 시스템은 긴 동영상을 작은 단위로 나누어 분석한 후, 이를 다시 통합해 전체적인 맥락을 파악한다. 이 과정에서 엔비디아의 텐서RT(Tensor RT) 기반 비주얼 인코더 모델이 사용된다.

엔비디아 측에 따르면, AI 블루프린트는 공장과 창고의 운영 모니터링, 리테일 매장 분석, 공항 보안 감시, 교통 상황 모니터링 등 다양한 산업 현장에서 활용될 수 있다. 현재 이 서비스는 조기 접근 프로그램을 통해 제공되고 있으며, 기술 지원은 비주얼 AI 에이전트 포럼을 통해 이루어진다.

해당 기사에 대한 자세한 내용은 링크에서 확인할 수 있다.




엔비디아, AI 기반 동영상 검색·요약 서비스 ‘AI 블루프린트’ 공개 – AI 매터스 l AI Matters