엔비디아(NVIDIA)가 자율주행차가 복잡한 도로 상황에서 사람처럼 판단하고 운전할 수 있는 세계 최초의 오픈소스 추론 모델을 공개했다. 엔비디아는 1일(현지시간) 세계 최대 AI 컨퍼런스인 뉴립스(NeurIPS)에서 ‘드라이브…
사람이 문제를 풀 때 과거 경험을 떠올려 더 나은 방법을 선택하듯, AI도 이제 경험을 통해 학습한다. AWS AI와 펜실베이니아대학교 연구진이 개발한 EGUR(Experience-Guided Reasoner)는 문제를…
중국 AI 기업 딥시크(DeepSeek)가 API 비용을 대폭 절감할 수 있는 새로운 실험 모델을 내놨다. 테크크런치(TechCrunch)가 29일(현지 시각) 보도한 내용에 따르면, 딥시크 연구진은 긴 맥락(long-context)…
기업용 생성형 AI 에이전트 플랫폼 기업 랭코드가 AI 오케스트레이션 플랫폼 기업 베슬AI와 전략적 파트너십을 체결했다고 19일(한국 시간) 발표했다. 이번 협약은 각 기업 환경에 최적화된…
구글과 미국 노스캐롤라이나 대학교 연구진이 스마트 안경의 가장 큰 문제인 배터리 부족을 해결할 새로운 기술을 만들었다. ‘에고트리거(EgoTrigger)’라는 이름의 이 기술은 사람이 손으로 물건을 만질…
PANGU ULTRA MOE: HOW TO TRAIN YOUR BIG MOE ON ASCEND NPUS 효율성 2배 향상, 화웨이의 7천억 파라미터 MoE 모델 어센드 NPU 최적화 도전기…
중국 스타트업 딥시크(DeepSeek)가 차세대 오픈소스 인공지능 모델 출시를 앞두고 소셜 미디어에서 뜨거운 관심을 받고 있다. 미중 기술 전쟁이 심화되는 가운데 이 회사는 자사의 기술…
앤트로픽(Anthropic)의 최신 주력 AI 모델인 클로드 3.7 소넷(Claude 3.7 Sonnet)이 10의 26승 FLOP 미만의 컴퓨팅 파워를 사용하여 “수천만 달러” 정도의 비용으로 학습됐다고 밝혀졌다. 테크크런치가…
딥시크가 촉발한 새로운 AI 경쟁 시대 딜로이트 인사이트의 2025년 2월 플래시 리포트에 따르면, 중국의 AI 스타트업 딥시크(DeepSeek)가 약 560만 달러(오픈AI 투자비용의 약 5.6%)라는 파격적인…
메타(Meta)가 대규모 언어 모델(Large Language Model, LLM)의 추론 속도를 획기적으로 개선할 수 있는 ‘LayerSkip’ 기술을 공개했다. 이 기술은 기존 LLM 대비 최대 2.16배 빠른…
대규모 언어 모델(LLM) 분야가 급속도로 발전하면서 파인튜닝 기술이 AI 응용의 핵심으로 부상하고 있다. 더블린 대학교 연구진이 발표한 최신 보고서는 LLM 파인튜닝의 전체 프로세스를 체계적으로…
AI 이미지 생성 기업 스태빌리티AI(Stability AI)가 자사의 최신 AI 모델 ‘스테이블 디퓨전 3.5(Stable Diffusion 3.5)’를 공개했다. 이번 버전은 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 즉시 다운로드가…