AI 모델 최적화

엔비디아, 세계 최초 오픈소스 추론 자율주행 모델 공개… “사람처럼 생각하는 자율차”

12월 2, 2025

엔비디아(NVIDIA)가 자율주행차가 복잡한 도로 상황에서 사람처럼 판단하고 운전할 수 있는 세계 최초의 오픈소스 추론 모델을 공개했다. 엔비디아는 1일(현지시간) 세계 최대 AI 컨퍼런스인 뉴립스(NeurIPS)에서 ‘드라이브…

AWS, 문제 풀 때마다 학습하는 AI 개발… 경험 쌓을수록 저렴하고 정확해

11월 21, 2025

사람이 문제를 풀 때 과거 경험을 떠올려 더 나은 방법을 선택하듯, AI도 이제 경험을 통해 학습한다. AWS AI와 펜실베이니아대학교 연구진이 개발한 EGUR(Experience-Guided Reasoner)는 문제를…

‘긴 글 작업 시 API 비용 50% 절감’… 딥시크, ‘희소 어텐션’ 모델 공개

9월 30, 2025

중국 AI 기업 딥시크(DeepSeek)가 API 비용을 대폭 절감할 수 있는 새로운 실험 모델을 내놨다. 테크크런치(TechCrunch)가 29일(현지 시각) 보도한 내용에 따르면, 딥시크 연구진은 긴 맥락(long-context)…

“범용 AI로는 한계”… 랭코드-베슬AI, 산업 특화·버티컬 AI 에이전트 개발 위한 파트너십 체결

8월 20, 2025

기업용 생성형 AI 에이전트 플랫폼 기업 랭코드가 AI 오케스트레이션 플랫폼 기업 베슬AI와 전략적 파트너십을 체결했다고 19일(한국 시간) 발표했다. 이번 협약은 각 기업 환경에 최적화된…

EgoTrigger: Toward Audio-Driven Image Capture for Human Memory Enhancement in All-Day Energy-Efficient Smart Glasses

“서랍 여는 소리로 카메라 ON”… 전력 54% 아끼는 구글의 스마트 안경 기술 공개

8월 11, 2025

구글과 미국 노스캐롤라이나 대학교 연구진이 스마트 안경의 가장 큰 문제인 배터리 부족을 해결할 새로운 기술을 만들었다. ‘에고트리거(EgoTrigger)’라는 이름의 이 기술은 사람이 손으로 물건을 만질…

PANGU ULTRA MOE: HOW TO TRAIN YOUR BIG MOE ON ASCEND NPUS

AI도 ‘분업’이 효율적… 화웨이가 만든 ‘여러 전문가 AI’ 성능 58% 향상

5월 14, 2025

PANGU ULTRA MOE: HOW TO TRAIN YOUR BIG MOE ON ASCEND NPUS 효율성 2배 향상, 화웨이의 7천억 파라미터 MoE 모델 어센드 NPU 최적화 도전기…

中 AI 스타트업 딥시크, 차세대 R2 모델 출시 임박… SNS서 관심 폭증

4월 29, 2025

중국 스타트업 딥시크(DeepSeek)가 차세대 오픈소스 인공지능 모델 출시를 앞두고 소셜 미디어에서 뜨거운 관심을 받고 있다. 미중 기술 전쟁이 심화되는 가운데 이 회사는 자사의 기술…

앤트로픽의 클로드 3.7 소넷, 예상보다 훨씬 적은 비용으로 학습됐다

2월 26, 2025

앤트로픽(Anthropic)의 최신 주력 AI 모델인 클로드 3.7 소넷(Claude 3.7 Sonnet)이 10의 26승 FLOP 미만의 컴퓨팅 파워를 사용하여 “수천만 달러” 정도의 비용으로 학습됐다고 밝혀졌다. 테크크런치가…

개발 비용 670조원 vs 80억원… 中 딥시크의 등장이 바꾸는 글로벌 AI 산업 지형도

2월 5, 2025

딥시크가 촉발한 새로운 AI 경쟁 시대 딜로이트 인사이트의 2025년 2월 플래시 리포트에 따르면, 중국의 AI 스타트업 딥시크(DeepSeek)가 약 560만 달러(오픈AI 투자비용의 약 5.6%)라는 파격적인…

LayerSkip: Enabling Early Exit Inference and Self-Speculative Decoding

메타, LLM 추론 속도 혁신하는 ‘LayerSkip’ 기술 공개…최대 2.16배 성능 향상

10월 28, 2024

메타(Meta)가 대규모 언어 모델(Large Language Model, LLM)의 추론 속도를 획기적으로 개선할 수 있는 ‘LayerSkip’ 기술을 공개했다. 이 기술은 기존 LLM 대비 최대 2.16배 빠른…

The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities

AI 혁신을 이끄는 7단계 파인튜닝 전략

10월 25, 2024

대규모 언어 모델(LLM) 분야가 급속도로 발전하면서 파인튜닝 기술이 AI 응용의 핵심으로 부상하고 있다. 더블린 대학교 연구진이 발표한 최신 보고서는 LLM 파인튜닝의 전체 프로세스를 체계적으로…

스태빌리티AI, 차세대 이미지 생성 모델 ‘스테이블 디퓨전 3.5’ 공개…”사용자 맞춤형 AI 시대 개막”

10월 25, 2024

AI 이미지 생성 기업 스태빌리티AI(Stability AI)가 자사의 최신 AI 모델 ‘스테이블 디퓨전 3.5(Stable Diffusion 3.5)’를 공개했다. 이번 버전은 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 즉시 다운로드가…