중국 AI 연구소 딥시크(DeepSeek)가 새로운 추론 AI 모델 R1의 업데이트 버전이 이번 주 AI 커뮤니티의 주목을 받고 있지만, 이와 함께 ‘축소(distilled)’ 버전인 DeepSeek-R1-0528-Qwen3-8B도 출시했다.…
테크크런치가 28일(현지 시간) 보도한 내용에 따르면, 중국 스타트업 딥시크(DeepSeek)가 수요일 아침 위챗 메시지를 통해 발표한 R1 추론 AI 모델의 업데이트 버전을 개발자 플랫폼 허깅페이스(Hugging…
딥시크(DeepSeek)가 25일(현지 시간) 오픈소스 주간(#OpenSourceWeek) 둘째 날을 맞아 혼합 전문가(MoE, Mixture of Experts) 모델 훈련과 추론을 위한 최초의 오픈소스 EP 통신 라이브러리인 ‘DeepEP’를 공개했다.…