딥시크, 단일 GPU에서 구동 가능한 축소 버전 R1 AI 모델 공개

중국 AI 연구소 딥시크(DeepSeek)가 새로운 추론 AI 모델 R1의 업데이트 버전이 이번 주 AI 커뮤니티의 주목을 받고 있지만, 이와 함께 ‘축소(distilled)’ 버전인 DeepSeek-R1-0528-Qwen3-8B도 출시했다. 테크크런치가 29일(현지 시간) 보도한 내용에 따르면, 딥시크는 이 소형 모델이 특정 벤치마크에서 비슷한 크기의 다른 모델들을 능가한다고 주장했다.

알리바바(Alibaba)가 5월에 출시한 Qwen3-8B 모델을 기반으로 구축된 이 소형 R1 업데이트 버전은 까다로운 수학 문제 모음인 AIME 2025에서 구글(Google)의 제미나이(Gemini) 2.5 플래시보다 더 우수한 성능을 보였다. DeepSeek-R1-0528-Qwen3-8B는 또한 다른 수학 능력 테스트인 HMMT에서 최근 마이크로소프트(Microsoft)가 출시한 Phi 4 추론 플러스 모델과 거의 동등한 성능을 보여주고 있다.

DeepSeek-R1-0528-Qwen3-8B와 같은 축소 모델은 일반적으로 원본 모델보다 성능이 낮지만, 계산 요구량이 훨씬 적다는 장점이 있다. 클라우드 플랫폼 NodeShift에 따르면, Qwen3-8B는 40GB-80GB RAM을 갖춘 GPU(예: 엔비디아 H100)에서 실행이 가능하다. 반면 전체 크기의 새로운 R1은 약 12개의 80GB GPU가 필요하다.

딥시크는 업데이트된 R1이 생성한 텍스트를 가져와 Qwen3-8B를 미세 조정하는 방식으로 DeepSeek-R1-0528-Qwen3-8B를 훈련시켰다. AI 개발 플랫폼 허깅페이스(Hugging Face)의 전용 웹페이지에서 딥시크는 DeepSeek-R1-0528-Qwen3-8B를 “추론 모델에 관한 학술 연구와 소규모 모델에 중점을 둔 산업 개발 모두를 위한 것”이라고 설명했다.

DeepSeek-R1-0528-Qwen3-8B는 제한 없이 상업적 이용이 가능한 MIT 라이선스로 제공된다. LM Studio를 포함한 여러 호스트가 이미 API를 통해 이 모델을 제공하고 있다.

해당 기사의 원문은 링크에서 확인 가능하다.

딥시크, 단일 GPU에서 구동 가능한 축소 버전 R1 AI 모델 공개

챗GPT 이후 달라진 세계 질서… AI 거버넌스 전쟁에서 한국의 승부수는?

[Q&AI] 2025 롤드컵 개막… AI가 예측한 ‘T1 vs IG’ 경기 결과는?

CEO 99% “에이전틱 AI 준비 완료”… 인터넷보다 큰 변화 온다

공무원 10명 중 7명은 AI 사용하는데… 행정 문서 91%는 AI가 읽지 못하는 포맷

유아이패스, 엔비디아 손잡고 민감 업무에 AI 에이전트 투입

Highlight

오픈AI, ‘소라2’ 프롬프트 가이드 공개…영화 촬영 감독처럼 지시하라

오픈AI, 에이전트 개발 올인원 툴킷 ‘에이전트킷’ 출시… “몇 달 걸린 작업…

오픈AI, 스타게이트·엔비디아·AMD 이어 추가 대형 계약 예고

[AI 매터스 뉴스레터 #127] 연휴 동안 놓친 AI 관련 소식 Top…

구글 제미나이 3.0, 이달 22일 공개 임박?… 내부 문서 유출