딥시크(DeepSeek)가 자사의 오픈소스 주간 6일차를 맞아 놀라운 AI 추론 시스템 성능과 수익성을 공개했다. 딥시크는 1일(현지 시간) 자사 X를 통해, 최근 발표한 딥시크-V3/R1(DeepSeek-V3/R1) 추론 시스템이 H800 GPU 노드당 초당 73.7K/14.8K의 입력/출력 토큰을 처리할 수 있으며, 비용 대비 수익률이 545%에 달한다고 밝혔다.
딥시크의 발표에 따르면, 새로운 추론 시스템은 여러 혁신적인 기술을 통해 처리량과 지연 시간을 최적화했다. 크로스 노드 EP(EP-powered) 기반 배치 스케일링, 계산-통신 오버랩, 부하 분산 등을 통해 이전보다 훨씬 효율적인 AI 모델 운영이 가능해졌다. 특히 H800 GPU 노드당 초당 73.7K의 입력 토큰과 14.8K의 출력 토큰을 처리할 수 있는 성능은 현재 시장에서 매우 주목할 만한 수치다. 이는 딥시크가 자사 모델을 매우 효율적으로 운영하고 있음을 보여준다.
가장 눈에 띄는 부분은 딥시크가 공개한 545%의 비용 대비 수익률이다. 이는 AI 서비스 운영에서 투입 비용 대비 5.45배의 수익을 올리고 있다는 의미로, 경쟁사들에 비해 훨씬 높은 수익성을 자랑한다. 이 발표는 SNS에서 큰 반응을 일으켰다.
딥시크는 이번 오픈소스 주간을 통해 자사의 기술과 인사이트를 커뮤니티와 공유하고 있다. “우리는 이번 주간의 인사이트가 커뮤니티에 가치를 제공하고 공동의 AGI(인공 일반 지능, Artificial General Intelligence) 목표에 기여하기를 바란다”고 딥시크는 밝혔다. 이번 딥시크의 발표는 AI 시장의 수익성과 효율성에 대한 새로운 기준을 제시하며, 경쟁사들에게도 큰 영향을 미칠 것으로 보인다. 전문가들은 이러한 높은 수익률이 향후 AI 서비스 가격 경쟁에도 영향을 줄 수 있을 것으로 예상하고 있다.
해당 발표는 링크에서 확인할 수 있다.
이미지 출처: 딥시크
기사는 클로드와 챗GPT를 활용해 작성되었습니다.
관련 콘텐츠 더보기