Search

FlashMLA

딥시크, 호퍼 GPU용 고효율 'FlashMLA' 공개…변수 길이 시퀀스 최적화

딥시크, 호퍼 GPU용 고효율 ‘FlashMLA’ 공개…변수 길이 시퀀스…

2월 26, 2025

딥시크(DeepSeek)가 24일(현지 시간) 오픈소스 주간 첫날을 맞아 호퍼 GPU에 최적화된 효율적인 MLA 디코딩 커널 ‘FlashMLA’를 공개했다. 이 기술은…

FlashMLA – AI 매터스 l AI Matters