Search

FlashMLA

딥시크, 호퍼 GPU용 고효율 'FlashMLA' 공개…변수 길이 시퀀스 최적화

딥시크, 호퍼 GPU용 고효율 ‘FlashMLA’ 공개…변수 길이 시퀀스 최적화

2월 26, 2025

딥시크(DeepSeek)가 24일(현지 시간) 오픈소스 주간 첫날을 맞아 호퍼 GPU에 최적화된 효율적인 MLA 디코딩 커널 ‘FlashMLA’를 공개했다. 이 기술은 변수 길이 시퀀스를 처리하기 위해 최적화되었으며…

FlashMLA – AI 매터스