딥시크(DeepSeek)가 24일(현지 시간) 오픈소스 주간 첫날을 맞아 호퍼 GPU에 최적화된 효율적인 MLA 디코딩 커널 ‘FlashMLA’를 공개했다. 이 기술은 변수 길이 시퀀스를 처리하기 위해 최적화되었으며…
애틀란틱 카운슬(Atlantic Council) 보도에 따르면 중국의 오픈소스 추론 대규모 언어모델(LLM) 개발사인 딥시크(DeepSeek)가 자사의 ‘딥시크-R1(DeepSeek-R1)’ 모델로 오픈AI(OpenAI)의 o1 모델과 대등한 성능을 입증했다. 특히 이 모델은…