2026년 3월, 알렉산드라 젤레닌(Alexandra Zelenin)과 알렉산드라 주라블리요바(Alexandra Zhuravlyova) 연구팀이 DoRA(Weight-Decomposed Low-Rank Adaptation) 파인튜닝 기법의 메모리 병목을 해결하는 시스템 최적화 기술을 공개했다.이 기술은 8~32B 규모의…
PANGU ULTRA MOE: HOW TO TRAIN YOUR BIG MOE ON ASCEND NPUS 효율성 2배 향상, 화웨이의 7천억 파라미터 MoE 모델 어센드 NPU 최적화 도전기…
메타(Meta)가 모바일 기기에서도 구동 가능한 경량화된 라마(Llama) 3.2 모델을 24일 공개했다. 양자화(Quantization) 기술을 적용해 기존 대비 메모리 사용량을 대폭 줄이고 처리 속도를 높인 것이…