PANGU ULTRA MOE: HOW TO TRAIN YOUR BIG MOE ON ASCEND NPUS 효율성 2배 향상, 화웨이의 7천억 파라미터…
메타(Meta)가 모바일 기기에서도 구동 가능한 경량화된 라마(Llama) 3.2 모델을 24일 공개했다. 양자화(Quantization) 기술을 적용해 기존 대비 메모리 사용량을…