Search

메가트론-LM

Developing a 172B LLM with Strong Japanese Capabilities Using NVIDIA Megatron-LM

엔비디아, 일본 최대 규모 172B 언어모델 개발… “일본어 이해력 높인다”

11월 14, 2024

현재 상위권 언어모델들은 일본어를 포함한 비영어 언어에서 충분한 성능을 보여주지 못하고 있다. 대표적으로 GPT-3의 학습 데이터셋에서 일본어가 차지하는 비중은 0.11%에 불과하다. 일본 경제산업성(METI)은 자국의…

메가트론-LM - AI매터스