Search

  • Home
  • 모델일반화능력

모델일반화능력

Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling

구글 딥마인드, LLM 홍수 속 sLLM모델 우수성 증명

9월 3, 2024

구글 딥마인드(Google DeepMind), UCLA, 그리고 밀라(Mila) 연구소의 연구진은 동일한 컴퓨팅 예산 내에서 대규모 언어 모델 대신 소형 모델을…

모델일반화능력 – AI 매터스 l AI Matters