모델일반화능력 - AI매터스

모델일반화능력

Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling

구글 딥마인드, LLM 홍수 속 sLLM모델 우수성 증명

9월 3, 2024

구글 딥마인드(Google DeepMind), UCLA, 그리고 밀라(Mila) 연구소의 연구진은 동일한 컴퓨팅 예산 내에서 대규모 언어 모델 대신 소형 모델을 활용하여 더 많은 샘플을 생성하는 방식의…

1
2
3

Trending

놓치지 말아야 할 2026년 AI 관련 행사 총 정리!

놓치지 말아야 할 2026년 AI 관련 행사…

김은영 에디터 1월 7, 2026

일론 머스크 "올해 AGI 도달할 것… 현재 AI로 화이트칼라 절반 이상 대체 가능"

일론 머스크 “올해 AGI 도달할 것… 현재…

김은영 에디터 1월 8, 2026

일론 머스크 "의대 갈 필요 없어… 3년 안에 로봇이 최고 외과의 능가"

일론 머스크 “의대 갈 필요 없어… 3년…

김은영 에디터 1월 8, 2026

모델일반화능력 - AI매터스