Search

수학적추론

Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters

AI 모델의 추론 단계 최적화로 모델 크기 확장보다 더 나은 성능 달성 가능

10월 23, 2024

대규모 언어 모델(Large Language Model, LLM)의 성능을 향상시키기 위해 지금까지는 주로 모델의 크기를 키우는 방식이 사용되어 왔다. GPT-4나 PaLM과 같은 거대 언어 모델들은 수천억…

수학적추론 – AI 매터스