Home
보상모델
보상모델
AI 리포트와 논문
딥시크, AI 대화의 정확도를 32배 샘플링으로 끌어올리는 ‘보상…
4월 7, 2025
Inference-Time Scaling for Generalist Reward Modeling 대규모 언어 모델의 성능 향상을 위한 보상 모델링 강화학습 기술은 대규모 언어…
1
2
3
Trending
Naver Cloud Accelerates AI-Driven Workplace Transformation in…
공인희 편집인
7월 11, 2025
[Q&AI] 문체부 장관 자격 논란… 왜?
AI 매터스
7월 11, 2025
[리얼 캠페인 탐구] “천사 고지 받을 사람?”…
강명구 실장
7월 11, 2025
Previous
Next