Home
딥시크 보상 모델
딥시크 보상 모델
AI 리포트와 논문
딥시크, AI 대화의 정확도를 32배 샘플링으로 끌어올리는 ‘보상…
4월 7, 2025
Inference-Time Scaling for Generalist Reward Modeling 대규모 언어 모델의 성능 향상을 위한 보상 모델링 강화학습 기술은 대규모 언어…
1
2
3
Trending
카카오, ‘AI 대중화’ 비전 담은 ‘if(kakao)25’ 컨퍼런스…
김은영 에디터
8월 28, 2025
앤트로픽, 美 국가안보 자문위원회 신설… 전직 상원의원·국방부…
김은영 에디터
8월 28, 2025
SK텔레콤, AI 기반 발달장애인 돌봄 서비스로 ICT어워드…
김은영 에디터
8월 28, 2025
Previous
Next