Search

강화학습 AI

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

AI의 자기계발 시대? 사람이 제공한 데이터 없이 코딩과 수학 마스터한 추론 모델의 등장

5월 13, 2025

Absolute Zero: Reinforced Self-play Reasoning with Zero Data 스스로 문제 내고 푸는 AI: 인간 데이터 의존성 탈피한 새로운 추론 모델 대규모 언어 모델(LLM)의 추론…

강화학습 AI – AI 매터스