보상최적화 - AI매터스

보상최적화

Inference-Time Reward Hacking in Large Language Models

AI ‘점수 조작’하는 순간 포착… 하버드 연구진이 밝힌 챗GPT 학습법 치명적 맹점

6월 30, 2025

Inference-Time Reward Hacking in Large Language Models ChatGPT와 같은 대형 언어모델이 더 나은 답변을 생성하기 위해 사용하는 학습 방법에 치명적인 결함이 있다는 연구 결과가…

Spurious Rewards: Rethinking Training Signals in RLVR

“정답 몰라도 괜찮다”… AI 강화학습의 상식을 뒤엎은 워싱턴대 연구

6월 2, 2025

Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습 분야에서 놀라운 연구 결과가 발표됐다. 워싱턴대학교와…

1
2
3

Trending

세상을 바꾸고 싶다…오픈클로 창업자, 오픈AI(OpenAI) 합류 선언

“세상을 바꾸고 싶다”…오픈클로 창업자, 오픈AI(OpenAI) 합류 선언

이종철 수석 에디터 2월 19, 2026

메타, 엔비디아와 손잡고 'AI 초강대국' 도약 선언…블랙웰·루빈 GPU 수백만 개 도입

메타, 엔비디아와 손잡고 ‘AI 초강대국’ 도약 선언…블랙웰·루빈…

이종철 수석 에디터 2월 19, 2026

앤트로픽 새 AI 모델 '클로드 소넷 4.6' 출시…오퍼스급 성능을 소넷 가격에

앤트로픽 새 AI 모델 ‘클로드 소넷 4.6’…

이종철 수석 에디터 2월 19, 2026

보상최적화 - AI매터스