Inference-Time Reward Hacking in Large Language Models ChatGPT와 같은 대형 언어모델이 더 나은 답변을 생성하기 위해 사용하는 학습…
인공지능(AI) 기술이 급속도로 발전하면서 생성형 AI 모델들이 쏟아져 나오고 있다. ChatGPT, DALL-E, Midjourney 등 다양한 생성형 AI가 주목받고…