컴퓨터가 사람과 함께 일하고 배우려면, 그 사람만의 독특한 방식을 이해해야 한다. 체스는 실력을 정확히 측정할 수 있고 오랫동안…
The Hallucination Tax of Reinforcement Finetuning OpenAI o1처럼 똑똑해진 AI의 치명적 약점 발견 강화학습 파인튜닝(Reinforcement Finetuning, RFT)이 대형언어모델(LLM)의…
Large Language Models Pass the Turing Test GPT-4.5, 73% 성공률로 실제 인간 참가자보다 더 인간답게 평가받아 캘리포니아 샌디에이고…