컴퓨터가 사람과 함께 일하고 배우려면, 그 사람만의 독특한 방식을 이해해야 한다. 체스는 실력을 정확히 측정할 수 있고 오랫동안 AI 연구에 활용되어 온 분야로, 사람과…
The Hallucination Tax of Reinforcement Finetuning OpenAI o1처럼 똑똑해진 AI의 치명적 약점 발견 강화학습 파인튜닝(Reinforcement Finetuning, RFT)이 대형언어모델(LLM)의 수학 추론 능력을 크게 향상시키지만, 동시에…
Large Language Models Pass the Turing Test GPT-4.5, 73% 성공률로 실제 인간 참가자보다 더 인간답게 평가받아 캘리포니아 샌디에이고 대학(UC San Diego)의 연구팀이 최신 대규모…