s3: You Don’t Need That Much Data to Train a Search Agent via RL 단 2,400개 샘플로 17만…
오픈AI(OpenAI)가 10일(현지 시간) 자사 웹사이트를 통해 인공지능의 웹 검색 능력을 평가하는 새로운 벤치마크 ‘BrowseComp’를 오픈소스로 공개했다. 이 벤치마크는…