WEB-SHEPHERD: Advancing PRMs for Reinforcing Web Agents GPT-4o 대비 30점 높은 정확도, 10배 저렴한 비용 효율성 실현 연세대학교와…
Good answers are not necessarily factual answers: an analysis of hallucination in leading LLMs 배포된 AI 애플리케이션 사고의…
Fact-checking with Generative AI: A Systematic Cross-Topic Examination of LLMs Capacity to Detect Veracity of Political Information LLM,…
지디넷 코리아가 6일(한국 시간) 발표한 내용에 따르면, 국내 AI 기업 라이너가 기존 AI 검색 서비스의 한계를 뛰어넘는 ‘딥…
테크크런치가 19일(현지 시간)에 보도한 내용에 따르면, 대형언어모델(LLM)이 코딩이나 팟캐스트 제작 같은 특정 작업에서는 뛰어난 성과를 보이지만, 고급 수준의…