AI정확도

WEB-SHEPHERD: Advancing PRMs for Reinforcing Web Agents

웹사이트 사람처럼 탐색하는 ‘똑똑한 로봇’ 등장… 연세대가 개발한…

6월 5, 2025

WEB-SHEPHERD: Advancing PRMs for Reinforcing Web Agents GPT-4o 대비 30점 높은 정확도, 10배 저렴한 비용 효율성 실현 연세대학교와…

Good answers are not necessarily factual answers: an analysis of hallucination in leading LLMs

AI에게 ‘간략히 설명해줘’라고 말하면 오답률 20% 증가… 충격적…

5월 12, 2025

Good answers are not necessarily factual answers: an analysis of hallucination in leading LLMs 배포된 AI 애플리케이션 사고의…

Fact-checking with Generative AI: A Systematic Cross-Topic Examination of LLMs Capacity to Detect Veracity of Political Information

코로나19에선 정확, 경제는 취약? 5대 AI 모델의 팩트체킹…

3월 14, 2025

Fact-checking with Generative AI: A Systematic Cross-Topic Examination of LLMs Capacity to Detect Veracity of Political Information LLM,…

라이너, 국내 최초 ‘딥 리서치’ 기능 출시… 하루 10회까지 무료 사용

라이너, 국내 최초 ‘딥 리서치’ 기능 출시… 하루…

3월 7, 2025

지디넷 코리아가 6일(한국 시간) 발표한 내용에 따르면, 국내 AI 기업 라이너가 기존 AI 검색 서비스의 한계를 뛰어넘는 ‘딥…

AI 챗봇, 고난도 역사 문제는 여전히 '백지'... 정확도 46% 그쳐

AI 챗봇, 고난도 역사 문제는 여전히 ‘백지’… 정확도…

1월 21, 2025

테크크런치가 19일(현지 시간)에 보도한 내용에 따르면, 대형언어모델(LLM)이 코딩이나 팟캐스트 제작 같은 특정 작업에서는 뛰어난 성과를 보이지만, 고급 수준의…

AI정확도 – AI 매터스 l AI Matters