Search

Qwen

Penalizing Transparency? How AI Disclosure and Author Demographics Shape Human and AI Judgments About Writing

글 쓸 때 “AI 도움 받았다”고 솔직하게 말하면 보는 사람은 낮은 점수를 준다?

7월 4, 2025

요즘 많은 사람들이 글을 쓸 때 AI 도구를 사용한다. 하지만 “AI 도움을 받았다”고 솔직하게 말하면 사람들이 그 글을 더 낮게 평가한다는 연구 결과가 나왔다.…

中, 수능 기간 동안 딥시크, 큐웬 등 AI 챗봇 기능 일시 중단한다… “부정행위 방지 목적”

中, 수능 기간 동안 딥시크, 큐웬 등 AI 챗봇 기능 일시 중단… “부정행위 방지 목적”

6월 11, 2025

NDTV가 10일(현지 시간) 보도한 내용에 따르면, 중국의 주요 AI 기업들이 대학 입학시험 기간 동안 학생들의 부정행위를 방지하기 위해 챗봇 기능을 일시적으로 중단했다. 6월 7일부터…

Don't Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning

메타, 기존 통념 뒤집는 연구 결과 공개… “추론 시간 짧으면 LLM 정확도 34.5% 향상”

6월 2, 2025

Don’t Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning 기존 통념을 뒤집는 발견: 짧은 추론이 34.5% 더 정확 복잡한 수학 문제를 해결하는…

Spurious Rewards: Rethinking Training Signals in RLVR

“정답 몰라도 괜찮다”… AI 강화학습의 상식을 뒤엎은 워싱턴대 연구

6월 2, 2025

Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습 분야에서 놀라운 연구 결과가 발표됐다. 워싱턴대학교와…

Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations

“대화가 정답이다”…의료 AI의 진단 정확도 9.64% 향상시킨 새로운 학습법

2월 3, 2025

Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations 워싱턴대학교와 노스캐롤라이나대학교 연구진의 논문에 따르면, 현재의 의료 AI 시스템들은 실제 임상 현장에서의 추론…

o1-프리뷰, 97점으로 수능 국어 1등급 달성... 한국어 언어모델 성능 평가 리더보드 공개

o1-프리뷰, 97점으로 수능 국어 1등급 달성… 한국어 언어모델 성능 평가 리더보드 공개

11월 22, 2024

인공지능 대형언어모델의 한국어 능력을 평가하는 ‘수능 국어 LLM 리더보드’가 공개됐다. 평가 결과 ‘o1-프리뷰’ 모델이 97점으로 1등급을 기록하며 주목받고 있다. 이번 리더보드는 한국교육과정평가원(KICE)이 개발한 최근…

Qwen – AI 매터스