• Home
  • AI Report 언어 모델 연구

AI Report 언어 모델 연구

Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

‘번뜩’ 하는 순간에 의존하던 AI, 드디어 체계적으로 생각하는…

5월 30, 2025

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models 오픈AI o1·딥시크 R1도 겪는 ‘아하!’ 순간의 예측 불가능성…

Kaleidoscope Gallery: Exploring Ethics and Generative AI Through Art

“AI가 그린 정의의 저울은 한쪽으로 기울었다” 달리-3의 윤리…

5월 29, 2025

Kaleidoscope Gallery: Exploring Ethics and Generative AI Through Art 덕 윤리는 남성 전용? DALL-E 3가 드러낸 성별·지역 편향…

Improving LLM First-Token Predictions in Multiple-Choice Question Answering via Prefilling Attack

“한 문장만 추가했는데 정답률이 40% 올랐다?” AI 모델의…

5월 29, 2025

Improving LLM First-Token Predictions in Multiple-Choice Question Answering via Prefilling Attack 구글 AI가 34%→72% 성능 급상승한 비밀, ‘프리필링’…

Sufficient Context: A New Lens on Retrieval Augmented Generation Systems

“챗GPT도 속는다” AI가 정확한 정보를 줘도 14% 확률로…

5월 27, 2025

Sufficient Context: A New Lens on Retrieval Augmented Generation Systems 표준 데이터셋의 55.4%가 불완전한 정보: ‘충분한 맥락’ 개념으로…

Social Sycophancy: A Broader Understanding of LLM Sycophancy

챗GPT는 왜 내 편만 들까? 스탠포드 연구진이 밝힌…

5월 27, 2025

Social Sycophancy: A Broader Understanding of LLM Sycophancy AI 모델들이 사용자에게 과도한 동조를 보이는 ‘사회적 아첨행동’ 발견 스탠포드…

The Achilles' Heel of AI: Fundamentals of Risk-Aware Training Data for High-Consequence Models

국방·재난 AI가 실패하는 이유, 데이터 훈련 방식의 근본적…

5월 26, 2025

The Achilles’ Heel of AI: Fundamentals of Risk-Aware Training Datafor High-Consequence Models 방어·재난대응 AI 모델, 기존 데이터 라벨링…

AI vs. Human Judgment of Content Moderation: LLM-as-a-Judge and Ethics-Based Response Refusals

AI가 AI를 평가하면 생기는 일? ‘도움 드릴 수…

5월 23, 2025

AI vs. Human Judgment of Content Moderation:LLM-as-a-Judge and Ethics-Based Response Refusals GPT-4o와 라마 모델, 윤리적 거부 응답에 32%포인트…

"Alexa, can you forget me?" Machine Unlearning Benchmark in Spoken Language Understanding

“알렉사, 나를 잊어줘” 음성 AI가 개인정보를 선택적으로 삭제하는…

5월 23, 2025

“Alexa, can you forget me?” Machine Unlearning Benchmark in Spoken Language Understanding 음성 데이터 삭제가 시급한 이유: 개인…

Activating AI Safety Level 3 Protections

“AI가 생화학 무기 제조 도울 수도” 앤트로픽, 클로드…

5월 23, 2025

Activating AI Safety Level 3 Protections 범용 탈옥 공격 차단을 위한 실시간 분류기 가드 시스템 도입 앤트로픽(Anthropic)이 AI…

A framework for considering the use of generative AI for health

스탠포드 의료AI·디지털헬스 전문가 54명이 밝힌 의료용 AI의 치명적…

5월 22, 2025

A framework for considering the use of generative AI for health 스탠포드 대학 54명 전문가가 제시한 의료용 AI…

AI Report 언어 모델 연구 – AI 매터스 l AI Matters