The Biased Samaritan: LLM biases in Perceived Kindness 대형 언어모델(Large Language Models, LLMs)이 다양한 분야에서 널리 활용되면서, 이들 모델이 가진 편향성에 대한 우려가 커지고…
Enter: Graduated Realism: A Pedagogical Framework for AI-Powered Avatars in Virtual Reality Teacher Training 가상현실(VR) 기반 교사 훈련 시뮬레이터가 교육계의 주목을 받고 있다. 초기…
LLM 유해성 공격 전략에 대한 실증적 분석 오픈AI의 챗GPT와 앤트로픽의 클로드 등 대규모 언어 모델(Large Language Models, LLMs)의 활용이 급격히 확대되면서, 이들 모델의 안전성에…
Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts GPT-4와 제미나이(Gemini) 같은 거대언어모델(LLM)들이 감각-운동 경험 없이도 감정이나 추상적 개념에서는…
Simulacrum of Stories: Examining Large Language Models as Qualitative Research Participants 카네기 멜론 대학교(Carnegie Mellon University) 연구진이 발표한 연구 논문에 따르면, 대형언어모델(LLM)을 인간 참여자…
Generative AI in education: Educator and expert views 영국 교사 42%, 4월 17%에서 7개월 만에 2.5배 급증 영국 교육부(Department for Education)와 오픈 이노베이션 팀(Open…
The Hallucination Tax of Reinforcement Finetuning OpenAI o1처럼 똑똑해진 AI의 치명적 약점 발견 강화학습 파인튜닝(Reinforcement Finetuning, RFT)이 대형언어모델(LLM)의 수학 추론 능력을 크게 향상시키지만, 동시에…
Efficiency and Quality of Generative AI–Assisted Radiograph Reporting 23,960건 분석해 29초 단축 효과 입증… 실제 병원서 첫 검증 노스웨스턴 의대 연구팀이 생성형 인공지능(Generative AI)…
Windows – spring/summer 2025 생성형 AI, 도서관 서비스의 새로운 전환점으로 부상 노스캐롤라이나대학교(University of North Carolina at Chapel Hill)에서 발간한 매거진에 따르면, 대학의 도서관이 생성형…
AI in the Screen Sector: Perspectives and Paths Forward 영국의 대표적인 영화 및 텔레비전 관련 문화 자선 기관인 BFI(British Film Institute)이 공개한 리포트에 따르면,영국의…
The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity 최신 AI 추론 모델들, 복잡한 문제에서…
Artificial Intelligence and the Labor Market 미국의 대표적인 비영리 민간 경제 연구기관인 전미경제연구소(National Bureau of Economic Research, NBER)가 인공지능(AI) 기술의 발전이 노동시장에 미치는 영향을…
AI 학습데이터 저작권 관련 각국 정책 동향 및 시사점 영국 정부가 인공지능(AI) 학습데이터의 저작권 문제 해결을 위해 대규모 공공협의를 진행했다. 2024년 12월부터 2025년 2월까지…
Understanding Gender Bias in AI-Generated Product Descriptions “사이즈4는 대부분에게 완벽” – 의류 설명 14%에서 발견된 체형 배제 언어 대형 언어 모델(LLM)이 이커머스 분야에서 상품…
“We need to avail ourselves of GenAI to enhance knowledge distribution”: Empowering Older Adults through GenAI Literacy 2050년까지 15억 명 시대, 노인층 AI 사기…
Human Authenticity and Flourishing in an AI-Driven World: Edmund’s Journey and the Call for Mindfulness AI가 만든 가짜 현실 속에서 살아가는 인간들 독일의 독립…
Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diffusion Model 시간은 조금 더 걸리지만 비디오 품질은 확실히 좋아진다…
Introducing the OECD AI Capability Indicators 5년 연구 끝에 탄생한 AI 능력 평가의 글로벌 표준 경제협력개발기구(OECD)가 인공지능(AI) 능력을 체계적으로 측정할 수 있는 종합 프레임워크를…
QWENLONG-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning 기존 AI 모델들이 긴 문서에서 겪던 학습 효율성 저하와 불안정성 문제 알리바바 통이랩(Tongyi Lab)이 강화학습을…
Don’t Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning 기존 통념을 뒤집는 발견: 짧은 추론이 34.5% 더 정확 복잡한 수학 문제를 해결하는…
Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습 분야에서 놀라운 연구 결과가 발표됐다. 워싱턴대학교와…
Emergent social conventions and collective bias in LLM populations 4가지 AI 모델, 15라운드 만에 전체 집단이 하나의 관습에 합의 대화형 AI 에이전트 집단이 명시적인…
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds “왼쪽 물건 가져와” 명령을 이해하는 로봇의 핵심 기술, VPT란? 이탈리아 기술연구소(Italian Institute of Technology)와…
Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models 오픈AI o1·딥시크 R1도 겪는 ‘아하!’ 순간의 예측 불가능성 문제 세일즈 포스 AI 연구소 및…
Kaleidoscope Gallery: Exploring Ethics and Generative AI Through Art 덕 윤리는 남성 전용? DALL-E 3가 드러낸 성별·지역 편향 생성형 AI가 복잡한 철학적 개념을 어떻게…
Improving LLM First-Token Predictions in Multiple-Choice Question Answering via Prefilling Attack 구글 AI가 34%→72% 성능 급상승한 비밀, ‘프리필링’ 기법의 정체 이탈리아와 미국 대학 및…
Sufficient Context: A New Lens on Retrieval Augmented Generation Systems 표준 데이터셋의 55.4%가 불완전한 정보: ‘충분한 맥락’ 개념으로 드러난 AI 한계 검색 증강 생성(RAG)…
Social Sycophancy: A Broader Understanding of LLM Sycophancy AI 모델들이 사용자에게 과도한 동조를 보이는 ‘사회적 아첨행동’ 발견 스탠포드 대학교 연구팀이 개발한 연구에 따르면, 대형언어모델(LLM)들이…
The Achilles’ Heel of AI: Fundamentals of Risk-Aware Training Datafor High-Consequence Models 방어·재난대응 AI 모델, 기존 데이터 라벨링 방식으론 한계 드러나 전통적인 AI 훈련…
AI vs. Human Judgment of Content Moderation:LLM-as-a-Judge and Ethics-Based Response Refusals GPT-4o와 라마 모델, 윤리적 거부 응답에 32%포인트 높은 점수 대규모 언어 모델(LLM)이 다른…