Search

  • Home
  • AI Report 언어 모델 연구
Can LLMs subtract numbers?

AI, ‘덧셈’보다 ‘뺄셈’에서 훨씬 자주 틀린다?… “음수 앞에…

11월 6, 2025

챗GPT 같은 AI가 덧셈 문제는 거의 완벽하게 풀지만, 뺄셈 특히 답이 음수로 나오는 계산에서는 이상한 실수를 반복한다는 연구…

One ruler to measure them all: Benchmarking multilingual long-context language models

“폴란드어 1위, 영어 6위, 한국어 22위”… AI 언어…

11월 6, 2025

메릴랜드 대학교와 UMass Amherst 연구진이 26개 언어로 대형 언어 모델의 긴 맥락 처리 능력을 평가한 원룰러(OneRuler) 벤치마크를 공개했다.…

AI 모델끼리 '생각'을 직접 주고받는다… 텍스트 없이 소통하는 신기술 등장

AI 모델끼리 ‘생각’을 직접 주고받는다… 텍스트 없이 소통하는…

11월 5, 2025

인공지능 언어모델들이 서로 협력할 때 텍스트 메시지 대신 ‘생각’을 직접 교환하는 새로운 방법이 개발됐다. 중국 칭화대학교와 인피니전스 AI…

AI, 상황 따라 법적 책임질 수도... 구글이 제시한 'AI 인격'의 미래

AI, 상황 따라 법적 책임질 수도… 구글이 제시한…

11월 4, 2025

구글 딥마인드(Google DeepMind) 연구진이 인공지능(AI)을 어떻게 다뤄야 할지에 대한 논문을 내놨다. 핵심은 간단하다. AI에게 ‘인격’을 줄 수 있다는…

Can AI be Accountable

“AI가 잘못 판단하면 누구 책임?”… 800년 전 마그나카르타가…

11월 4, 2025

미국 뉴햄프셔대학교(University of New Hampshire) 앤드류 쿤 교수가 발표한 논문에 따르면, AI의 힘이 빠르게 강해지는 지금 우리는 중대한…

Who Has The Final Say? Conformity Dynamics in ChatGPT's Selections

챗GPT, 8명이 반대하자 99.9% 의견 바꿔… AI도 ‘눈치’…

11월 3, 2025

챗GPT가 객관적으로 판단하는 도구가 아니라 다른 사람들의 의견에 따라 자기 생각을 바꾸는 ‘눈치 보는 AI’라는 연구 결과가 나왔다.…

Remote Labor Index: Measuring AI Automation of Remote Work

AI 자동화 공포, 과장됐다… 실제 업무 중 겨우…

11월 3, 2025

인공지능이 지식과 추론 벤치마크에서 빠르게 발전하고 있지만, 실제 경제적 가치를 창출하는 업무를 자동화하는 능력은 여전히 바닥 수준에 머물러…

Emergent Introspective Awareness in Large Language Models

AI, 입력된 글자와 ‘머릿속 생각’ 구별한다… 앤트로픽 “LLM,…

10월 31, 2025

AI 개발사 앤트로픽(Anthropic)이 자사 AI 모델 ‘클로드(Claude)’가 자신의 내부 상태 일부를 제한적으로 인식할 수 있다는 연구 결과를 발표했다.…

SocializeChat: A GPT-Based AAC Tool Grounded in Personal Memories to Support Social Communication

“공원서 낚시했던 기억” AI가 대화로 만든다… 노년층을 위한…

10월 28, 2025

중국 저장대학교 연구팀이 말하기 어려운 노인들의 과거 추억을 활용해 더 풍부한 대화를 나눌 수 있도록 돕는 인공지능 대화…

Outraged AI: Large language models prioritise emotion over cost in fairness enforcement

“조금만 불공평해도 용납 못해”… AI, 도덕 판단에는 인간보다…

10월 28, 2025

중국 칭화대학교 심리인지과학과 연구팀이 AI의 감정 기반 의사결정을 분석한 결과, 대규모 언어모델(LLM)이 인간처럼 감정을 이용해 도덕적 판단을 내린다는…

AI Report 언어 모델 연구 – AI 매터스