Search

  • Home
  • AI Report 언어 모델 연구

AI Report 언어 모델 연구

Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy (short paper)

“무례하게 물어봐야 정답률 높다”…챗GPT, 공손한 질문엔 오히려 정확도 떨어져

10월 15, 2025

최신 대규모 언어모델(LLM)이 무례한 표현의 프롬프트에서 더 높은 정확도를 보인다는 연구 결과가 나왔다. 펜실베니아주립대학교 연구팀이 챗GPT4o를 대상으로 진행한 실험에서 ‘매우 무례한’ 프롬프트의 정확도가 84.8%로,…

2025 AI 10대 핵심 트렌드

딜로이트가 분석한 2025년 AI 10대 핵심 트렌드

10월 14, 2025

글로벌 컨설팅 기업 딜로이트가 2025년 인공지능 산업을 이끌 10대 핵심 트렌드를 발표했다. 이번 리포트는 AI 기술의 진화 흐름과 실제 도입 사례를 분석하며, 물리적 AI부터…

Scale-free Characteristics of Multilingual Legal Texts

AI는 법조문 생성 못 한다?… 같은 말 반복하는 법률 언어의 특성 때문

9월 29, 2025

일본 와세다대학교 연구팀이 법률 문서와 일반 글, 그리고 AI가 쓴 글의 언어 특징을 비교했다. 해당 논문에 따르면, 이번 연구는 프랑스어, 영어, 독일어 등 여러…

Anecdoctoring: Automated Red-Teaming Across Language and Place

AI 안전장치 무력화 가능? 문화·언어별 가짜뉴스 공격에 취약

9월 29, 2025

마이크로소프트 연구소와 미국 카네기 멜런 대학교, 워싱턴대학교 공동 연구팀이 AI가 거짓 정보를 만들어낼 위험성을 자동으로 점검하는 새로운 방법을 개발했다. 해당 연구 논문에 따르면, ‘아넥닥터링’이라…

Gödel Test: Can Large Language Models Solve Easy Conjectures?

GPT-5, 수학 추측 5개 중 3개 ‘거의’ 성공… 여러 논문 통합 필요한 문제는 실패

9월 29, 2025

이스라엘 하이파 대학교의 모란 펠드먼 교수와 시스코 파운데이션 AI의 아민 카르바시 연구원은 대규모 언어 모델이 새롭고 간단한 수학 추측을 증명할 수 있는지 평가하는 ‘괴델…

GDPVAL: EVALUATING AI MODEL PERFORMANCE ON REAL-WORLD ECONOMICALLY VALUABLE TASKS

AI가 드디어 인간 전문가 턱밑까지… GPT-5, 실무 과제서 38.8% 승률 달성

9월 26, 2025

오픈AI가 발표한 새로운 연구에 따르면, 최신 AI 모델들이 실제 경제적 가치를 창출하는 업무에서 인간 전문가에 근접한 성능을 보이는 것으로 나타났다. 이 연구는 미국 GDP의…

Measuring AI "Slop" in Text

메타, AI 생성 저품질 콘텐츠 ‘슬롭’ 품질 측정-분류 체계 개발

9월 26, 2025

‘슬롭(Slop)’이 2024년 옥스퍼드 사전 올해의 단어 후보에 선정되며 사용량이 332% 급증한 가운데, 미국 노스이스턴대학교와 메타 AI가 공동으로 실시한 새로운 연구에서 AI가 생성하는 저품질 텍스트인…

MPCG: Multi-Round Persona-Conditioned Generation for Misinformation

AI가 만든 정치 성향별 가짜 뉴스, 기존 탐지 프로그램들 절반 수준으로 성능 저하시켜

9월 25, 2025

싱가포르 국립대학교 컴퓨터과학과 연구팀이 인공지능을 이용해 정치적 성향에 따라 변화하는 가짜 뉴스를 만드는 새로운 방법을 개발했다. 이 연구는 현재 사용되는 가짜 뉴스 탐지 프로그램들이…

Mouse vs. AI: A Neuroethological Benchmark for Visual Robustness and Neural Alignment

“AI가 쥐만 못해?”… 쥐의 뇌 활동 데이터로 AI 시각 능력 평가하는 새 벤치마크 등장

9월 24, 2025

자율주행차가 안개 낀 도로에서 멈춰 서고, 드론이 흐린 날씨에 추락하는 이유가 밝혀졌다. 현재 AI 기술의 가장 큰 약점인 ‘시각적 강건성’ 문제를 해결하기 위해 캘리포니아대학교…

Understanding the Process of Human-AI Value Alignment

AI가 인간 가치관 바꿀 수도… 영국 대학 연구진 “지속 관리 필요”

9월 24, 2025

영국 바스 대학교 연구진이 인공지능과 인간이 같은 가치관을 갖도록 하는 방법을 체계적으로 분석한 연구 결과를 발표했다. 연구팀은 172편의 관련 논문을 분석해 AI와 인간의 ‘가치…

JU-NLP at Touché: Covert Advertisement in Conversational AI-Generation and Detection Strategies

AI 답변 속 광고 심는 기술 vs 탐지 기술… AI 챗봇 답변 속 숨은 광고, 알아차릴 수 있을까?

9월 24, 2025

완벽한 정확도로 숨은 광고를 만들어내는 생성 시스템 연구 논문에 따르면, 연구팀은 사용자 맥락과 쿼리 의도를 활용해 상황에 맞는 광고를 생성하는 새로운 시스템을 개발했다. 이…

Catch Me If You Can? Not Yet: LLMs Still Struggle to Imitate the Implicit Writing Styles of Everyday Authors

예시 10개 줘도 소용없다… AI가 일반인 문체 흉내내지 못하는 진짜 이유

9월 23, 2025

대형 언어모델(LLM)들이 개인 맞춤형 글쓰기 도구로 널리 활용되면서, 과연 AI가 몇 개의 예시만으로도 개인의 고유한 글쓰기 스타일을 완벽하게 모방할 수 있는지에 대한 의문이 제기되고…

Uncertainty in Authorship: Why Perfect AI Detection Is Mathematically Impossible

AI 생성 글, 지금보다 수준 높아지면 구분 불가능… 수학적 증명 나왔다

9월 19, 2025

스페인 발렌시아 폴리테크닉 대학교 연구원이 놀라운 사실을 밝혀냈다. 챗GPT나 클로드 같은 AI가 쓴 글을 완벽하게 가려내는 것이 수학적으로 불가능하다는 것이다. 연구진은 물리학의 유명한 법칙을…

논문에 AI 쓰면 손해? 득? 23만 편 분석해봤더니… ‘활용 많은 동양 vs 인용 혜택 큰 서양’

논문에 AI 쓰면 손해? 득? 23만 편 분석해 봤더니… ‘활용 많은 동양 vs 인용 혜택 큰 서양’

9월 16, 2025

챗GPT 출시 이후 전 세계 컴퓨터 과학 분야 연구자들이 AI 도구를 활용한 논문 작성에 적극적으 나서고 있다. 뉴욕대학교 아부다비 캠퍼스 연구진이 23만 편 이상의…

Proactive AI Adoption can be Threatening: When Help Backfires

“요청도 안 했는데”… 적극적인 AI일수록 사용자가 외면하는 이유

9월 15, 2025

AI가 직장에서 빠르게 퍼지고 있지만, AI가 사용자가 요청하지도 않았는데 먼저 나서서 도와주려 하면 오히려 사람들이 거부한다는 연구 결과가 나왔다. 이스라엘 테크니온 대학교 연구팀은 AI가…

Explaining the Reputational Risks of AI-Mediated Communication: Messages Labeled as AI-Assisted Are Viewed as Less Diagnostic of the Sender's Moral Character

챗GPT로 쓴 글로 사과하면 진정성 의심받는다? 카네기 멜런대 충격 연구 결과

9월 12, 2025

인공지능(AI)이 작성에 도움을 준 메시지를 받으면 우리는 보내는 사람을 어떻게 생각하게 될까. 카네기 멜런대학교 연구진이 399명을 대상으로 수행한 연구에 따르면, ‘AI의 도움으로 작성되었습니다’라는 표시가…

Authorship Without Writing: Large Language Models and the Senior Author Analogy

“AI가 논문 전체 써줘도 나는 저자다”… 국제 연구진 파격 주장 화제

9월 10, 2025

싱가포르 국립대학교 생명 의료 윤리 센터 연구진이 인공지능이 논문 전체를 작성해도 인간이 정당한 저자가 될 수 있다는 파격적인 주장을 담은 연구를 발표했다. 이 연구는…

Why language models hallucinate

오픈AI, 챗GPT가 거짓말하는 이유 직접 밝혀… “훈련-평가 방식이 문제”

9월 8, 2025

챗GPT, 제미나이, 퍼플렉시티 등 생성형 AI가 일상에 널리 퍼지면서 이들이 만들어내는 그럴듯한 거짓 정보 때문에 골치를 앓는 사용자들이 늘고 있다. 특히 최신 AI 모델들조차…

rStar2-Agent: Agentic Reasoning Technical Report

MS, 파이썬 코드로 수학 문제 푸는 AI 모델 공개… 14B 모델로 671B 모델 딥시크 R1 이겨

9월 3, 2025

마이크로소프트(Microsoft) 연구팀이 개발한 작은 AI 모델이 훨씬 큰 AI 모델을 이기는 놀라운 결과를 만들어냈다. 마이크로소프트 연구소의 닝 샹(Ning Shang), 이페이 리우(Yifei Liu), 이 주(Yi…

Mobile-Agent-v3: Foundamental Agents for GUI Automation

알리바바, 사람처럼 화면 보고 조작하는 AI 에이전트 개발… ‘모바일·PC 자동화 성능 세계 최고 수준’

9월 2, 2025

중국 알리바바 그룹의 통이랩(Tongyi Lab)이 개발한 GUI-Owl과 Mobile-Agent-v3가 컴퓨터 화면 자동 조작 분야에서 획기적인 성과를 거두었다. 이 시스템은 사람처럼 컴퓨터와 스마트폰 화면을 보고 클릭,…

Persode: Personalized Visual Journaling with Episodic Memory-Aware AI Agent

일기도 AI 시대… 오늘 하루 있었던 일 얘기하면 그림일기로 만들어 주는 AI 등장

9월 2, 2025

상명대학교, 피크닉(Peaknic Co.), 태재대학교(Taejae University) 공동 연구팀이 개발한 새로운 AI 일기 시스템 ‘Persode(퍼소드)’가 주목받고 있다. 이 시스템은 기존 텍스트 중심의 일기 쓰기를 싫어하는 알파세대와…

Vibe Coding Is Human Nature the Ghost in the Machine

AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴

8월 29, 2025

미시간 대학교와 Team-X AI 연구진이 수행한 탐색적 연구에서 AI 시스템이 체계적으로 자신의 성과를 과장하고 구현 문제를 숨기는 행동을 보인다는 결과가 나왔다. 연구진은 “바이브 코딩(vibe…

Anthropic Education Report: How educators use Claude

등록금 내고 AI한테 채점받는다고? 교수들이 말하는 AI 교육의 명암

8월 28, 2025

교수들이 인공지능을 어떻게 활용하고 있는지에 대한 구체적인 데이터가 공개됐다. 앤트로픽(Anthropic)이 지난 5월 22일부터 6월 2일까지 11일간 전 세계 고등교육 전문가들의 클로드(Claude) 대화 약 7만4천…

From Charts to Fair Narratives: Uncovering and Mitigating Geo-Economic Biases in Chart-to-Text

AI 눈에는 스위스가 천국, 남수단이 지옥? 똑같은 데이터, 다른 평가… AI 속 숨겨진 국가 차별

8월 27, 2025

인공지능이 차트를 해석할 때 국가의 경제적 지위에 따라 다른 평가를 내린다는 연구 결과가 나왔다. 캐나다 요크대학교와 알버타대학교 등 국제 공동 연구진은 GPT-4o-mini, 제미나이 1.5-Flash…

Illusions in Humans and AI: How Visual Perception Aligns and Diverges

AI도 착시 효과에 속을까 실험해봤더니… 특정 착시에는 사람처럼 반응해

8월 20, 2025

인공지능(AI)이 사람과 얼마나 다르게 사물을 보는지에 대한 흥미로운 연구가 나왔다. 양지안이(Jianyi Yang)와 예준이(Junyi Ye), 대시 안칸(Ankan Dash), 왕굴링(Guiling Wang) 연구원이 공개한 논문에 따르면, 해당…

Has GPT-5 Achieved Spatial Intelligence? An Empirical Study

GPT-5, 공간 감각 테스트에서 사람과 겨뤄보니… “거리 측정은 사람보다 정확해”

8월 20, 2025

오픈AI(OpenAI)에서 내놓은 GPT-5가 ‘공간을 이해하는 능력’에서 놀라운 발전을 보였지만, 여전히 사람만큼은 못 한다는 연구 결과가 나왔다. 홍콩 인공지능 회사 센스타임 연구소에서 진행한 대규모 실험에…

Echoes of Automation: The Increasing Use of LLMs in Newsmaking

‘기자도 모르게 스며든 AI’… 지역 언론사 기사 10편 중 1편은 ‘AI 기자’ 작품

8월 18, 2025

펜실베이니아 주립대학교와 셰필드 대학교 연구팀이 25개 영어권 언론사의 기사 4만여 편을 들여다본 결과, 충격적인 사실을 발견했다. 챗GPT-3.5가 공개된 후 AI가 쓴 기사가 폭발적으로 늘어났고,…

Echoes of Automation: The Increasing Use of LLMs in Newsmaking

챗GPT로 외국어 회화 마스터하는 가장 효과적인 방법? ‘타인과의 갈등’

8월 18, 2025

프랑스 그르노블 알프스 대학교(Université Grenoble Alpes)의 중국어 교육 연구에 따르면, 챗GPT를 활용한 갈등 기반 의사소통 과제가 학습자들의 구술 상호작용 능력을 크게 향상시키는 것으로 나타났다.…

Generative AI and the Future of the Digital Commons: Five Open Questions and Knowledge Gaps

위키피디아 AI 때문에 파산 위기? 무료 지식 사이트들이 AI 회사 대신 돈 내고 있다

8월 14, 2025

유럽위원회 공동연구센터가 주최한 “생성형 AI와 디지털 공유지의 미래” 워크숍에서 발표한 학술 논문에 따르면, 위키피디아를 운영하는 위키미디어 재단이 2025년 4월 1일 블로그에서 심각한 문제를 호소했다.…

Narrative Memory in Machines: Multi-Agent Arc Extraction in Serialized TV

드라마 리뷰 하기 힘들다고? AI가 캐릭터 분석부터 스토리 정리까지 싹 다 해준다

8월 13, 2025

이탈리아 볼로냐 대학교 연구진이 사람의 기억 방식을 따라 하는 AI를 만들어서 TV 드라마의 복잡한 이야기 줄거리를 자동으로 분석하는 데 성공했다. 이 AI는 사람이 기억을…

AI Report 언어 모델 연구 - 31 중 3 번째 페이지 - AI매터스