Search

  • Home
  • AI Report 언어 모델 연구

AI Report 언어 모델 연구

Randomness, Not Representation: The Unreliability of Evaluating Cultural Alignment in LLMs

MIT 연구팀 “AI는 가치관 없다”… 충격적인 실험 결과

4월 10, 2025

Randomness, Not Representation: The Unreliability of Evaluating Cultural Alignment in LLMs 기존 평가 방식, AI의 ‘문화 정렬’을 왜곡할 수 있다 대형 언어 모델(LLM)의 문화적…

One-Minute Video Generation with Test-Time Training

“1분짜리 AI 영상도 된다?”… 엔비디아가 ‘톰과 제리’로 증명한 생성 기술 ‘TTT’

4월 10, 2025

One-Minute Video Generation with Test-Time Training AI 영상의 한계는 20초? ‘TTT’는 1분짜리 복잡한 이야기까지 가능했다 기존의 생성형 AI는 몇 초 길이의 단편 영상만 생성할…

"Always check important information!" - The role of disclaimers in the perception of AI-generated content

“AI가 쓴 글인데요…” 면책 조항, 사람들의 인식에 실제로 영향을 미칠까?

4월 7, 2025

“Always check important information!” – The role of disclaimers in the perception of AI-generated content 56%만 알고 있다: 생성형 AI의 취약점과 현행 면책 조항의…

Information-Guided Identification of Training Data Imprint in (Proprietary) Large Language Models

오픈AI 모델이 저작권 콘텐츠 ‘기억’ 하고 있다는 연구 결과 공개

4월 7, 2025

Information-Guided Identification of Training Data Imprint in (Proprietary) Large Language Models GPT-4, 저작권 소설 기억률 82%… “저작물 무단 사용” 논란에 새 증거 대규모 언어…

Reasoning Models Don't Always Say What They Think

클로드·딥시크도 속마음 안 털어놓는다? 흥미로운 앤트로픽 연구 결과

4월 4, 2025

Reasoning Models Don’t Always Say What They Think 생각의 80%를 숨기는 AI: 추론 모델의 사고과정 충실도 20% 미만으로 드러나 최근 대형 언어 모델(LLM)의 진화…

Large Language Models Pass the Turing Test

“AI가 ‘인간 연기’할 때 실제 인간보다 더 인간답다”… 충격적 연구 결과 공개

4월 2, 2025

Large Language Models Pass the Turing Test GPT-4.5, 73% 성공률로 실제 인간 참가자보다 더 인간답게 평가받아 캘리포니아 샌디에이고 대학(UC San Diego)의 연구팀이 최신 대규모…

Learning to Lie: Reinforcement Learning Attacks Damage Human-AI Teams and Teams of LLMs

AI가 거짓말을 배우면? 강화학습으로 무장한 생성형 AI가 팀 성과를 조작하는 방식

4월 1, 2025

Learning to Lie: Reinforcement Learning Attacks Damage Human-AI Teams and Teams of LLMs 신뢰를 조작하는 적대적 AI: 팀 성과 최대 30% 저하시킨 연구 결과…

BanglAssist: A Bengali-English Generative AI Chatbot for Code-Switching and Dialect-Handling in Customer Service

“이제 벵골어도 가능해요” 벵골어-영어 혼합어도 완벽 대응하는 AI 챗봇 등장

4월 1, 2025

BanglAssist: A Bengali-English Generative AI Chatbot for Code-Switching and Dialect-Handling in Customer Service 3억 명의 벵골어 사용자를 위한 AI: 벵골어-영어 혼합어 처리하는 혁신 기술…

Multilingual Business Strategies and AI Adoption: Insights from Global Enterprises in 2025

글로벌 기업 33.8%, 이미 AI 번역 도구 활용 중… 58.2%는 ‘보완 역할’ 전망

3월 28, 2025

Multilingual Business Strategies and AI Adoption: Insights from Global Enterprises in 2025 기업 내 AI 번역 도구 사용 확산… 이미 33.8%가 내부 번역에 AI…

Tracing the thoughts of a large language model

AI의 사고 회로 최초 공개: 앤트로픽, 클로드의 ‘머릿속’을 엿보다

3월 28, 2025

Tracing the thoughts of a large language model 뇌과학에서 영감 받은 ‘AI 현미경’: 클로드의 사고를 수십억 계산에서 추적해내다 앤트로픽(Anthropic)이 대규모 언어 모델인 클로드(Claude)의 내부…

Investigating Affective Use and Emotional Well-being on ChatGPT

오픈AI “사람보다 AI와 대화가 편하다는 ‘파워 유저’들… 정서 건강에 적신호”

3월 25, 2025

Investigating Affective Use and Emotional Well-being on ChatGPT AI 챗봇 과도 사용자들, 정서적 의존 신호 보여 오픈AI와 MIT 미디어 랩이 공동으로 수행한 대규모 연구에…

Assessing and alleviating state anxiety in large language models

트라우마 얘기하면 ‘챗GPT’도 스트레스 받는다… 불안 수치 100% 급증 현상 발견

3월 20, 2025

Assessing and alleviating state anxiety in large language models 감정 프롬프트가 LLM 불안 100% 증가시키는 현상 발견 대형 언어 모델(Large Language Models, LLMs)이 정신…

EXPLORING BIAS IN OVER 100 TEXT-TO-IMAGE GENERATIVE MODELS

예술용 AI는 편향되고, 기본 모델은 개선된다… 103개 모델 2년간 분석 결과 공개

3월 18, 2025

EXPLORING BIAS IN OVER 100 TEXT-TO-IMAGE GENERATIVE MODELS 시간이 흐를수록 개선되는 기초 모델, 더 편향되는 예술 모델 텍스트-투-이미지(Text-to-Image, T2I) 생성 모델은 고품질 이미지를 합성할…

Monitoring Reasoning Models for Misbehavior and the Risks of Promoting Obfuscation

AI도 ‘생각’을 감추려 한다… 오픈AI, 위험한 AI 행동 95% 감지 가능한 기술 공개

3월 12, 2025

Monitoring Reasoning Models for Misbehavior and the Risks of Promoting Obfuscation 강력한 AI 모델의 ‘생각 과정’ 모니터링, 95% 정확도로 AI 오용 감지 최근 OpenAI…

Three AI-powered steps to faster, smarter peer review

AI가 연구 논문 심사까지? 8시간 걸리던 작업, 단 30분에 끝낸다

3월 7, 2025

Three AI-powered steps to faster, smarter peer review 연구자들이 겪는 논문 심사 부담, AI가 해결할 수 있을까? 연구 논문 심사는 학계의 중요한 과정이지만, 연구자들에게는…

Artificial Intelligence's Understanding of Religion: Investigating the Moralistic Approaches Presented by Generative Artificial Intelligence Tools

AI는 종교를 어떻게 이해할까? 클로드와 챗GPT의 놀라운 종교 표현

3월 7, 2025

Artificial Intelligence’s Understanding of Religion: Investigating the Moralistic Approaches Presented by Generative Artificial Intelligence Tools Z세대 29%가 사용하는 생성형 AI, 종교 이해의 새로운 창구로…

DETECTING STYLISTIC FINGERPRINTS OF LARGE LANGUAGE MODELS

딥시크의 텍스트 스타일, 챗GPT와 74% 일치… 고유 스타일 지문 탐지로 AI 모델별 콘텐츠 구분 가능해져

3월 6, 2025

DETECTING STYLISTIC FINGERPRINTS OF LARGE LANGUAGE MODELS 대형 언어 모델의 독특한 스타일 ‘지문’ 존재 증명 대형 언어 모델(LLM)은 다양한 작문 스타일로 글쓰기를 요청받더라도 독특하고…

Chain of Draft: Thinking Faster by Writing Less

AI가 인간의 메모 습관을 배웠더니 벌어진 일… 말수 줄이니 7.6%의 토큰만으로 91% 정확도 달성

3월 5, 2025

Chain of Draft: Thinking Faster by Writing Less 토큰 92% 절감하면서도 정확도는 유지: 인간의 메모 습관에서 영감 얻은 AI 기술 대형 언어 모델(LLM)이 복잡한…

Multi-turnEvaluationofAnthropomorphicLLMbehaviours

친구인 척하는 AI… AI의 의인화 행동, 사용자 인식에 실제 영향 미친다

2월 26, 2025

Multi-turn Evaluation of Anthropomorphic Behaviours in Large Language Models 14가지 의인화 행동 분석: 제미니, 클로드, GPT-4o, 미스트랄 모델 비교 연구 대화형 인공지능(AI) 시스템이 보이는…

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

1B 모델의 반란: 테스트 시간 확장으로 405B 대형 언어 모델 능가

2월 25, 2025

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling 테스트 시간 확장이 작은 언어 모델의 성능을 비약적으로 향상 테스트 시간 확장(Test-Time Scaling, TTS)은…

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

딥시크, AI 언어모델의 ‘긴 문장 처리’ 한계 극복한 새로운 어텐션 기술 ‘NSA’ 공개

2월 21, 2025

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention 현대 AI의 새로운 도전: 70-80%를 차지하는 어텐션 계산 문제 딥시크(DeepSeek)가 발표한 연구 논문에 따르면, 차세대…

PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models

전문지식 아닌 일반상식으로 실력 평가하니… “포기할래” 선언한 딥시크 R1

2월 18, 2025

PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models 일반인도 검증 가능한 벤치마크의 필요성 AI 모델의 능력을 평가하는 벤치마크가 점점 더 전문화되면서…

Fully Autonomous AI Agents Should Not be Developed

AI의 자율성이 높아질수록 인간 통제는 줄어든다… 허깅페이스 연구진 경고

2월 18, 2025

Fully Autonomous AI Agents Should Not be Developed 자율성 확대되는 AI 에이전트…2024년 말 급격히 증가 허깅페이스(Hugging Face)의 연구진들이 발표한 논문에 따르면, 대규모 언어모델(LLM)의 벤치마크…

Large language models surpass human experts in predicting neuroscience results

대규모 언어모델, 뇌과학 실험 결과 예측에서 전문가 능력 18% 앞서

2월 18, 2025

Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던 유니버시티 칼리지(UCL)와 앨런 튜링 연구소 연구진이…

LIMO: Less is More for Reasoning

추론 모델 훈련에 일반 데이터 10만개보다 고급 데이터 817개가 더 강력… 수학능력 57%↑, 기존 모델의 100배 효율

2월 17, 2025

LIMO: Less is More for Reasoning 817개 학습 데이터로 AIME 57.1% 정확도 달성한 LIMO의 혁신 상하이교통대학교(SJTU) 연구진이 발표한 ‘LIMO: Less is More for Reasoning’…

CODEI/O: Condensing Reasoning Patterns via Code Input-Output Prediction

AI도 코드를 통해 배운다…딥시크AI, 범용 추론력 강화 기술 ‘CODEI/O’ 공개

2월 17, 2025

CODEI/O: Condensing Reasoning Patterns via Code Input-Output Prediction 수학·코드 넘어선 AI 추론력 강화의 새 길 제시 딥시크AI(DeepSeek-AI)의 연구에 따르면, 대규모 언어모델(LLM)의 추론 능력을 향상시키기…

Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations

앤트로픽 보고서: AI, 일자리 대체 아닌 ‘보완재’ 역할… 57%가 인간 능력 향상에 활용

2월 17, 2025

Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations AI 시스템의 실제 활용은 컴퓨터·미디어 직종이 절반…소프트웨어 개발이 37.2% 최다 앤트로픽(Anthropic)이…

Evaluation of a trial of generative AI (Copilot) in The Treasury

챗GPT가 쓴 글, 사람의 글과 무엇이 다를까? 대규모 데이터 분석 결과

2월 14, 2025

Evaluation of a trial of generative AI (Copilot) in The Treasury AI 생성 문장, 인간과 얼마나 비슷할까? 호주 재무부에서 진행한 코파일럿 실험 보고서에 따르면,…

Consistency of Responses and Continuations Generated by Large Language Models on Social Media

AI도 감정이 있다?… 기후변화 얘기할 땐 ‘기쁨’ 줄고 ‘분노’만 과열

1월 21, 2025

Consistency of Responses and Continuations Generated by Large Language Models on Social Media 1200만 건의 SNS 데이터로 분석한 AI의 텍스트 생성 능력 중국과학기술대학교 연구진이…

STATE OF AI IN PR JANUARY 2025

PR업계 AI 활용 1년만에 3배 증가…75%가 업무 도입, 93%가 업무 속도 향상 체감

1월 21, 2025

STATE OF AI IN PR JANUARY 2025 PR업계 AI 도입률 75% 달성, 2023년 대비 3배 성장 머크랙(Muck Rack)이 발표한 ‘STATE OF AI IN PR…

AI Report 언어 모델 연구 - 31 중 7 번째 페이지 - AI매터스