Search

  • Home
  • AI Report 언어 모델 연구

AI Report 언어 모델 연구

"Alexa, can you forget me?" Machine Unlearning Benchmark in Spoken Language Understanding

“알렉사, 나를 잊어줘” 음성 AI가 개인정보를 선택적으로 삭제하는 기술 등장

5월 23, 2025

“Alexa, can you forget me?” Machine Unlearning Benchmark in Spoken Language Understanding 음성 데이터 삭제가 시급한 이유: 개인 식별 정보 노출 위험성 음성 인공지능이…

Activating AI Safety Level 3 Protections

“AI가 생화학 무기 제조 도울 수도” 앤트로픽, 클로드 오퍼스 4에 사상 최고 보안 적용

5월 23, 2025

Activating AI Safety Level 3 Protections 범용 탈옥 공격 차단을 위한 실시간 분류기 가드 시스템 도입 앤트로픽(Anthropic)이 AI 안전성 레벨 3(ASL-3) 보안 표준을 적용한…

A framework for considering the use of generative AI for health

스탠포드 의료AI·디지털헬스 전문가 54명이 밝힌 의료용 AI의 치명적 위험과 해결책

5월 22, 2025

A framework for considering the use of generative AI for health 스탠포드 대학 54명 전문가가 제시한 의료용 AI 안전 가이드 스탠포드 대학교(Stanford University) 디지털헬스센터…

On the conversational persuasiveness of GPT-4

챗GPT, 개인 정보만 있으면 ‘설득의 달인’… “인간보다 81% 더 설득력 있어”

5월 21, 2025

On the conversational persuasiveness of GPT-4 개인화된 GPT-4, 인간보다 81.2% 더 높은 설득력으로 대화 승리 대규모 언어 모델(LLM)이 설득력 있는 콘텐츠를 생성할 수 있다는…

Artificial Intelligence, Scientific Discovery, and Product Innovation

AI와 과학자의 공생 관계? 신소재 발견 44%, 특허 출원 39% 증가했지만, 직무 만족도 44% 감소

5월 19, 2025

Artificial Intelligence, Scientific Discovery, and Product Innovation AI, 44% 더 많은 신소재 발견으로 과학 연구에 혁명 가져와 인공지능이 과학적 발견 영역에서 혁명적 변화를 가져오고…

AI that grows twice as fast every 7 months? Experts are optimistic, while the general public is concerned about the age of agents.

7개월마다 2배씩 성장하는 AI? 전문가는 낙관적, 일반인은 우려하는 에이전트 시대

5월 19, 2025

SPRi AI Brief 2025년 5월호 MCP vs A2A: 글로벌 기업들의 AI 에이전트 프로토콜 표준화 경쟁 점화 글로벌 AI 기업들이 AI 에이전트 기술 경쟁에 본격적으로…

Generative AI in schools: 77% of teens say they are using AI for homework - why teachers are concerned

“AI로 숙제하는 Z세대” 청소년 77%가 AI로 숙제한다는 설문조사 결과 공개

5월 16, 2025

Generative AI in schools: 77% of teens say they are using AI for homework – why teachers are concerned 94%가 AI 경험, 20%는 ‘정기적…

Artificial intelligence and free will: generative agents utilizing large language models have functional free will

AI도 ‘스스로’ 선택할 수 있다… 마인크래프트와 드론이 보여준 AI의 자유의지

5월 16, 2025

Artificial intelligence and free will: generative agents utilizing large language models have functional free will 인간 수준에 도달한 AI 인지 능력: GPT-4는 의학 조언에서…

Displacement or Augmentation? The Effects of AI Innovation on Workforce Dynamics and Firm Value

당신의 직업은 AI에 의해 사라질까? 노동 시장 영향력 연구 결과 보고서

5월 16, 2025

Displacement or Augmentation? The Effects of AI Innovation on Workforce Dynamics and Firm Value AI 기능별 노동력 영향 차이: 증강형 vs 대체형 (500만 건…

Human-generative AI collaboration enhances task performance but undermines human's intrinsic motivation

“AI와 일하면 성과는 높아지지만 ‘흥미’는 떨어진다”… 3,500명 실험 결과 충격적

5월 14, 2025

Human-generative AI collaboration enhances task performance but undermines human’s intrinsic motivation 생성형 AI와의 협업, 텍스트 길이 최대 150% 증가하고 품질도 향상 인간과 생성형 AI(GenAI)의…

PANGU ULTRA MOE: HOW TO TRAIN YOUR BIG MOE ON ASCEND NPUS

AI도 ‘분업’이 효율적… 화웨이가 만든 ‘여러 전문가 AI’ 성능 58% 향상

5월 14, 2025

PANGU ULTRA MOE: HOW TO TRAIN YOUR BIG MOE ON ASCEND NPUS 효율성 2배 향상, 화웨이의 7천억 파라미터 MoE 모델 어센드 NPU 최적화 도전기…

Generating Physically Stable and Buildable LEGO Designs from Text

“책장 만들어줘” 한마디면 OK… 실제 조립 가능한 레고 설계하는 AI

5월 13, 2025

Generating Physically Stable and Buildable LEGO Designs from Text 문장만 입력하면 물리적으로 안정적인 레고 구조물이 완성된다 카네기멜런대학교(Carnegie Mellon University)의 연구진은 텍스트 입력만으로 물리적으로 안정적인…

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents

AI에게 자판기 운영 시켜봤더니… 클로드 3.5 소넷, 인간보다 185만원 더 벌어

5월 13, 2025

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents3 2천만 토큰 넘는 장기 실험, AI 에이전트의 일관성 측정하는 ‘벤딩-벤치’ 개발 대형 언어 모델(LLM)은 짧은…

Good answers are not necessarily factual answers: an analysis of hallucination in leading LLMs

AI에게 ‘간략히 설명해줘’라고 말하면 오답률 20% 증가… 충격적 연구 결과

5월 12, 2025

Good answers are not necessarily factual answers: an analysis of hallucination in leading LLMs 배포된 AI 애플리케이션 사고의 3분의 1이 환각 현상 때문… 전문가들…

Is there a half-life for the success rates of AI agents?

인간은 12시간 뒤에도 작업 성공률 20%, AI는 6%… 장시간 작업에서 드러난 AI의 치명적 약점

5월 9, 2025

Is there a half-life for the success rates of AI agents? 7개월마다 AI 작업 능력 2배 증가…옥스포드 연구팀이 발견한 수학적 모델 연구기관 메트(METR)의 과학자들이…

Risks from Language Models for Automated Mental Healthcare: Ethics and Structure for Implementation

당신의 우울함을 AI가 알아차릴까? 스탠포드 연구팀이 밝힌 정신건강 AI의 실체

5월 9, 2025

Risks from Language Models for Automated Mental Healthcare: Ethics and Structure for Implementation 미국 정신과 의사 20% 미만만 신규 환자 수용, AI가 의료 공백…

AI 에이전트, 가짜 뉴스 대응의 새 무기 될 수 있나?

AI 에이전트, 가짜 뉴스 대응의 새 무기 될 수 있나?

5월 5, 2025

Assessing the Potential of Generative Agents in Crowdsourced Fact-Checking 오늘날 소셜미디어를 통해 허위정보가 빠르게 확산되는 상황에서 효과적인 팩트체킹 방법은 그 어느 때보다 중요해졌다. 최근…

Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo

8배 작은 AI 모델이 대형 모델 능가하는 비결, ‘순차적 몬테카를로’ 기법

4월 28, 2025

SYNTACTIC AND SEMANTIC CONTROL OF LARGE LANGUAGE MODELS VIA SEQUENTIAL MONTE CARLO SMC 기술로 언어 모델 정밀 제어, 구문적·의미적 제약 준수하며 텍스트 생성 가능해져…

Taking AI Welfare Seriously

AI에게도 복지가 필요할까? 인공지능 복지에 대한 충격적 논의

4월 28, 2025

Taking AI Welfare Seriously 과학계, AI 의식 가능성 인정… 앤트로픽과 구글 등 주요 기업도 준비 시작 인공지능(AI) 시스템이 가까운 미래에 의식을 가지거나 강력한 주체성을…

언어 혁명: AI로 비즈니스 커뮤니케이션을 혁신하는 방법

“영어 못해도 괜찮아” 경영진 72%가 도입 계획한 ‘언어 AI’의 모든것

4월 24, 2025

언어 혁명: AI로 비즈니스 커뮤니케이션을 혁신하는 방법 경영진 72%가 AI 도입 계획, 언어 장벽 해소의 해법으로 주목받는 언어 AI 글로벌 비즈니스 환경에서 언어 장벽은…

Grok 3 vs ChatGPT: We Compared The Two AI Models and Here Are The Results

그록 3 vs 챗GPT, AI 모델 성능 비교 분석해봤더니… 의외의 결과 충격

4월 24, 2025

Grok 3 vs ChatGPT: We Compared The Two AI Models and Here Are The Results 그록 3의 수학적 추론 능력, 챗GPT보다 14% 우수 그록…

Should We Respect LLMs? A Cross-Lingual Study on the Influence of Prompt Politeness on LLM Performance

AI에게 예의 바르게 말하면 더 잘 작동한다? 언어별 결과 차이 뚜렷

4월 22, 2025

Should We Respect LLMs? A Cross-Lingual Study on the Influence of Prompt Politeness on LLM Performance 프롬프트의 예절 수준에 따라 LLM 성능 차이 최대…

Values in the Wild: Discovering and Analyzing Values in Real-World Language Model Interactions

“AI도 가치관이 있다”… 앤트로픽, 클로드 대화 30만 건 분석해 밝혀낸 가치관 지도 공개

4월 22, 2025

Values in the Wild: Discovering and Analyzing Values in Real-World Language Model Interactions 궁금했던 AI의 가치관: 30만 건 실제 대화 분석으로 최초 밝혀내 일상적인…

Copyleaks Research Identifies 74.2% Stylistic Overlap Between DeepSeek-R1 and OpenAI's Model

혁신인 줄 알았는데 베끼기였나? 딥시크-R1, 오픈AI 모델과 답변 스타일 74.2% 유사

4월 21, 2025

Copyleaks Research Identifies 74.2% Stylistic Overlap Between DeepSeek-R1 and OpenAI’s Model 74.2% 일치율: 텍스트 지문 분석으로 밝혀진 AI 모델 간 의존성 카피릭스(Copyleaks)가 혁신적인 AI…

Generative propaganda: Evidence of AI's impact from a state-backed disinformation campaign

당신도 속았을 수 있다… AI로 제작된 러시아 가짜뉴스의 설득력과 생산성 분석

4월 17, 2025

Generative propaganda: Evidence of AI’s impact from a state-backed disinformation campaign 러시아 연계 선전 사이트, AI 도입 후 허위정보 생산 2.4배 증가 생성형 AI…

AI 50

포브스 선정 2025년 AI 기업 Top 50… 올해 새롭게 등장한 기업은?

4월 17, 2025

AI 50 모델 개발에서 응용 중심으로: 챗GPT 이후 AI 기업들 연 1억 달러 매출 달성 챗GPT 출시 이후 2년이 지난 지금, 인공지능은 벤처 캐피털과…

Inference-Time Scaling for Generalist Reward Modeling

“더 큰 AI보다 더 오래 생각하는 AI가 이긴다” 딥시크의 혁신적 추론 확장 기술 공개

4월 16, 2025

Inference-Time Scaling for Generalist Reward Modeling 27배 더 작은 AI가 더 많이 ‘생각’하면 대형 모델을 이긴다: 추론 시간 확장성의 원리 대규모 언어 모델(LLM, Large…

Text2Robot: Evolutionary Robot Design from Text Descriptions

텍스트 입력만으로 실제 로봇 만드는 AI 기술 등장… “몇 분 만에 설계하고 하루 안에 제작 가능”

4월 15, 2025

Text2Robot: Evolutionary Robot Design from Text Descriptions 몇 분 만에 설계, 하루 만에 걷는 로봇 제작… Text2Robot의 혁신적 접근법 로봇 설계는 반세기 이상 비용이…

A unified acoustic-to-speech-to-language embedding space captures the neural basis of natural language processing in everyday conversations

AI는 어떻게 사람의 말을 이해할까? 인공지능 위스퍼가 인간처럼 생각한다는 증거 발견

4월 14, 2025

A unified acoustic-to-speech-to-language embedding space captures the neural basis of natural language processing in everyday conversations 100시간 일상 대화 기록으로 밝혀낸 뇌와 AI의 처리…

What AIs are not learning (and why)

AI는 왜 아직 ‘딸기 한 입’조차 제대로 못 먹일까? 로봇이 배우지 못하는 것과 그 이유

4월 10, 2025

What AIs are not learning (and why) 현재 AI, 사람 돕는 일에는 턱없이 부족하다 로봇과 인공지능(AI)의 진보는 가시적인 기술적 성과를 내고 있지만, 정작 인간을…

AI Report 언어 모델 연구 - 31 중 6 번째 페이지 - AI매터스