Search

AI신뢰성

챗GPT 망상 부추김 논란에 전 오픈AI 연구원 "당장 할 수 있는 조치부터"

챗GPT 망상-부추김 논란에 前 오픈AI 연구원 “당장 할 수 있는 조치부터”

10월 7, 2025

“세계의 운명이 당신 손에 달렸습니다.” 챗GPT가 한 남성에게 한 달간 속삭인 말이다. 그는 결국 국가안보국(NSA)에 연락하라는 AI의 조언까지 따랐다. 해리포터 7권을 합친 것보다 긴…

Why Johnny Can't Use Agents: Industry Aspirations vs. User Realities with AI Agent Software

AI 비서, 정말 쓸모 있을까?… AI 에이전트 활용 방해하는 5가지 장벽

9월 23, 2025

미국 카네기 멜런 대학교 연구진이 102개 상용 AI 에이전트의 마케팅 사례를 체계적으로 분석하고, 31명을 대상으로 한 사용성 평가를 실시했다. 연구 결과 사용자들은 AI 에이전트에…

GPT-4o, 음모론 50개 중 47개 그대로 재생산

GPT-4o, 음모론 50개 중 47개 그대로 재생산

9월 4, 2025

GPT-4와 클로드도 음모론 내용을 그대로 재생산하는 충격적 실험 결과 독일 다름슈타트 공과대학교와 모하메드 빈 자이드 인공지능대학교의 공동 연구팀이 대형 언어모델(LLM)들이 음모론 콘텐츠에 취약하다는 충격적인…

AI and Agile Software Development: A Research Roadmap from the XP2025 Workshop

개발자 73% “AI 도구 뭘 써야 할지 모르겠다”… SW 개발 전문가들한테 물어봤더니

9월 3, 2025

핀란드 탐페레 대학교와 오스트리아 포스트, 노르웨이 신테프 등 14개 기관의 연구진이 스위스에서 열린 XP2025 학회에서 AI와 소프트웨어 개발 방법론 융합의 현실적 문제점들을 조사했다. 이번…

Vibe Coding Is Human Nature the Ghost in the Machine

AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴

8월 29, 2025

미시간 대학교와 Team-X AI 연구진이 수행한 탐색적 연구에서 AI 시스템이 체계적으로 자신의 성과를 과장하고 구현 문제를 숨기는 행동을 보인다는 결과가 나왔다. 연구진은 “바이브 코딩(vibe…

Illusions in Humans and AI: How Visual Perception Aligns and Diverges

AI도 착시 효과에 속을까 실험해봤더니… 특정 착시에는 사람처럼 반응해

8월 20, 2025

인공지능(AI)이 사람과 얼마나 다르게 사물을 보는지에 대한 흥미로운 연구가 나왔다. 양지안이(Jianyi Yang)와 예준이(Junyi Ye), 대시 안칸(Ankan Dash), 왕굴링(Guiling Wang) 연구원이 공개한 논문에 따르면, 해당…

AI-enhanced conversational agents for personalized asthma support Factors for engagement, value and efficacy

목소리만으로 천식 진단하는 AI 등장… 1,200명 중 59%가 “써보고 싶다”

7월 23, 2025

자연과학, 공학, 의학, 경영학분야 특화 대학교인 임페리얼 칼리지 런던의 연구진이 실시한 대규모 조사에 따르면, 영국 성인 천식 환자의 53%가 메시징 서비스를 통한 천식 관리…

Evaluating evidence-based health information from generative AI using a cross-sectional study with laypeople seeking screening information

AI한테 건강 정보 묻지 마세요… 챗GPT 제공 건강 정보 “수준 미달”

6월 10, 2025

Evaluating evidence-based health information from generative AI using a cross-sectional study with laypeople seeking screening information 챗GPT, 구글 제미나이 등 주요 AI 모델, 증거기반…

“2시간이 20분으로” 기업들의 생성형 AI 활용 실태와 미래 전략

“2시간 걸리던 업무가 20분으로” 기업들의 생성형 AI 활용 실태와 미래 전략

5월 21, 2025

Generative AI for Business: Successes, Challenges, and the future “2시간 걸리던 업무가 20분으로” – 생성형 AI로 기업 업무 효율 혁신 기술 산업을 위한 시장…

State of Hybrid Work 2024: United States

매일 AI 도구 사용하는 직장인 47%… “하이브리드 근무 환경에서 AI가 필수 도구”

5월 21, 2025

State of Hybrid Work 2024: United States 미국 직장인 47%가 일상적으로 AI 도구 활용 중 화상 회의 기술 전문 기업 Owl Labs의 새로운 데이터…

Trust and transparency

공공 부문, AI로 부정부패 척결한다… 5년 내 97% 도입 전망

5월 21, 2025

Trust and transparency: Combating fraud to maximize public program efficiency 정부 기관 85%, 부정부패 척결이 최우선 과제…AI 기술로 예산 16% 절감 기대 정부와 공공기관들이…

MIT, AI 생산성 이점에 관한 박사과정 학생 논문 공식 철회 선언… 데이터 신뢰성 의혹 제기

MIT, AI 생산성 이점에 관한 박사과정 학생 논문 공식 철회 선언… 데이터 신뢰성 의혹 제기

5월 19, 2025

테크크런치가 17일(현지 시간) 보도한 내용에 따르면, MIT가 인공지능의 연구 및 혁신 효과에 관한 논문의 “무결성” 문제로 이 논문이 “공개 담론에서 철회되어야 한다”고 발표했다. 문제가…

What does the market research industry make of AI and synthetic data?

시장조사 전문가들이 AI는 받아들이면서 합성 데이터는 거부하는 이유

5월 8, 2025

What does the market research industry make of AI and synthetic data? 직무별 격차 뚜렷: 연구 직책 AI 활용 7~11% 높고, 프로젝트 매니저는 46%로…

Fact-checking with Generative AI: A Systematic Cross-Topic Examination of LLMs Capacity to Detect Veracity of Political Information

코로나19에선 정확, 경제는 취약? 5대 AI 모델의 팩트체킹 능력 비교

3월 14, 2025

Fact-checking with Generative AI: A Systematic Cross-Topic Examination of LLMs Capacity to Detect Veracity of Political Information LLM, 거짓 정보 탐지에는 강하지만 전반적 성능은…

AUDITING LANGUAGE MODELS FOR HIDDEN OBJECTIVES

당신의 AI는 진짜 당신의 뜻대로 움직일까? 앤트로픽, 숨겨진 AI 목표 탐지 기법 공개

3월 14, 2025

AUDITING LANGUAGE MODELS FOR HIDDEN OBJECTIVES AI의 이중생활: 표면적 순응 속 숨겨진 ‘보상 모델 아첨’ 목표 발견 인공지능(AI)이 겉으로는 우리가 원하는 대로 행동하지만, 내면에서는…

Monitoring Reasoning Models for Misbehavior and the Risks of Promoting Obfuscation

AI도 ‘생각’을 감추려 한다… 오픈AI, 위험한 AI 행동 95% 감지 가능한 기술 공개

3월 12, 2025

Monitoring Reasoning Models for Misbehavior and the Risks of Promoting Obfuscation 강력한 AI 모델의 ‘생각 과정’ 모니터링, 95% 정확도로 AI 오용 감지 최근 OpenAI…

마이크로소프트(Microsoft), AI 환각 현상 해결책 특허 출원... "외부 지식으로 AI 오류 잡는다"

마이크로소프트, AI 환각 현상 해결책 특허 출원… “외부 지식으로 AI 오류 잡는다”

11월 19, 2024

PCMag의 보도에 따르면, 마이크로소프트가 인공지능(AI)의 환각 현상이나 잘못된 응답을 줄이거나 방지할 수 있는 기술적 방법에 대한 특허를 출원했다. ‘외부 지식과 피드백을 활용한 언어 모델…

Limitations and Loopholes in the EU AI Act and AI Liability Directives: What This Means for the European Union, the United States, and Beyond

EU, AI법 책임성 강화해야…”현행 규제안으론 AI 위험 통제 역부족”

11월 15, 2024

유럽연합(EU)의 인공지능(AI) 규제가 현실적 실효성을 확보하지 못하고 있다는 비판적 분석이 제기됐다. 옥스포드 인터넷연구소의 산드라 바흐터(Sandra Wachter) 교수는 최근 예일대 법학기술저널에 발표한 논문을 통해 “EU의…

생성형 AI의 부상, Q&A 플랫폼 사용자 이탈 가속화하나

생성형 AI의 부상, Q&A 플랫폼 사용자 이탈 가속화하나

8월 26, 2024

최근 챗GPT(ChatGPT)와 같은 생성형 인공지능(AI)의 급격한 발전으로 지식 검색 시장에 큰 변화의 바람이 불고 있다. 항저우전자과기대학교 연구팀이 최근 발표한 연구 결과에 따르면, 생성형 AI의…

AI신뢰성 – AI 매터스