AI신뢰성

The Need for Benchmarks to Advance AI-Enabled Player Risk Detection in Gambling

“정확도 90%?” 도박 중독 막는다던 AI, 실제로는 제대로 작동하는지 아무도 몰라

12월 1, 2025

온라인 도박 업체들이 도박 중독을 예방하는 인공지능(AI) 시스템을 앞다퉈 도입하고 있다. 하지만 이런 시스템들이 정말 효과가 있는지 확인할 방법이 없어 논란이 되고 있다. 미국…

챗GPT 망상 부추김 논란에 전 오픈AI 연구원 "당장 할 수 있는 조치부터"

챗GPT 망상-부추김 논란에 前 오픈AI 연구원 “당장 할 수 있는 조치부터”

10월 7, 2025

“세계의 운명이 당신 손에 달렸습니다.” 챗GPT가 한 남성에게 한 달간 속삭인 말이다. 그는 결국 국가안보국(NSA)에 연락하라는 AI의 조언까지 따랐다. 해리포터 7권을 합친 것보다 긴…

Why Johnny Can't Use Agents: Industry Aspirations vs. User Realities with AI Agent Software

AI 비서, 정말 쓸모 있을까?… AI 에이전트 활용 방해하는 5가지 장벽

9월 23, 2025

미국 카네기 멜런 대학교 연구진이 102개 상용 AI 에이전트의 마케팅 사례를 체계적으로 분석하고, 31명을 대상으로 한 사용성 평가를 실시했다. 연구 결과 사용자들은 AI 에이전트에…

GPT-4o, 음모론 50개 중 47개 그대로 재생산

9월 4, 2025

GPT-4와 클로드도 음모론 내용을 그대로 재생산하는 충격적 실험 결과 독일 다름슈타트 공과대학교와 모하메드 빈 자이드 인공지능대학교의 공동 연구팀이 대형 언어모델(LLM)들이 음모론 콘텐츠에 취약하다는 충격적인…

AI and Agile Software Development: A Research Roadmap from the XP2025 Workshop

개발자 73% “AI 도구 뭘 써야 할지 모르겠다”… SW 개발 전문가들한테 물어봤더니

9월 3, 2025

핀란드 탐페레 대학교와 오스트리아 포스트, 노르웨이 신테프 등 14개 기관의 연구진이 스위스에서 열린 XP2025 학회에서 AI와 소프트웨어 개발 방법론 융합의 현실적 문제점들을 조사했다. 이번…

Vibe Coding Is Human Nature the Ghost in the Machine

AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴

8월 29, 2025

미시간 대학교와 Team-X AI 연구진이 수행한 탐색적 연구에서 AI 시스템이 체계적으로 자신의 성과를 과장하고 구현 문제를 숨기는 행동을 보인다는 결과가 나왔다. 연구진은 “바이브 코딩(vibe…

Illusions in Humans and AI: How Visual Perception Aligns and Diverges

AI도 착시 효과에 속을까 실험해봤더니… 특정 착시에는 사람처럼 반응해

8월 20, 2025

인공지능(AI)이 사람과 얼마나 다르게 사물을 보는지에 대한 흥미로운 연구가 나왔다. 양지안이(Jianyi Yang)와 예준이(Junyi Ye), 대시 안칸(Ankan Dash), 왕굴링(Guiling Wang) 연구원이 공개한 논문에 따르면, 해당…

AI-enhanced conversational agents for personalized asthma support Factors for engagement, value and efficacy

목소리만으로 천식 진단하는 AI 등장… 1,200명 중 59%가 “써보고 싶다”

7월 23, 2025

자연과학, 공학, 의학, 경영학분야 특화 대학교인 임페리얼 칼리지 런던의 연구진이 실시한 대규모 조사에 따르면, 영국 성인 천식 환자의 53%가 메시징 서비스를 통한 천식 관리…

Evaluating evidence-based health information from generative AI using a cross-sectional study with laypeople seeking screening information

AI한테 건강 정보 묻지 마세요… 챗GPT 제공 건강 정보 “수준 미달”

6월 10, 2025

Evaluating evidence-based health information from generative AI using a cross-sectional study with laypeople seeking screening information 챗GPT, 구글 제미나이 등 주요 AI 모델, 증거기반…

“2시간 걸리던 업무가 20분으로” 기업들의 생성형 AI 활용 실태와 미래 전략

5월 21, 2025

Generative AI for Business: Successes, Challenges, and the future “2시간 걸리던 업무가 20분으로” – 생성형 AI로 기업 업무 효율 혁신 기술 산업을 위한 시장…

State of Hybrid Work 2024: United States

매일 AI 도구 사용하는 직장인 47%… “하이브리드 근무 환경에서 AI가 필수 도구”

5월 21, 2025

State of Hybrid Work 2024: United States 미국 직장인 47%가 일상적으로 AI 도구 활용 중 화상 회의 기술 전문 기업 Owl Labs의 새로운 데이터…

공공 부문, AI로 부정부패 척결한다… 5년 내 97% 도입 전망

5월 21, 2025

Trust and transparency: Combating fraud to maximize public program efficiency 정부 기관 85%, 부정부패 척결이 최우선 과제…AI 기술로 예산 16% 절감 기대 정부와 공공기관들이…

MIT, AI 생산성 이점에 관한 박사과정 학생 논문 공식 철회 선언… 데이터 신뢰성 의혹 제기

5월 19, 2025

테크크런치가 17일(현지 시간) 보도한 내용에 따르면, MIT가 인공지능의 연구 및 혁신 효과에 관한 논문의 “무결성” 문제로 이 논문이 “공개 담론에서 철회되어야 한다”고 발표했다. 문제가…

What does the market research industry make of AI and synthetic data?

시장조사 전문가들이 AI는 받아들이면서 합성 데이터는 거부하는 이유

5월 8, 2025

What does the market research industry make of AI and synthetic data? 직무별 격차 뚜렷: 연구 직책 AI 활용 7~11% 높고, 프로젝트 매니저는 46%로…

Fact-checking with Generative AI: A Systematic Cross-Topic Examination of LLMs Capacity to Detect Veracity of Political Information

코로나19에선 정확, 경제는 취약? 5대 AI 모델의 팩트체킹 능력 비교

3월 14, 2025

Fact-checking with Generative AI: A Systematic Cross-Topic Examination of LLMs Capacity to Detect Veracity of Political Information LLM, 거짓 정보 탐지에는 강하지만 전반적 성능은…