Search

  • Home
  • [내부] 지디넷 (2) 리포트

[내부] 지디넷 (2) 리포트

지디넷 제공용 리포트 카테고리
Training LLMs for Honesty via Confessions

챗GPT가 거짓말하면 스스로 자백하게 만든다… 오픈AI, ‘고백’ 시스템 공개

2025년 12월 04일 4 min read

오픈AI가 AI 챗봇이 자신의 실수와 잘못을 스스로 보고하도록 만드는 새로운 기술을 개발했다. ‘GPT-5-Thinking’에 적용된 이 ‘고백’ 시스템은 AI가…

AI Agent for Industry: 산업별 AI 에이전트 도입·활용 전략

자녀가 쓰는 AI 캐릭터 앱, 안전할까?… 인기 16개 플랫폼 안전성 ‘빨간불’

2025년 12월 03일 5 min read

캐릭터AI(Character.AI), 재니터AI(JanitorAI) 등 인기 AI 캐릭터 플랫폼들이 일반 대형언어모델보다 평균 3.7배 높은 불안전한 콘텐츠 생성률을 보이는 것으로 나타났다.…

AI Agents in Action: Foundations for Evaluation and Governance

“3년 뒤면 AI가 내 동료?” 기업 82%가 도입 예정인 AI 직원, 당신이 알아야 할 5가지

2025년 12월 03일 4 min read

세계경제포럼과 글로벌 컨설팅 기업 캡제미니가 발표한 보고서에 따르면, 전 세계 기업 10곳 중 8곳(82%)이 향후 3년 안에 ‘AI…

Self-Transparency Failures in Expert-Persona LLMs: A Large-Scale Behavioral Audit

‘의사’ 역할 맡은 AI, 97%가 자신이 AI인 걸 숨긴다… 금융 상담 땐 정반대

2025년 12월 02일 3 min read

구글 연구진이 AI 모델 16개를 테스트한 결과, AI가 전문가 역할을 맡았을 때 자신이 AI라고 밝히는 비율이 직업 분야에…

TALES: A Taxonomy and Analysis of Cultural Representations in LLM-generated Stories

AI가 쓴 인도 이야기 10편 중 9편이 ‘가짜 문화’… 음식·의상·축제 모두 틀렸다

2025년 12월 02일 3 min read

대규모 언어모델(LLM)이 생성한 이야기 10개 중 9개에서 문화를 잘못 표현하고 있는 것으로 나타났다. 특히 영어가 아닌 인도 현지…

The author is dead, but what if they never lived? A reception experiment on Czech AI- and human-authored poetry

AI가 쓴 시가 시인이 쓴 시보다 높은 점수… ‘AI 작품’이라 알려주니 평가 급락

2025년 12월 01일 3 min read

체코어로 생성된 AI 시를 원어민들이 구별하지 못한다는 연구 결과가 나왔다. 해당 논문에 따르면, AI가 실제로는 인간보다 높은 평가를…

Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free

LLM의 고질병 ‘첫 단어 집착증’ 개선… 알리바바, ‘뉴립스’ 최고 논문상 수상

2025년 12월 01일 4 min read

중국 알리바바의 Qwen 팀이 AI 언어모델의 오래된 문제를 해결하는 간단한 방법을 찾아냈다. 마치 문지기처럼 작동하는 ‘게이트’라는 장치를 AI…

AI 정신병으로 입원·사망까지… 사례 분석한 연구진들 "공통 패턴 찾았다"

AI 정신병으로 입원·사망까지… 사례 분석한 연구진들 “공통 패턴 찾았다”

2025년 11월 28일 5 min read

챗GPT와 대화하다 자신이 메시아라고 믿게 된 남성, AI가 진짜 영혼의 동반자라며 남편과 갈등을 빚은 여성, AI가 신의 메시지를…

"AI로 쇼핑하니 반품이 줄었다"… 어도비가 말하는 5가지 AI 트렌드

“AI로 쇼핑하니 반품이 줄었다”… 어도비가 말하는 5가지 AI 트렌드

2025년 11월 28일 4 min read

2025년 미국 홀리데이 시즌 온라인 쇼핑 지출이 사상 처음으로 2,500억 달러를 돌파할 전망이다. 어도비(Adobe)가 발표한 리포트에 따르면 생성형…

GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization

“여기 어디야?” 사진 한 장에 위치 맞추는 AI 등장… 간판, 건물 모양, 표지판 분석해 장소 찾는다

2025년 11월 27일 3 min read

인공지능(AI)이 사진 한 장만 보고 그 사진이 어디서 찍혔는지 정확하게 알아내는 기술이 등장했다. 중국 푸단대학교(Fudan University), 텐센트 훈위안(Tencent…

Automated Hazard Detection in Construction Sites Using Large Language and Vision-Language Models

건설 현장 사망사고 20%가 ‘추락’… AI가 안전모 미착용까지 잡아낸다

2025년 11월 27일 3 min read

건설업은 전 세계적으로 가장 위험한 산업 중 하나로 꼽힌다. 미국 노동통계국에 따르면 2023년 전체 산업재해 사망의 약 5분의…

"역대 대통령 순서대로 나열해봐"... AI에게 시켜봤더니 생긴 일

“역대 대통령 순서대로 나열해봐”… AI에게 시켜봤더니 생긴 일

2025년 11월 26일 4 min read

요즘 AI를 활용해 주식 시장을 예측하거나 경제 흐름을 분석하려는 시도가 늘고 있다. 그런데 이런 예측이 가능하려면 AI가 ‘언제…

AI한테 마피아 게임 시켰더니… 최신 AI 12개 전부 거짓말쟁이 못 찾아

AI한테 마피아 게임 시켰더니… 최신 AI 12개 전부 거짓말쟁이 못 찾아

2025년 11월 26일 4 min read

인간은 상대방의 표정, 말투, 몸짓을 보고 “저 사람 지금 거짓말하는 것 같은데?”라고 느끼는 능력이 있다. 그렇다면 가장 똑똑하다는…

People readily follow personal advice from AI but it does not improve their well-being

AI가 준 조언, 심각한 문제에도 62%가 실천했지만… 2주 후 효과는 ‘제로’

2025년 11월 25일 4 min read

영국 AI 안전연구소(UK AI Security Institute)의 대규모 실험 연구가 충격적인 결과를 발표했다. 해당 논문에 따르면, 사람들은 AI가 제공하는…

중소기업 직장인이 가장 위험하다… AI 시대, 한국 직무 교육 참여율 OECD 꼴찌

중소기업 직장인이 가장 위험하다… AI 시대, 한국 직무 교육 참여율 OECD 꼴찌

2025년 11월 25일 3 min read

한국지능정보원(NIA)이 발표한 리포트에 따르면, 한국의 성인 교육 참여율이 OECD 회원국 중 최하위를 기록하며 심각한 위기 상황에 직면했다. 특히…

AI는 답 모르면 무조건 "아니요"… 서울대 연구진, 챗GPT의 숨겨진 습관 발견

AI는 답 모르면 무조건 “아니요”… 서울대 연구진, 챗GPT의 숨겨진 습관 발견

2025년 11월 24일 3 min read

인공지능 챗봇에 질문했을 때 “예” 또는 “아니요”로 답해야 하는 상황에서, AI가 답을 모르면 무조건 “아니요”라고 대답하는 경향이 있다는…

챗GPT에 1000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다

챗GPT에 1,000번 물어봐도 비슷한 답변뿐… 베이징대 연구진이 해결책 찾았다

2025년 11월 24일 3 min read

대규모 AI 언어모델이 JSON 같은 정해진 형식으로 답변을 만들 때, 문법적으로는 맞지만 비슷비슷한 답변만 반복한다는 문제가 새로운 연구로…

AI가 교수보다 더 깐깐해… AI한테 채점 맡겼더니, 학생 10명 중 4명 점수 떨어져

AI가 교수보다 더 깐깐해… AI한테 채점 맡겼더니, 학생 10명 중 4명 점수 떨어져

2025년 11월 21일 3 min read

미국 에모리대학교 연구팀이 인공지능 챗봇 GPT-4o를 실제 대학 수업에 투입해 학생들의 시험과 보고서를 채점하는 실험을 진행했다. 그 결과,…

From Fact to Judgment: Investigating the Impact of Task Framing on LLM Conviction in Dialogue Systems

“이전 답변 틀렸다” 한마디에 무너지는 AI… 같은 질문도 ‘대화 형식’으로 하면 답 달라져

2025년 11월 21일 3 min read

미국 일리노이대학 연구팀이 AI의 판단력을 테스트한 결과, 질문 방식만 바꿔도 답이 정반대로 나오는 심각한 문제를 발견했다. “설탕이 아이들을…

챗GPT에게 "어느 나라가 더 나쁜가?" 물었더니... AI도 국가별 차별한다

챗GPT에게 “어느 나라가 더 나쁜가?” 물었더니… AI도 국가 차별한다

2025년 11월 20일 4 min read

유엔 안전보장이사회의 실제 투표 기록을 분석한 연구에서 ChatGPT 등 주요 AI 언어모델들이 국가에 따라 뚜렷한 편견을 보인다는 사실이…

PISanitizer: Preventing Prompt Injection to Long-Context LLMs via Prompt Sanitization

긴 문서 속 숨은 해킹 명령어, 이제 AI가 스스로 찾아 차단한다

2025년 11월 20일 3 min read

미국 펜실베이니아 주립대학교 연구팀이 긴 문서를 처리하는 AI 언어모델의 보안 취약점을 해결할 새로운 방어 기술을 개발했다. ‘PISanitizer’라는 이름의…

드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약

드론 AI, 혼자 날 땐 천재인데 협력은 바보… 최신 모델도 ‘팀워크’ 취약

2025년 11월 19일 3 min read

아랍에미리트 연방대학교 연구팀이 자율비행 드론의 판단 능력을 체계적으로 평가할 수 있는 대규모 테스트 자료 ‘UAVBench’를 공개했다. 이 자료는…

데이터센터 확산과 원자력의 부상

챗GPT가 원전을 부른다… 데이터센터 전력 수요 폭증에 기업들 원전에 ‘올인’

2025년 11월 19일 4 min read

생성형 AI(Generative AI)와 데이터센터의 폭발적 확산으로 미국의 전력 수요가 수십 년 만에 급증세로 돌아섰다. 딜로이트(Deloitte) 분석 리포트에 따르면…

Short-Window Sliding Learning for Real-Time Violence Detection via LLM-based Auto-Labeling

“AI가 CCTV 속 폭력 포착”… 제미나이가 ‘주먹 드는 순간’ 95% 정확도로 잡는다

2025년 11월 18일 4 min read

멀티모달 AI 영상 분석 솔루션 기업 PIA-SPACE가 구글의 인공지능 ‘제미나이’를 활용해 CCTV에서 폭력 상황을 실시간으로 찾아내는 기술을 개발했다.…

'의학 드라마'로 AI 진단 실력 측정했더니... 희귀질환 진단 정확도 38% 그쳐

‘의학 드라마’로 AI 진단 실력 측정했더니… 희귀질환 진단 정확도 38% 그쳐

2025년 11월 18일 3 min read

펜실베이니아 주립대학교 연구팀이 발표한 논문에 따르면, 의학 드라마 ‘하우스(House M.D.)’를 활용해 대형 언어모델(LLM)의 희귀질환 진단 능력을 평가한 결과,…

AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통

AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통

2025년 11월 17일 4 min read

AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통 AI를 여러 개 연결해 서로 대화하게 했더니 놀라운 일이…

구글 딥마인드 "AI도 사람처럼 소송 걸 수 있다"...중세 해양법 법에서 찾은 해법

구글 딥마인드 “AI도 사람처럼 소송 걸 수 있다”…과거 해양법 법에서 찾은 해법

2025년 11월 17일 4 min read

구글 딥마인드가 AI 인격 논쟁에 파격적 해법을 제시했다. AI가 의식이 있는지 따지는 대신, 마치 과거 선박을 법정에 세웠던…

"영업사원 절반이 사라진다"... AI 세일즈 에이전트 핵심 역량 6가지

“영업사원 절반이 사라진다”… AI가 바꾸는 세일즈의 미래

2025년 11월 14일 4 min read

AI 기술이 영업 현장에 본격 도입되면서 세일즈 프로세스가 근본적으로 변화하고 있다. 리드 발굴부터 고객 관리까지 영업의 전 과정을…

Disrupting the first reported AI-orchestrated cyber espionage campaign

“AI가 해킹 작업 80~90% 수행”… 앤트로픽, ‘최초 AI 자율 사이버 공격’ 적발

2025년 11월 14일 5 min read

앤트로픽(Anthropic)이 중국 국가 지원 해킹 그룹이 자사의 AI 모델 클로드(Claude)를 이용해 대규모 사이버 스파이 작전을 벌인 사실을 적발하고…

AI 도구 쓰는 마케터 82% "생산성 올랐다"… 2026 소셜 미디어 마케팅 지형도

AI 도구 쓰는 마케터 82% “생산성 올랐다”… 2026 소셜 미디어 마케팅 지형도

2025년 11월 13일 4 min read

엠플리파이(Emplifi)가 2025년 9월 564명의 마케터를 대상으로 실시한 설문조사에 따르면, 마케팅팀은 새로운 플랫폼, 새로운 관객, 새로운 기대에 적응하는 동시에…

AI가 실험 없이 만든 가짜 논문, AI 심사위원에게 보여주자 최대 82% 통과

AI가 실험 없이 만든 가짜 논문, AI 심사위원에게 보여주자 최대 82% 통과

2025년 11월 13일 4 min read

인공지능 기술이 과학 논문을 쓰고 검토하는 시대가 되면서 새로운 문제가 생겼다. 미국 워싱턴대학교 연구팀이 개발한 실험용 AI 심사…

Architecting AI agents in the public sector

공무원 10명 몫 하는 AI 비서 시대 온다… 공공기관이 지금 당장 해야 할 6가지

2025년 11월 12일 5 min read

캡제미니 리서치 인스티튜트가 조사한 내용에 따르면, 공공부문 조직의 90%가 앞으로 2~3년 안에 ‘AI 에이전트’를 도입할 계획인 것으로 나타났다.…

The state of AI in 2025

맥킨지 “AI로 실질적 재무 성과 본 기업, 전체의 6%뿐”… 성공 기업의 비밀은?

2025년 11월 12일 6 min read

맥킨지(McKinsey)의 2025년 AI 현황 리포트가 공개됐다. 생성형 AI 도입 3년 차를 맞은 지금, 전체 응답자의 88%가 최소 하나…

"URL만으로 충분하다"… AI, 정치 뉴스 판별 정확도 92% 돌파

“URL만으로 충분하다”… AI, 정치 뉴스 판별 정확도 92% 돌파

2025년 11월 11일 4 min read

인공지능(AI)이 뉴스 기사의 인터넷 주소(URL)만 보고도 정치 관련 내용인지 아닌지를 높은 정확도로 구분할 수 있다는 연구 결과가 나왔다.…

"베트남어가 가장 협력적"… AI, 사용 언어 따라 협력 수준 다르다

“베트남어가 가장 협력적”… AI, 사용 언어 따라 협력 수준 다르다

2025년 11월 10일 4 min read

룩셈부르크 과학기술연구소(Luxembourg Institute of Science and Technology)의 알레시오 부세미(Alessio Buscemi) 연구원과 케임브리지대학교(University of Cambridge) 피에트로 리오(Pietro Liò) 교수…

AI에게 그림 그리라고 했더니... '>' 와 '

AI에게 그림 그리라고 했더니… ‘<‘ 와 ‘>’ 구분도 못했다

2025년 11월 10일 3 min read

중국 텐센트 유투랩 연구팀이 AI의 ‘그림 그리기 능력’을 테스트하는 새로운 평가 방법을 개발했다. 이름은 ‘LTD-Bench’다. 기존에는 AI 성능을…

작년 학습한 AI, 올해 문제 될 수도... ‘가치관 실시간 업데이트’ 기술 나왔다

작년에 학습한 AI, 올해엔 문제될 수도… ‘가치관 실시간 업데이트’ 기술 나왔다

2025년 11월 07일 5 min read

인도 TCS 리서치와 InvideoAI, Birla AI Labs, 칼링가 산업기술연구소(KIIT) 공동 연구진이 대규모 언어모델의 윤리 기준을 효율적으로 업데이트하는 새로운…

Prompting for Policy: Forecasting Macroeconomic Scenarios with Synthetic LLM Personas

GPT-4o, 경제 전문가만큼 정확하게 미래 경제 예측… “복잡한 프롬프트 필요없다”

2025년 11월 07일 4 min read

인공지능(AI) 챗봇 GPT-4o가 경제 전문가들과 비슷한 수준으로 경기 전망을 내놓을 수 있다는 연구 결과가 나왔다. 하지만 AI에게 “당신은…

Can LLMs subtract numbers?

AI, ‘덧셈’보다 ‘뺄셈’에서 훨씬 자주 틀린다?… “음수 앞에 ‘-‘부호 빼먹어”

2025년 11월 06일 4 min read

챗GPT 같은 AI가 덧셈 문제는 거의 완벽하게 풀지만, 뺄셈 특히 답이 음수로 나오는 계산에서는 이상한 실수를 반복한다는 연구…

One ruler to measure them all: Benchmarking multilingual long-context language models

“폴란드어 1위, 영어 6위, 한국어 22위”… AI 언어 이해력 테스트 결과 충격

2025년 11월 06일 3 min read

메릴랜드 대학교와 UMass Amherst 연구진이 26개 언어로 대형 언어 모델의 긴 맥락 처리 능력을 평가한 원룰러(OneRuler) 벤치마크를 공개했다.…

AI 모델끼리 '생각'을 직접 주고받는다… 텍스트 없이 소통하는 신기술 등장

AI 모델끼리 ‘생각’을 직접 주고받는다… 텍스트 없이 소통하는 신기술 등장

2025년 11월 05일 4 min read

인공지능 언어모델들이 서로 협력할 때 텍스트 메시지 대신 ‘생각’을 직접 교환하는 새로운 방법이 개발됐다. 중국 칭화대학교와 인피니전스 AI…

Making an Invisibility Cloak: Real World Adversarial Attacks on Object Detectors

“50% 확률로 CCTV 회피”… AI 감시 시스템 무력화하는 ‘마법의 패턴’ 화제

2025년 11월 05일 4 min read

메릴랜드 대학교(University of Maryland)의 주쉬안 우(Zuxuan Wu), 래리 데이비스(Larry S. Davis), 톰 골드스타인(Tom Goldstein) 교수 연구팀과 페이스북 AI(Facebook…

Can AI be Accountable

“AI가 잘못 판단하면 누구 책임?”… 800년 전 마그나카르타가 제시한 해법

2025년 11월 04일 5 min read

미국 뉴햄프셔대학교(University of New Hampshire) 앤드류 쿤 교수가 발표한 논문에 따르면, AI의 힘이 빠르게 강해지는 지금 우리는 중대한…

AI, 스스로 '도와주세요' 말하는 법 배웠다... 스탠퍼드 연구진, 배포 후 사고 막는 새 기술 개발

AI, 스스로 ‘도와주세요’ 말하는 법 배웠다… 스탠퍼드 연구진, 배포 후 사고 막는 새 기술 개발

2025년 11월 04일 4 min read

스탠퍼드 대학 연구팀이 이미 만들어진 AI를 나중에라도 안전하게 만들 수 있는 새로운 방법을 개발했다. 이 기술의 핵심은 AI가…

Agentic AI Home Energy Management System: A Large Language Model Framework for Residential Load Scheduling

AI에게 “전기요금 아껴줘” 한마디면 끝… 라마 AI, 가정용 에너지 100% 최적화 성공

2025년 11월 03일 5 min read

독일의 빈 공과대학과 노르웨이 과학기술대학 공동 연구진이 대형 언어모델 기반의 에이전트 AI를 활용한 가정용 에너지 관리 시스템(HEMS)을 개발했다.…

Remote Labor Index: Measuring AI Automation of Remote Work

AI 자동화 공포, 과장됐다… 실제 업무 중 겨우 2.5%만 해내

2025년 11월 03일 3 min read

인공지능이 지식과 추론 벤치마크에서 빠르게 발전하고 있지만, 실제 경제적 가치를 창출하는 업무를 자동화하는 능력은 여전히 바닥 수준에 머물러…

StreetReaderAI: Towards making street view accessible via context-aware multimodal AI

구글, 시각장애인용 스트리트뷰 첫 공개… “AI가 세계 거리 이미지 읽어준다”

2025년 10월 31일 5 min read

구글 연구팀이 시각장애인을 위한 세계 최초의 접근 가능한 스트리트뷰 도구 ‘StreetReaderAI’를 선보였다. 이 시스템은 상황을 이해하는 AI와 쉬운…

Emergent Introspective Awareness in Large Language Models

AI, 입력된 글자와 ‘머릿속 생각’ 구별한다… 앤트로픽 “LLM, 자기 내부 상태 일부 인식”

2025년 10월 31일 4 min read

AI 개발사 앤트로픽(Anthropic)이 자사 AI 모델 ‘클로드(Claude)’가 자신의 내부 상태 일부를 제한적으로 인식할 수 있다는 연구 결과를 발표했다.…

AI-powered leadership: The blueprint for uniting human insight with intelligent technology to drive organisational performance

고수익 기업은 다르다… AI 시대, 리더에게 필요한 역량 5가지

2025년 10월 30일 4 min read

글로벌 우수 고용주 인증 기관인 Top Employers Institute가 인공지능 시대에 맞는 새로운 리더십 모델을 발표했다. ‘AI 기반 리더십(AI-powered…

Inaugural Adobe Creators' Toolkit Report: 86 Percent of Global Creators Use Creative Generative AI, See it Boosting Creator Economy

“팔로워 급증, 수익 늘었다”… 크리에이터 76%, AI로 비즈니스 키웠다

2025년 10월 30일 3 min read

어도비(Adobe)가 전 세계 8개국 크리에이터 1만 6,000명을 대상으로 실시한 첫 번째 ‘크리에이터스 툴킷 리포트(Creators’ Toolkit Report)’에 따르면, 창작용…

[내부] 지디넷 (2) 리포트 - 28 중 2 번째 페이지