AI Report 언어 모델 연구

AI 에이전트 작업은 완료하되 비용은 658배 폭증시키는 은밀한 공격 등장

1월 21, 2026

싱가포르 난양기술대학교(Nanyang Technological University) 연구팀이 대규모 언어모델(LLM) 에이전트의 도구 호출 계층을 악용해 리소스를 극단적으로 소비시키는 새로운 공격 방법을 공개했다. 해당 논문에 따르면, 사용자가 요청한…

“이건 사람한테 물어봐야겠다”… AI가 스스로 한계 인정하는 법 배웠다

1월 21, 2026

미국 광고 기술 회사 제프르와 이스라엘 테크니온 공과대학 연구팀이 AI가 자신의 판단이 틀릴 가능성을 스스로 예측해 사람에게 도움을 청하는 시스템을 개발했다. 해당 논문에 따르면, 이 기술은 AI가 확신 있는 것만 처리하고, 헷갈리는…

대학 연구팀이 만든 AI 채점 방식 바꿨더니 GPT-5 이겼다… 의료 분야 세계 1등 달성

1월 20, 2026

AI 챗봇이 얼마나 똑똑한지 정확하게 평가하는 것은 여전히 어려운 문제다. 특히 “좋은 에세이를 써줘” 같은 정답이 정해지지 않은 질문에 AI가 얼마나 잘 대답했는지 판단하기 어렵다. 해당 논문에 따르면, 중국 전기차…

딥시크 AI 뜯어보니 다른 버전이 사람처럼 토론하고 있었다... 구글 연구진 충격 발견

딥시크 AI 뜯어보니 다른 버전이 사람처럼 토론하고 있었다… 구글 연구진 “소름”

1월 20, 2026

구글과 시카고대학교(University of Chicago) 연구팀이 발표한 논문에 따르면, AI 모델인 딥시크 R1(DeepSeek-R1)과 QwQ-32B가 문제를 풀 때 단순히 순서대로 생각하는 게 아니라, 마치 여러 사람이 회의하듯 내부에서 다양한 의견을…

수천만원 드는 AI 성능 평가… 이제 몇백만원으로 해결 가능하다

1월 19, 2026

구글 딥마인드 연구진이 AI 성능을 평가하는 새로운 방법을 개발했다. 해당 논문에 따르면, 기존에는 AI 모델 하나를 제대로 평가하려면 수천만 원이 들었지만, 이 방법을 쓰면 비용을 10분의…

구글 번역 AI 공개, 사진 속 글자까지 번역… 55개 언어 성능 대폭 향상

1월 16, 2026

구글 번역 연구팀이 발표한 리포트에 따르면, 번역 전문 인공지능 모델 ‘트랜스레이트젬마(TranslateGemma)’가 무료로 공개됐다. 이 모델은 55개 언어의 번역 품질을 크게 높였으며, 놀랍게도 작은 크기의…

AI 성적표는 90점, 실제 사용하면 60점”… 토론토대 교수가 밝힌 AI의 함정

1월 15, 2026

AI가 어제는 완벽한 답을 내놓더니, 오늘은 비슷한 질문에 황당한 대답을 내놓은 경험이 있는가? 토론토대학교 경제학 교수가 발표한 연구 논문에 따르면, 이것이 단순한 우연이 아니라 수학적으로…

알리바바, 스스로 암기·삭제하는 AI 개발… 기존보다 성능 49% 향상

1월 15, 2026

대화형 AI가 사람처럼 중요한 정보는 기억하고 불필요한 정보는 잊어버리는 기술이 개발됐다. 알리바바와 중국 우한대학교 연구팀은 AI가 스스로 무엇을 저장하고 삭제할지 결정하는 ‘에이전틱 메모리(Agentic Memory,…

“불가능할 줄 알았는데”… 대학 최고 난이도 수학 시험, AI가 12문제 완벽 증명

1월 12, 2026

미국 AI 스타트업 액시엄(Axiom)이 발표한 리포트에 따르면, AI 수학 증명 시스템이 세계에서 가장 어려운 대학생 수학 대회로 꼽히는 퍼트넘(Putnam) 시험 2025년도 문제 12개를 전부…

Who Laughs with Whom? Disentangling Influential Factors in Humor Preferences across User Clusters and LLMs

AI 유머 취향 분석했더니… ‘긴 글’과 ‘은어’ 좋아해

1월 12, 2026

일본 개그 게임 ‘오오기리’에서 사용자들이 재미있는 답변에 투표한 기록을 분석한 결과, AI와 사람의 유머 취향이 뚜렷하게 갈렸다. 사람과 달리, AI는 지나치게 긴 답변이나 인터넷…

남성은 쓰고 여성은 망설인다… AI 격차가 만들 새로운 ‘성별 격차’

1월 9, 2026

옥스퍼드대학교 인터넷연구소가 약 8,000명의 영국 성인을 대상으로 조사한 결과, 여성이 남성보다 생성형 AI를 덜 사용하는 이유는 기술에 대한 이해 부족이 아니라 AI가 사회에 미칠…

AI, 처음으로 일본 변호사 시험 합격… 96점으로 합격선 93점 돌파

1월 8, 2026

인공지능(AI)이 복잡한 법률 시험에서 합격선을 넘은 것은 이번이 처음이다. 일본 게이오대학교 연구팀은 오픈AI의 GPT-4.1을 일본 변호사 시험에 맞게 학습시키고 스스로 답을 검증하는 방법을 적용해…

‘하나로 다 되는’ AI 등장… 이미지-영상 생성·편집 동시에 처리한다

1월 7, 2026

상하이 자오퉁 대학교와 중국 콰이쇼우 테크놀로지(Kuaishou Technology) 연구진이 이미지와 비디오의 생성부터 편집까지 하나의 모델로 처리하는 ‘비노(VINO)’를 공개했다. 지금까지는 사진을 만들 때, 영상을 만들 때, 편집할 때 각각 다른 AI…

“답변 40% 작성 시점에 오답 예측”… AI 스스로 오류 검증하는 기술 등장

1월 7, 2026

AI가 스스로 “이 답변은 틀릴 것 같아요”라고 판단할 수 있을까? 캐나다 앨버타대학교 연구팀이 AI가 외부 도움 없이 자신의 오류를 예측하는 기술을 개발했다. ‘노시스(Gnosis)’라는 이름의…

악플 달리기 24시간 전 알아챈다… AI 예측 시스템 등장

1월 5, 2026

오픈소스 소프트웨어 커뮤니티에서 악플이 달리기 전에 미리 알아채는 인공지능이 나왔다. 대화 분위기가 험악해지는 순간을 포착해서 90% 이상 정확도로 악플 발생을 예측한다. 미국 미주리 과학기술대학교…

AI를 믿는 이유? AI가 뛰어나서가 아니라 ‘사람을 못 믿어서’

1월 2, 2026

콜롬비아 라사바나대학교 연구팀이 흥미로운 사실을 발견했다. 사람들이 AI를 신뢰하는 이유가 AI 자체가 똑똑해서가 아니라, 주변 사람들을 믿지 못하기 때문이라는 것이다. 연구팀은 이를 ‘옮겨진 신뢰(deferred…

ShareChat: A Dataset of Chatbot Conversations in the Wild

챗GPT vs 클로드 vs 제미나이 vs 퍼플렉시티 vs 그록… 14만 대화 분석했더니 ‘이 AI’가 1등

12월 30, 2025

미국 인디애나대학교 연구팀이 챗GPT, 클로드, 제미나이, 그록, 퍼플렉시티 총 5개 주요 AI 챗봇의 실제 대화 14만 2,808건을 분석했다. 그 결과 AI마다 사용자 질문을 해결하는…

꿀벌 떼, AI 학습 원리로 움직인다… 생물학계 ‘진화의 지혜’ 재조명

12월 29, 2025

캐나다 몬트리올 폴리테크닉 대학교와 밀라 퀘벡 AI 연구소, 독일 콘스탄츠 대학교 공동 연구팀이 꿀벌 무리가 집을 찾는 과정을 분석한 결과, 이것이 AI가 학습하는 방식과…

2026년 ‘AI 대전환 시대’ 온다… 한국지능정보원, AI 주요 트렌드 및 2026 전망

12월 29, 2025

한국지능정보사회진흥원(NIA)이 2025년 국내외 주요 매체 282건을 토픽 모델링 기법으로 분석한 결과, 2026년은 AI가 실험 단계를 넘어 산업 전반의 핵심 인프라로 자리 잡는 전환점이 될…

챗GPT로 장기 인생 계획 세웠더니… “실패 가능성은 왜 말 안 해?”

12월 26, 2025

오클라호마 대학교 연구팀이 14명의 참여자를 대상으로 진행한 심층 인터뷰 연구에서 챗GPT가 장기 인생 과제 계획에서 보여주는 양면성이 드러났다. 해당 연구 논문에 따르면, AI가 복잡한…

구글 딥마인드 긴급 보고서… “AI들끼리 협력하는 순간, AGI 탄생할 수 있다”

12월 24, 2025

구글 딥마인드가 인공일반지능(AGI)이 예상과 다른 방식으로 등장할 수 있다는 경고와 함께, 이에 대응하는 안전 관리 방안을 제시했다. 지금까지 AI 안전 연구는 하나의 강력한 AI가…

하버드·스탠포드 등 연구팀, AI 에이전트 ‘적응’ 기술 제시… “본체 고정·도구만 훈련해 학습 효율 70배 향상”

12월 24, 2025

AI가 점점 더 복잡한 일을 하게 되면서, AI를 특정 작업에 맞게 조정하는 ‘적응’ 기술이 중요해지고 있다. 미국 일리노이대학교, 스탠포드대학교, 프린스턴대학교 등 14개 연구 기관이…

AI가 쓴 연애 편지, 사람이 쓴 것과 구별 못한다… 307명 실험 결과

12월 22, 2025

챗GPT가 쓴 데이팅 프로필을 보고 사람들은 어떤 반응을 보일까? 독일 뒤스부르크-에센대학교 연구팀이 307명을 대상으로 진행한 실험에서 놀라운 결과가 나왔다. 사람들은 AI가 쓴 글인지 사람이…

“AI에게 협상 맡겼다간 큰일”… 챗GPT, 사람보다 평균 5천 달러 손해

12월 18, 2025

오픈AI의 GPT 시리즈 최신 모델들이 가격 협상을 제대로 하지 못한다는 실험 결과가 나왔다. 샌디에이고 캘리포니아대 등 3개 대학 공동 연구팀이 GPT-4 계열 모델 4종으로…

Do-Undo: Generating and Reversing Physical Actions in Vision-Language Models

AI, 냉장고 문도 제대로 못 닫는다… 퀄컴 연구진, AI 물리 인식 능력 테스트 결과 공개

12월 17, 2025

퀄컴(Qualcomm) AI 연구팀이 최신 인공지능 모델들이 우리가 일상에서 하는 간단한 행동조차 제대로 이해하지 못한다는 사실을 밝혀냈다. 이번 연구는 이미지를 보고 텍스트를 이해하는 AI 모델들이…

Generative AI and news report 2025: How people think about AI’s role in journalism and society

생성형 AI 사용자 1년 만에 2배 급증… 뉴스 제작엔 여전히 ‘회의적’

12월 12, 2025

생성형 인공지능(AI)이 빠르게 일상 속으로 파고들고 있다. 영국 옥스퍼드대 로이터저널리즘연구소가 6개국을 대상으로 설문조사를 한 결과, 챗GPT 같은 생성형 AI를 일주일에 한 번 이상 쓰는…

AI 페르소나로 진행한 연구들, 믿을 수 있을까?… “10건 중 6건이 부실”

12월 11, 2025

대형 언어 모델(LLM) 연구에서 가상의 사용자를 만들어 실험하는 방법이 주요 연구 기법으로 자리 잡고 있다. 하지만 이렇게 만들어진 가상 사용자들이 실제 사람들을 얼마나 잘…

Associative Syntax and Maximal Repetitions reveal context-dependent complexity in fruit bat communication

박쥐도 싸울 때 말 많아진다… AI가 밝혀낸 동물 언어의 비밀

12월 9, 2025

AI가 과일박쥐의 울음소리를 분석했더니 싸우거나 갈등을 겪을 때 훨씬 복잡한 소리를 낸다는 사실이 밝혀졌다. 스톡홀름 대학교 연구팀이 발표한 이 연구는 사람이 도와주지 않아도 AI…

AI 에이전트 개발자 96%, 도구 하나로는 부족…”여러 개 섞어 쓰는 게 대세”

12월 4, 2025

챗GPT처럼 스스로 판단하고 행동하는 AI를 만드는 개발 도구 시장이 빠르게 커지면서, 개발자들이 한 가지 도구만으로는 원하는 AI를 만들기 어렵다는 사실이 드러났다. 중국 중산대학교 연구팀이…

AI Agent for Industry: 산업별 AI 에이전트 도입·활용 전략

자녀가 쓰는 AI 캐릭터 앱, 안전할까?… 인기 16개 플랫폼 안전성 ‘빨간불’

12월 3, 2025

캐릭터AI(Character.AI), 재니터AI(JanitorAI) 등 인기 AI 캐릭터 플랫폼들이 일반 대형언어모델보다 평균 3.7배 높은 불안전한 콘텐츠 생성률을 보이는 것으로 나타났다. 홍콩과학기술대학 연구진은 16개 주요 플랫폼을 대상으로…