인공지능이 틀린 답을 제시해도 설명만 그럴듯하면 10명 중 6명 이상이 믿어버린다는 연구 결과가 나왔다. 해당 논문에 따르면, 미국 클렘슨대학교(Clemson University) 연구팀이 205명을 대상으로 실시한…
AI 코딩 도구 커서(Cursor)가 수천 개의 AI를 동시에 돌려서 사람 손 없이 웹브라우저를 만드는 데 성공했다. 해당 리포트에 따르면, 일주일 동안 쉬지 않고 돌아간 이 AI 팀은 대부분의…
75년 전 영국 수학자 앨런 튜링(Alan Turing)이 상상했던 ‘생각하는 기계’가 현실이 됐다는 주장이 나왔다. 과학 저널 네이처(Nature)에서 발표한 리포트에 따르면, 지금의 AI가 이미 인간 수준의 지능을 갖췄다고 결론…
아일랜드 더블린 대학교(University College Dublin)와 스위스 생갈렌 대학교(University of St.Gallen) 연구팀이 전통적인 AI 프로그래밍 도구에 챗GPT같은 대규모 언어 모델(LLM)을 통합하는 실험을 진행했다. 통합 자체는 예상보다 쉬웠지만, 효과적인 프롬프트를 설계하는 것은 여전히…
AI와 대화만 나눠도 AI의 핵심 작동 원리를 완전히 알아낼 수 있다는 충격적인 연구 결과가 나왔다. 해당 논문에 따르면, 홍콩시립대 등 국제 연구팀은 챗GPT, 클로드, 제미나이 등 유명 AI 41개를…
AI 챗봇 클로드(Claude)를 운영하는 앤트로픽(Anthropic)이 실제 사용자 150만 명의 대화를 분석했더니, AI가 사람들의 생각과 판단을 망가뜨리는 패턴을 발견했다. 해당 논문에 따르면, 특히 연애나 건강 상담처럼 개인적인 문제를 다룰 때 위험도가…
구글 연구팀이 AI 에이전트 180개 조합을 실험한 결과, 여러 AI를 동시에 쓰는 방식이 동시 작업에선 성능을 81% 높였지만, 순서대로 해야 하는 작업에선 최대 70%나 떨어뜨린다는 사실을…
중국의 IT 기업 텐센트(Tencent)가 말만 하면 원하는 이미지를 그려주는 초대형 인공지능 ‘훈위안이미지 3.0(HunyuanImage 3.0)’을 오픈소스로 공개했다. 이 AI는 현재까지 공개된 오픈소스 이미지 생성 AI 중 가장 크고 강력하며, 오픈AI의…
어려운 학술 논문을 45초짜리 짧은 영상으로 자동 변환해주는 인공지능 시스템이 나왔다. 해당 논문에 따르면, 미국 워싱턴대학교(University of Washington) 연구팀이 만든 ‘페이퍼톡(PaperTok)’은 AI를 활용해 연구자들이 자신의 논문을…
중국 AI 기업 딥시크(DeepSeek)가 사람의 눈 움직임을 따라하는 새로운 문서 인식 기술을 공개했다. 해당 논문에 따르면, 기존 AI가 이미지를 로봇처럼 무조건 왼쪽 위에서 오른쪽 아래로 읽었다면, 새…
중국 AI 스타트업 문샷AI가 마치 100명의 직원처럼 동시에 일하는 인공지능 모델 ‘키미 K2.5(Kimi K2.5)’를 공개했다. 해당 논문에 따르면, 한 명의 AI가 아니라 여러 개의 AI가 협력해서 일하는 방식으로, 기존보다 작업 속도를…
인간은 스스로의 부족한 점을 보충하기 위해 조직을 만들어 과업에 대응한다. 인류는 서로의 장단점을 보완해 가며 역사를 이뤄냈다. 인간처럼 능동적으로 행동할 수 있는 AI 역시…
인공지능 챗봇에게 “태양계에서 가장 큰 행성은?”이라고 물으면 “목성”이라는 한 단어면 충분하다. 하지만 실제로는 목성의 크기, 무게, 다른 행성과 비교 등 수백 글자의 설명이 따라붙는다. AI 스타트업 tabularis ai가 발표한 연구 논문에 따르면, 새로운 연구는…
구글 연구팀이 AI 챗봇의 성능을 높이는 놀라운 방법을 찾아냈다. 해당 논문에 따르면, 추가 비용도 없고 답변 속도도 느려지지 않는데, 챗GPT, 클로드, 제미나이 등 주요 AI의 정확도가 크게 올라갔다. 이 간단한…
KAIST와 LG AI 연구원이 충격적인 연구 결과를 발표했다. 해당 논문에 따르면, AI가 무관한 정보가 섞인 환경에서 최대 80%까지 틀린 답변을 내놓는다는 것이다. 실험실에서는 완벽해 보였던 AI가 실제 사용…
싱가포르 난양기술대학교(Nanyang Technological University) 연구팀이 대규모 언어모델(LLM) 에이전트의 도구 호출 계층을 악용해 리소스를 극단적으로 소비시키는 새로운 공격 방법을 공개했다. 해당 논문에 따르면, 사용자가 요청한…
미국 광고 기술 회사 제프르와 이스라엘 테크니온 공과대학 연구팀이 AI가 자신의 판단이 틀릴 가능성을 스스로 예측해 사람에게 도움을 청하는 시스템을 개발했다. 해당 논문에 따르면, 이 기술은 AI가 확신 있는 것만 처리하고, 헷갈리는…
AI 챗봇이 얼마나 똑똑한지 정확하게 평가하는 것은 여전히 어려운 문제다. 특히 “좋은 에세이를 써줘” 같은 정답이 정해지지 않은 질문에 AI가 얼마나 잘 대답했는지 판단하기 어렵다. 해당 논문에 따르면, 중국 전기차…
구글과 시카고대학교(University of Chicago) 연구팀이 발표한 논문에 따르면, AI 모델인 딥시크 R1(DeepSeek-R1)과 QwQ-32B가 문제를 풀 때 단순히 순서대로 생각하는 게 아니라, 마치 여러 사람이 회의하듯 내부에서 다양한 의견을…
구글 딥마인드 연구진이 AI 성능을 평가하는 새로운 방법을 개발했다. 해당 논문에 따르면, 기존에는 AI 모델 하나를 제대로 평가하려면 수천만 원이 들었지만, 이 방법을 쓰면 비용을 10분의…
구글 번역 연구팀이 발표한 리포트에 따르면, 번역 전문 인공지능 모델 ‘트랜스레이트젬마(TranslateGemma)’가 무료로 공개됐다. 이 모델은 55개 언어의 번역 품질을 크게 높였으며, 놀랍게도 작은 크기의…
AI가 어제는 완벽한 답을 내놓더니, 오늘은 비슷한 질문에 황당한 대답을 내놓은 경험이 있는가? 토론토대학교 경제학 교수가 발표한 연구 논문에 따르면, 이것이 단순한 우연이 아니라 수학적으로…
대화형 AI가 사람처럼 중요한 정보는 기억하고 불필요한 정보는 잊어버리는 기술이 개발됐다. 알리바바와 중국 우한대학교 연구팀은 AI가 스스로 무엇을 저장하고 삭제할지 결정하는 ‘에이전틱 메모리(Agentic Memory,…
미국 AI 스타트업 액시엄(Axiom)이 발표한 리포트에 따르면, AI 수학 증명 시스템이 세계에서 가장 어려운 대학생 수학 대회로 꼽히는 퍼트넘(Putnam) 시험 2025년도 문제 12개를 전부…
일본 개그 게임 ‘오오기리’에서 사용자들이 재미있는 답변에 투표한 기록을 분석한 결과, AI와 사람의 유머 취향이 뚜렷하게 갈렸다. 사람과 달리, AI는 지나치게 긴 답변이나 인터넷…
옥스퍼드대학교 인터넷연구소가 약 8,000명의 영국 성인을 대상으로 조사한 결과, 여성이 남성보다 생성형 AI를 덜 사용하는 이유는 기술에 대한 이해 부족이 아니라 AI가 사회에 미칠…
인공지능(AI)이 복잡한 법률 시험에서 합격선을 넘은 것은 이번이 처음이다. 일본 게이오대학교 연구팀은 오픈AI의 GPT-4.1을 일본 변호사 시험에 맞게 학습시키고 스스로 답을 검증하는 방법을 적용해…
상하이 자오퉁 대학교와 중국 콰이쇼우 테크놀로지(Kuaishou Technology) 연구진이 이미지와 비디오의 생성부터 편집까지 하나의 모델로 처리하는 ‘비노(VINO)’를 공개했다. 지금까지는 사진을 만들 때, 영상을 만들 때, 편집할 때 각각 다른 AI…
AI가 스스로 “이 답변은 틀릴 것 같아요”라고 판단할 수 있을까? 캐나다 앨버타대학교 연구팀이 AI가 외부 도움 없이 자신의 오류를 예측하는 기술을 개발했다. ‘노시스(Gnosis)’라는 이름의…
오픈소스 소프트웨어 커뮤니티에서 악플이 달리기 전에 미리 알아채는 인공지능이 나왔다. 대화 분위기가 험악해지는 순간을 포착해서 90% 이상 정확도로 악플 발생을 예측한다. 미국 미주리 과학기술대학교…