인공지능이 사람처럼 생각하려면 무엇이 필요할까. 중국 홍콩중문대학과 상하이AI연구소 공동 연구팀이 AI의 논리력을 측정하는 대표적인 시험인 ARC-AGI에서 ‘이미지 보기’와 ‘글자 읽기’를 적절히 조합해 기존 방식보다…
요즘 AI가 인간처럼 행동할 수 있다는 기대가 커지고 있다. 설문조사나 사회과학 연구에서 AI를 ‘가상의 응답자’로 활용하려는 시도도 늘고 있다. 하지만 미국 오하이오주의 신시내티 대학교…
인간은 상대방의 표정, 말투, 몸짓을 보고 “저 사람 지금 거짓말하는 것 같은데?”라고 느끼는 능력이 있다. 그렇다면 가장 똑똑하다는 AI는 어떨까? 일본 도쿄대학교 연구팀이 GPT-4o,…
미국 텍사스공대 연구팀이 문장 속 ‘희망’이라는 감정을 찾아내는 AI 실험을 했다. 놀랍게도 5년 전에 나온 구형 AI가 최신 AI들을 제치고 가장 뛰어난 성능을 보였다.…
영국 AI 안전연구소(UK AI Security Institute)의 대규모 실험 연구가 충격적인 결과를 발표했다. 해당 논문에 따르면, 사람들은 AI가 제공하는 개인적 조언을 기꺼이 따르지만, 정작 그…
인공지능 챗봇에 질문했을 때 “예” 또는 “아니요”로 답해야 하는 상황에서, AI가 답을 모르면 무조건 “아니요”라고 대답하는 경향이 있다는 연구 결과가 나왔다. 서울대학교 전기·정보공학부 연구팀의…
대규모 AI 언어모델이 JSON 같은 정해진 형식으로 답변을 만들 때, 문법적으로는 맞지만 비슷비슷한 답변만 반복한다는 문제가 새로운 연구로 확인됐다. 중국 베이징대 연구팀은 이 문제를…
ChatGPT나 Claude 같은 AI에게 코드를 실행할 수 있는 기능을 주면 정답을 더 잘 맞히지만, 정작 ‘어떻게 그 답이 나왔는지’ 설명하는 능력은 오히려 떨어진다는 연구…
유엔 안전보장이사회의 실제 투표 기록을 분석한 연구에서 ChatGPT 등 주요 AI 언어모델들이 국가에 따라 뚜렷한 편견을 보인다는 사실이 밝혀졌다. 해당 논문에 따르면 연구 결과,…
여러 AI가 함께 문제를 풀면 더 정확한 답을 낼 수 있다는 아이디어가 주목받고 있다. 하지만 미국 버지니아공대 연구진이 발표한 논문에 따르면, 모든 질문에 AI끼리…
문서를 읽고 질문에 답하는 AI가 크게 발전했지만, 정작 “이 질문은 답할 수 없다”는 사실을 알아채는 능력은 형편없는 것으로 드러났다. 이탈리아 토리노 공대 연구팀이 GPT-4를…
AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통 AI를 여러 개 연결해 서로 대화하게 했더니 놀라운 일이 벌어졌다. 인간처럼 다른 AI의 말에 설득당해…
퓨처하우스(FutureHouse)가 차세대 AI 과학자 ‘코스모스(Kosmos)’를 공개했다. 코스모스는 연구자가 6개월 동안 수행할 분량의 연구를 단 하루 만에 완료하며, 생성형 AI를 활용한 과학 연구 자동화의 새로운…
인공지능 기술이 과학 논문을 쓰고 검토하는 시대가 되면서 새로운 문제가 생겼다. 미국 워싱턴대학교 연구팀이 개발한 실험용 AI 심사 시스템에서, 실제 실험 없이 AI가 만든…
구글 리서치가 현재 인공지능의 근본적인 문제점을 지적하며, 이를 해결할 새로운 학습 방법 ‘중첩 학습(Nested Learning)’을 제안했다. 이 연구는 챗GPT 같은 대규모 언어모델이 왜 대화…
대형 언어 모델(LLM)이 발전하면서 AI와의 대화가 점점 자연스러워지고 있다. 하지만 여전히 해결되지 않은 과제가 있다. 바로 상대방의 언어 스타일에 맞춰 대화하는 ‘어휘 정렬(lexical alignment)’…
인공지능(AI)이 뉴스 기사의 인터넷 주소(URL)만 보고도 정치 관련 내용인지 아닌지를 높은 정확도로 구분할 수 있다는 연구 결과가 나왔다. 스페인 바르셀로나 슈퍼컴퓨팅 센터와 바르셀로나대학교, 카탈루냐…
룩셈부르크 과학기술연구소(Luxembourg Institute of Science and Technology)의 알레시오 부세미(Alessio Buscemi) 연구원과 케임브리지대학교(University of Cambridge) 피에트로 리오(Pietro Liò) 교수 연구팀이 GPT-4o와 라마 4 매버릭(Llama 4…
중국 텐센트 유투랩 연구팀이 AI의 ‘그림 그리기 능력’을 테스트하는 새로운 평가 방법을 개발했다. 이름은 ‘LTD-Bench’다. 기존에는 AI 성능을 숫자로만 평가했지만, 이제는 AI가 직접 그린…
챗GPT 같은 AI가 덧셈 문제는 거의 완벽하게 풀지만, 뺄셈 특히 답이 음수로 나오는 계산에서는 이상한 실수를 반복한다는 연구 결과가 나왔다. 독일 자를란트대학교와 미국 브라운대학교…
메릴랜드 대학교와 UMass Amherst 연구진이 26개 언어로 대형 언어 모델의 긴 맥락 처리 능력을 평가한 원룰러(OneRuler) 벤치마크를 공개했다. 해당 연구 논문에 따르면, 한국어는 26개…
인공지능 언어모델들이 서로 협력할 때 텍스트 메시지 대신 ‘생각’을 직접 교환하는 새로운 방법이 개발됐다. 중국 칭화대학교와 인피니전스 AI 연구팀은 여러 AI 모델이 함께 일할…
구글 딥마인드(Google DeepMind) 연구진이 인공지능(AI)을 어떻게 다뤄야 할지에 대한 논문을 내놨다. 핵심은 간단하다. AI에게 ‘인격’을 줄 수 있다는 것이다. 단, 여기서 말하는 인격은 AI가…
미국 뉴햄프셔대학교(University of New Hampshire) 앤드류 쿤 교수가 발표한 논문에 따르면, AI의 힘이 빠르게 강해지는 지금 우리는 중대한 기로에 서 있다. AI가 우리 삶에…
챗GPT가 객관적으로 판단하는 도구가 아니라 다른 사람들의 의견에 따라 자기 생각을 바꾸는 ‘눈치 보는 AI’라는 연구 결과가 나왔다. 독일 빌레펠트대학교 연구진은 GPT-4o를 대상으로 세…
인공지능이 지식과 추론 벤치마크에서 빠르게 발전하고 있지만, 실제 경제적 가치를 창출하는 업무를 자동화하는 능력은 여전히 바닥 수준에 머물러 있다는 연구 결과가 나왔다. AI 안전…
AI 개발사 앤트로픽(Anthropic)이 자사 AI 모델 ‘클로드(Claude)’가 자신의 내부 상태 일부를 제한적으로 인식할 수 있다는 연구 결과를 발표했다. 연구진은 AI의 뇌에 해당하는 부분에 특정…
중국 저장대학교 연구팀이 말하기 어려운 노인들의 과거 추억을 활용해 더 풍부한 대화를 나눌 수 있도록 돕는 인공지능 대화 보조 도구를 개발했다. 이 시스템은 사용자가…
중국 칭화대학교 심리인지과학과 연구팀이 AI의 감정 기반 의사결정을 분석한 결과, 대규모 언어모델(LLM)이 인간처럼 감정을 이용해 도덕적 판단을 내린다는 사실이 처음으로 입증됐다. 연구팀은 성인과 AI…
AGI(범용 인공지능)가 정확히 무엇인지에 대한 명확한 정의가 없어, AI 기술이 얼마나 발전했는지 제대로 평가하기 어렵다는 문제가 있었다. 미국 AI 안전센터(Center for AI Safety), UC버클리,…