AI모델비교

SimWorld: An Open-ended Realistic Simulator for Autonomous Agents

AI에게 배달 시켰더니 돈 다 써서 스쿠터만 샀다… 가상 도시 실험의 충격적 결과

12월 8, 2025

샌디에이고 캘리포니아대학교와 존스홉킨스대학교 등 8개 대학 연구팀이 챗GPT, 클로드 같은 AI를 가상 세계에서 훈련하고 테스트할 수 있는 새로운 시뮬레이터 ‘심월드(SimWorld)’를 공개했다. 해당 논문에 따르면,…

ThumbnailTruth: A Multi-Modal LLM Approach for Detecting Misleading YouTube Thumbnails Across Diverse Cultural Settings

유튜브 썸네일 어그로 시대 끝나나? AI가 유해 썸네일 94% 정확도로 찾는다

9월 10, 2025

인공지능을 활용한 가짜 썸네일 탐지 연구에서 클로드 3.5 소네트가 기존 전문 시스템보다 뛰어난 성과를 보였다. 이때 가짜 썸네일은 내용에 비해 썸네일이 과장되거나 거짓 약속을…

From Charts to Fair Narratives: Uncovering and Mitigating Geo-Economic Biases in Chart-to-Text

AI 눈에는 스위스가 천국, 남수단이 지옥? 똑같은 데이터, 다른 평가… AI 속 숨겨진 국가 차별

8월 27, 2025

인공지능이 차트를 해석할 때 국가의 경제적 지위에 따라 다른 평가를 내린다는 연구 결과가 나왔다. 캐나다 요크대학교와 알버타대학교 등 국제 공동 연구진은 GPT-4o-mini, 제미나이 1.5-Flash…

AI in Mental Health: Emotional and Sentiment Analysis of Large Language Models' Responses to Depression, Anxiety, and Stress Queries

“챗GPT는 중립적이고, 라마는 낙관적”… AI마다 다른 ‘감정 DNA’ 분석

8월 26, 2025

이란 테헤란대학의 아리아 바라스테네자드(Arya Varastehnezhad) 연구원과 미국 사우스캐롤라이나대학의 레자 타바솔리(Reza Tavasoli) 교수 등 5명의 국제 연구팀이 AI 모델들의 감정 표현을 본격 분석한 결과를 발표했다.…

Empowering Educators in the Age of AI: An Empirical Study on Creating custom GPTs in Qualitative Research Method education

“AI한테 투자·연애·이직 상담해도 될까?”… 어떤 모델이 가장 상담 잘하나 봤더니

8월 1, 2025

요즘 많은 사람들이 중요한 인생 결정을 할 때 AI에게 조언을 구한다. 하지만 과연 AI를 믿어도 될까? 싱가포르의 난양이공대학 연구진은 이별, 이직, 투자 등 100가지…

Cultural Bias in Large Language Models: Evaluating AI Agents through Moral Questionnaires

챗GPT, 알고 보니 ‘서구 문화’만 편애한다… “일본 문화는 모든 AI가 이해 포기”

7월 17, 2025

독일 트리어 대학교 전산언어학과 사이먼 뮌커(Simon Münker) 박사가 이끄는 연구팀이 충격적인 사실을 발견했다. 챗GPT와 같은 AI가 다양한 나라의 문화를 제대로 이해하지 못한다는 것이다. 해당…

“이제 인간과 구별 불가”… 인간 글과 100% 똑같아진 AI ‘LLaDA’ 등장

7월 16, 2025

터키 대학교 연구팀이 충격적인 사실을 발견했다. ‘LLaDA’라는 새로운 AI가 인간이 쓴 글과 구별할 수 없을 정도로 자연스러운 글을 쓸 수 있다는 것이다. 연구진은 2,000개의…

SK Telecom Releases Open-Source Korean LLM ‘A.Dot X 4.0’ with Industry-Leading Performance

이제 번역도 잘 되길… SKT, 세계 최고 한국어 AI 모델 ‘에이닷 엑스 4.0’ 오픈소스 공개

7월 3, 2025

SK텔레콤이 세계 최고 수준의 한국어 처리 능력을 보유한 대규모 언어 모델(LLM) ‘에이닷 엑스(A.X) 4.0’을 오픈소스로 공개했다고 3일(한국 시간) 발표했다. SK텔레콤은 이날 오전 세계적인 오픈소스…

Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts

“감정은 이해·촉각과 후각은 이해 못해” LLM의 감각에 대한 연구 결과 공개

6월 16, 2025

Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts GPT-4와 제미나이(Gemini) 같은 거대언어모델(LLM)들이 감각-운동 경험 없이도 감정이나 추상적 개념에서는…