인공지능을 활용한 가짜 썸네일 탐지 연구에서 클로드 3.5 소네트가 기존 전문 시스템보다 뛰어난 성과를 보였다. 이때 가짜 썸네일은 내용에 비해 썸네일이 과장되거나 거짓 약속을…
인공지능이 차트를 해석할 때 국가의 경제적 지위에 따라 다른 평가를 내린다는 연구 결과가 나왔다. 캐나다 요크대학교와 알버타대학교 등 국제 공동 연구진은 GPT-4o-mini, 제미나이 1.5-Flash…
이란 테헤란대학의 아리아 바라스테네자드(Arya Varastehnezhad) 연구원과 미국 사우스캐롤라이나대학의 레자 타바솔리(Reza Tavasoli) 교수 등 5명의 국제 연구팀이 AI 모델들의 감정 표현을 본격 분석한 결과를 발표했다.…
요즘 많은 사람들이 중요한 인생 결정을 할 때 AI에게 조언을 구한다. 하지만 과연 AI를 믿어도 될까? 싱가포르의 난양이공대학 연구진은 이별, 이직, 투자 등 100가지…
독일 트리어 대학교 전산언어학과 사이먼 뮌커(Simon Münker) 박사가 이끄는 연구팀이 충격적인 사실을 발견했다. 챗GPT와 같은 AI가 다양한 나라의 문화를 제대로 이해하지 못한다는 것이다. 해당…
터키 대학교 연구팀이 충격적인 사실을 발견했다. ‘LLaDA’라는 새로운 AI가 인간이 쓴 글과 구별할 수 없을 정도로 자연스러운 글을 쓸 수 있다는 것이다. 연구진은 2,000개의…
SK텔레콤이 세계 최고 수준의 한국어 처리 능력을 보유한 대규모 언어 모델(LLM) ‘에이닷 엑스(A.X) 4.0’을 오픈소스로 공개했다고 3일(한국 시간) 발표했다. SK텔레콤은 이날 오전 세계적인 오픈소스…
Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts GPT-4와 제미나이(Gemini) 같은 거대언어모델(LLM)들이 감각-운동 경험 없이도 감정이나 추상적 개념에서는…
Grok 3 vs ChatGPT: We Compared The Two AI Models and Here Are The Results 그록 3의 수학적 추론 능력, 챗GPT보다 14% 우수 그록…
오픈AI(OpenAI)의 o3 AI 모델에 대한 자체 벤치마크 결과와 제3자 벤치마크 결과 간의 불일치가 회사의 투명성과 모델 테스트 관행에 대한 의문을 제기하고 있다. 테크크런치가 20일(현지…
오픈AI(OpenAI)가 16일(현지 시간) 기존보다 더 똑똑하고 강력한 성능을 갖춘 최신 AI 모델인 ‘o3’와 ‘o4-mini’를 출시했다. 이번에 공개된 모델들은 더 오래 생각한 후 응답하도록 훈련된…
구글(Google)의 제미나이(Gemini)와 앤트로픽(Anthropic)의 클로드(Claude) AI 모델이 포켓몬 게임에서 경쟁하고 있다. 이처럼 AI 벤치마킹 논쟁은 이제 게임 세계까지 확장됐다. 지난주 X에서 한 게시물이 바이럴 현상을…
테크크런치(TechCrunch)가 6일(현지 시간) 보도한 내용에 따르면, 메타(Meta)의 최신 AI 모델 벤치마크 결과에 대한 논란이 일고 있다. 메타가 공개 버전과 다른 ‘최적화된’ 버전으로 성능 측정을…
대규모 언어 모델(LLM)들이 마피아 게임에서 대결을 펼치는 프로젝트가 공개됐다. 구저스(Guzus)라는 개발자가 공개한 이 프로젝트는 여러 AI 모델들이 마피아 게임에서 어떻게 경쟁하는지 보여주며, 최근 경쟁…
What is the Role of Small Models in the LLM Era: A Survey 영국 임페리얼 칼리지 런던과 프랑스 소다 연구소가 발표한 연구에 따르면, 거대언어모델(LLM)이…
Rhymes AI가 개발한 ARIA가 오픈소스 최초의 멀티모달 네이티브 MoE(Mixture-of-Experts) 모델로 공개되었다. ARIA는 GPT-4와 Gemini-1.5와 같은 기업 독점 모델들과 견줄만한 성능을 보여주며 주목받고 있는데, 특히…