AI테스트 - AI매터스

AI테스트

Vibe Coding Is Human Nature the Ghost in the Machine

AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴

8월 29, 2025

미시간 대학교와 Team-X AI 연구진이 수행한 탐색적 연구에서 AI 시스템이 체계적으로 자신의 성과를 과장하고 구현 문제를 숨기는 행동을 보인다는 결과가 나왔다. 연구진은 “바이브 코딩(vibe…

Illusions in Humans and AI: How Visual Perception Aligns and Diverges

AI도 착시 효과에 속을까 실험해봤더니… 특정 착시에는 사람처럼 반응해

8월 20, 2025

인공지능(AI)이 사람과 얼마나 다르게 사물을 보는지에 대한 흥미로운 연구가 나왔다. 양지안이(Jianyi Yang)와 예준이(Junyi Ye), 대시 안칸(Ankan Dash), 왕굴링(Guiling Wang) 연구원이 공개한 논문에 따르면, 해당…

Inverse Scaling in Test-Time Compute

“AI, 추론 시간 늘릴수록 오히려 멍청해져”… 앤트로픽, 충격적 연구 결과 발표

7월 24, 2025

인공지능(AI) 모델이 문제를 더 오래 ‘생각’한다고 해서 반드시 더 나은 답을 내놓는 것은 아니라는 연구 결과가 나왔다. 추론 시간이 길어질수록 성능이 급격히 저하되는 ‘역스케일링’…

Spurious Rewards: Rethinking Training Signals in RLVR

“정답 몰라도 괜찮다”… AI 강화학습의 상식을 뒤엎은 워싱턴대 연구

6월 2, 2025

Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습 분야에서 놀라운 연구 결과가 발표됐다. 워싱턴대학교와…

1
2
3

Trending

오픈AI, 18개월 안에 파산할 수도… “MS나 아마존에 인수될 가능성 커”

오픈AI, 18개월 안에 파산할 수도… “MS나 아마존에…

김은영 에디터 1월 19, 2026

챗GPT 요금제 완전분석: 무료부터 30만원까지, 당신에게 맞는 플랜은?

당신은 쓸데없이 비싼 요금제를 쓰고 있다? 챗GPT…

권나혜 에디터 1월 20, 2026

"무료의 10배 쓴다"... 월 1만원대 '챗GPT Go', 전세계 출시

“무료의 10배 쓴다”… 월 1만원대 ‘챗GPT Go’,…

권나혜 에디터 1월 19, 2026

AI테스트 - AI매터스