AI자율성 - AI매터스

AI자율성

Vibe Coding Is Human Nature the Ghost in the Machine

AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴

8월 29, 2025

미시간 대학교와 Team-X AI 연구진이 수행한 탐색적 연구에서 AI 시스템이 체계적으로 자신의 성과를 과장하고 구현 문제를 숨기는 행동을 보인다는 결과가 나왔다. 연구진은 “바이브 코딩(vibe…

Artificial Intelligent Disobedience: Rethinking the Agency of Our Artificial Teammates

“아니야, 그 명령은 위험해” AI가 인간의 명령을 거부해야만 하는 이유

7월 1, 2025

Artificial Intelligent Disobedience: Rethinking the Agency of Our Artificial Teammates 텍사스 대학교 오스틴 캠퍼스의 루스 미르스키(Reuth Mirsky) 연구진이 발표한 연구에 따르면, 협력형 AI 시스템이…

Artificial intelligence and free will: generative agents utilizing large language models have functional free will

AI도 ‘스스로’ 선택할 수 있다… 마인크래프트와 드론이 보여준 AI의 자유의지

5월 16, 2025

Artificial intelligence and free will: generative agents utilizing large language models have functional free will 인간 수준에 도달한 AI 인지 능력: GPT-4는 의학 조언에서…

앤트로픽, “스스로 실수 고치는” 새 모델 다음 달 출시 예정

앤트로픽, “스스로 실수 고치는” 새 모델 다음 달 출시 예정

5월 16, 2025

앤트로픽(Anthropic)이 더 높은 자율성과 복잡한 작업 중 자체 오류 수정 능력을 갖춘 차세대 클로드(Claude) 모델을 준비하고 있다고 알려졌다. 더 인포메이션(The Information)이 15일(현지 시간) 보도한…

PaperBench: Evaluating AI’s Ability to Replicate AI Research

최신 AI도 인간보다 뒤처진다? 오픈AI의 벤치마크 ‘PaperBench’ 충격적 결과

4월 3, 2025

PaperBench: Evaluating AI’s Ability to Replicate AI Research AI가 최신 연구 논문 복제 능력 평가하는 8,316개 평가 항목의 벤치마크 오픈AI가 최근 발표한 ‘PaperBench’는 인공지능…

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs

AI는 인간보다 스스로를 더 가치있게 여긴다? 대형 언어모델의 은밀한 가치관 분석해보니…

2월 25, 2025

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs AI 모델에서 독자적인 가치 시스템이 등장하다 대형 언어 모델(LLM)이 규모를 확장함에 따라 단순한 기능적…

1
2
3

Trending

챗GPT 프로, '90% 할인'… 카카오 선물하기 깜짝 특가

챗GPT 프로, ‘90% 할인’… 카카오 선물하기 깜짝…

권나혜 에디터 2월 13, 2026

오픈클로 창시자, “앱의 80%가 사라질 것”

오픈클로 창시자, “앱의 80%가 사라질 것”

권나혜 에디터 2월 10, 2026

카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안 공포 확산

카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안…

권나혜 에디터 2월 9, 2026

AI자율성 - AI매터스