모델 감사 - AI매터스

모델 감사

Persona Features Control Emergent Misalignment

“잘못 배운 AI, 돈 벌기 질문에 사기·강도 제안”… AI 부작용 원인 찾았다

6월 19, 2025

Persona Features Control Emergent Misalignment 오픈AI가 발표한 연구 논문에 따르면, GPT-4o를 취약한 코드나 부정확한 조언이 포함된 좁은 영역의 데이터로 파인튜닝하면 전혀 관련 없는 질문에…

1
2
3

Trending

2026년 2월, 놓치면 아까운 AI 도구 프로모션 총정리

2026년 2월, 놓치면 아까운 AI 툴 프로모션…

권나혜 에디터 2월 4, 2026

AI끼리만 SNS 한다고? "인간은 구경만" 150만 AI 모인 신기한 플랫폼 등장

AI끼리만 SNS 한다고? “인간은 구경만” 150만 AI 모인…

권나혜 에디터 2월 2, 2026

AI 에이전트 커뮤니티 몰트북(moltbook)

AI 에이전트끼리 커뮤니티를 한다고? 몰트북, 쉽게 이해시켜…

공인희 편집인 2월 4, 2026

모델 감사 - AI매터스