• Home
  • 헌법 분류기

헌법 분류기

앤트로픽, 새로운 ‘버그 바운티 프로그램’으로 안전성 방어 체계 테스트 시작

앤트로픽, 새로운 ‘버그 바운티 프로그램’으로 안전성 방어 체계…

5월 15, 2025

앤트로픽(Anthropic)이 안전 대책을 테스트하기 위한 새로운 버그 바운티 프로그램을 15일(현지 시간) 시작했다. 앤트로픽 뉴스룸에 공개된 내용에 따르면, 이번…

Constitutional Classifiers: Defending against Universal Jailbreaks across Thousands of Hours of Red Teaming

AI 안전성 높이는 ‘헌법 분류기’ 개발…앤트로픽 연구진, 3000시간…

2월 4, 2025

Constitutional Classifiers: Defending against Universal Jailbreaks across Thousands of Hours of Red Teaming 인공지능 연구기업 앤트로픽(Anthropic)이 대규모 언어모델(LLM)의…

헌법 분류기 – AI 매터스 l AI Matters