헌법 분류기

앤트로픽, 새로운 ‘버그 바운티 프로그램’으로 안전성 방어 체계 테스트 시작

5월 15, 2025

앤트로픽(Anthropic)이 안전 대책을 테스트하기 위한 새로운 버그 바운티 프로그램을 15일(현지 시간) 시작했다. 앤트로픽 뉴스룸에 공개된 내용에 따르면, 이번 프로그램은 작년 여름에 발표된 이전 프로그램과…

Constitutional Classifiers: Defending against Universal Jailbreaks across Thousands of Hours of Red Teaming

AI 안전성 높이는 ‘헌법 분류기’ 개발…앤트로픽 연구진, 3000시간 해킹 시도 막아내

2월 4, 2025

Constitutional Classifiers: Defending against Universal Jailbreaks across Thousands of Hours of Red Teaming 인공지능 연구기업 앤트로픽(Anthropic)이 대규모 언어모델(LLM)의 안전성을 획기적으로 강화하는 기술을 개발했다. 앤트로픽의…

헌법 분류기

앤트로픽, 새로운 ‘버그 바운티 프로그램’으로 안전성 방어 체계 테스트 시작

AI 안전성 높이는 ‘헌법 분류기’ 개발…앤트로픽 연구진, 3000시간 해킹 시도 막아내

Trending

챗GPT 프로, ‘90% 할인’… 카카오 선물하기 깜짝…

오픈클로 창시자, “앱의 80%가 사라질 것”

카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안…