Multimodal Mistral Red Teaming Report

미스트랄 AI 모델, 유해 콘텐츠 생성 위험 GPT-4보다…

5월 12, 2025

Multimodal Mistral Red Teaming Report 미스트랄 AI의 픽스트랄 모델, GPT-4o와 클로드3.7보다 60배 더 위험하다 미국의 AI 전문 보안기업…

anthropic

앤트로픽, AI 안전 강화한 ‘책임있는 확장 정책’ 업데이트…

10월 17, 2024

앤트로픽이 최첨단 AI 시스템의 잠재적 위험을 관리하기 위한 ‘책임있는 확장 정책(RSP)’ 업데이트를 발표했다. 이번 업데이트는 AI 위험을 평가하고…

claude ai bounty program

앤트로픽, AI 모델 안전성 강화 위해 버그 바운티…

8월 9, 2024

앤트로픽이 AI 모델의 안전성을 강화하기 위해 버그 바운티 프로그램을 확대한다고 발표했다. 이번 확대는 AI 모델의 오용을 방지하기 위한…

CBRN – AI 매터스 l AI Matters