CBRN - AI매터스

CBRN

Multimodal Mistral Red Teaming Report

미스트랄 AI 모델, 유해 콘텐츠 생성 위험 GPT-4보다 60배 높아… 엔크립트 AI 보고서

5월 12, 2025

Multimodal Mistral Red Teaming Report 미스트랄 AI의 픽스트랄 모델, GPT-4o와 클로드3.7보다 60배 더 위험하다 미국의 AI 전문 보안기업 엔크립트 AI(Enkrypt AI)가 발표한 미스트랄(Mistral)의 멀티모달…

anthropic

앤트로픽, AI 안전 강화한 ‘책임있는 확장 정책’ 업데이트 발표

10월 17, 2024

앤트로픽이 최첨단 AI 시스템의 잠재적 위험을 관리하기 위한 ‘책임있는 확장 정책(RSP)’ 업데이트를 발표했다. 이번 업데이트는 AI 위험을 평가하고 관리하는 더 유연하고 세분화된 접근 방식을…

claude ai bounty program

앤트로픽, AI 모델 안전성 강화 위해 버그 바운티 프로그램 확대

8월 9, 2024

앤트로픽이 AI 모델의 안전성을 강화하기 위해 버그 바운티 프로그램을 확대한다고 발표했다. 이번 확대는 AI 모델의 오용을 방지하기 위한 완화 조치에서 결함을 찾는 새로운 이니셔티브에…

1
2
3

Trending

챗GPT 프로, '90% 할인'… 카카오 선물하기 깜짝 특가

챗GPT 프로, ‘90% 할인’… 카카오 선물하기 깜짝…

권나혜 에디터 2월 13, 2026

오픈클로 창시자, “앱의 80%가 사라질 것”

오픈클로 창시자, “앱의 80%가 사라질 것”

권나혜 에디터 2월 10, 2026

카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안 공포 확산

카카오·네이버·당근마켓, 오픈클로 사용 금지령… AI 에이전트 보안…

권나혜 에디터 2월 9, 2026

CBRN - AI매터스