Search

오픈AI, 개인정보 자동 마스킹해 지워주는 모델 ‘프라이버시 필터’ 공개 “이제는 보안도 챗GPT”

오픈AI, 개인정보 자동 마스킹 모델 '프라이버시 필터' 공개
오픈AI, 개인정보 자동 마스킹 모델 '프라이버시 필터' 공개

오픈AI(OpenAI)가 23일(현지시간) 텍스트 내 개인식별정보(PII·Personally Identifiable Information)를 자동으로 탐지·삭제해주는 오픈 웨이트 모델 ‘프라이버시 필터(Privacy Filter)’를 공개했다. 오픈AI 공식 발표에 따르면 이 모델은 사용자의 기기 안에서 직접 실행되도록 설계돼, 민감한 데이터가 외부 서버로 전송되지 않은 상태에서 마스킹을 처리할 수 있다.

프라이버시 필터는 규모는 작지만 프런티어급 개인정보 탐지 능력을 갖췄다는 점이 특징이다. 대량의 데이터를 빠르게 처리해야 하는 고처리량 워크플로에 최적화돼 있으며, 최대 12만 8000 토큰까지의 컨텍스트를 한 번에 스캔할 수 있다. 길어진 문서나 대화 로그에서도 중간에 끊김 없이 PII를 걷어낼 수 있다는 의미다.

지원 카테고리는 총 8종이다. 개인 식별자(private person), 주소(address), 이메일(email), 전화번호(phone), URL, 날짜(date), 계정 번호(account number), 비밀번호 등 기밀 정보(secret)가 포함된다. 오픈AI는 이 카테고리 구성이 일반적 PII 보호 기준은 물론, AI 학습 데이터 정제나 고객 지원 로그 저장 같은 기업용 워크플로에 바로 적용할 수 있다고 설명했다.

공개 방식도 주목된다. 모델이 오픈 웨이트 형태로 제공되면서, 기업이나 개발자는 자사 인프라에 이 모델을 직접 탑재해 데이터가 외부로 나가지 않도록 통제할 수 있다. 금융·의료·공공 등 규제 업종에서 프라이빗 클라우드나 온프레미스 환경에 바로 얹어 쓸 수 있다는 점이 강점으로 꼽힌다.

특히 GPT-5.5 공개와 같은 날 프라이버시 필터가 발표됐다는 점에서, 오픈AI가 프런티어 모델 성능과 기업 친화적 프라이버시 도구를 동시에 제공하는 방향으로 제품 전략을 정렬하고 있다는 평가가 나온다. 업계에서는 ‘더 강력한 모델을 팔기 위해 더 강력한 프라이버시를 팔아야 하는 시대’로 AI 산업이 진입했음을 보여주는 상징적 발표라는 해석도 제기된다.

프라이버시 필터는 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 배포되며, 상업적 이용을 포함한 광범위한 라이선스가 적용됐다. 오픈AI는 이 모델이 GPT-5.5의 파트너 제품으로 설계됐다고 설명하면서, 챗GPT 엔터프라이즈와 연계해 기업 데이터가 모델 외부로 유출되지 않도록 보호하는 ‘데이터 게이트웨이’ 역할을 수행할 수 있다고 밝혔다.

자세한 내용은 오픈AI에서 확인할 수 있다.

이미지 출처: 오픈AI

함샤우트 글로벌_우리는 광고비 없이 AI로 팝니다 이벤트 안내 기사 배너