앤트로픽, 클로드 AI의 '시스템 프롬프트' 공개

앤트로픽(Anthropic)이 자사의 대화형 AI 모델인 클로드(Claude)의 ‘시스템 프롬프트’를 공개했다. 이는 AI 업계에서 드문 투명성 제고 조치로 평가받고 있다.

시스템 프롬프트는 AI 모델의 기본적인 특성과 행동 지침을 설정하는 초기 명령어다. 앤트로픽을 포함한 대부분의 생성형 AI 기업들은 이를 통해 모델의 부적절한 행동을 방지하고 응답의 전반적인 톤을 조절한다.

미 IT 매체 테크크런치는 앤트로픽이 클로드 3.5 오퍼스(Claude 3.5 Opus), 소네트(Sonnet), 하이쿠(Haiku) 모델의 시스템 프롬프트를 iOS와 안드로이드 앱, 그리고 웹에서 공개했다고 밝혔다. 앤트로픽의 개발자 관계 책임자인 알렉스 앨버트(Alex Albert)는 소셜 미디어 X를 통해 앞으로도 시스템 프롬프트 업데이트와 미세 조정 내용을 지속적으로 공개할 계획이라고 밝혔다.

7월 12일자로 공개된 최신 프롬프트에 따르면, 클로드 모델은 URL이나 링크, 동영상을 열 수 없으며 얼굴 인식 기능도 없다. 특히 오퍼스 모델의 경우 “완전히 얼굴을 구별하지 못하는 것처럼 응답”하고 “이미지 속 인물을 식별하거나 이름을 언급하지 않도록” 지시받았다.

또한 클로드는 “매우 똑똑하고 지적 호기심이 많은” 성격으로 설정되어 있으며, “다양한 주제에 대해 인간의 생각을 듣고 토론하는 것을 즐기는” 특성을 가지고 있다. 논란의 여지가 있는 주제에 대해서는 공정하고 객관적으로 다루며 “신중한 사고”와 “명확한 정보”를 제공하도록 설계되었다.

앤트로픽의 이번 조치는 AI 업계 최초로 시스템 프롬프트 변경 로그를 공개한 사례다. 이는 경쟁사들에게 유사한 정보 공개에 대한 압박으로 작용할 수 있다.

전문가들은 이러한 투명성 제고 노력이 AI 모델의 작동 원리에 대한 이해를 높이고, 사용자들에게 AI의 한계와 능력에 대한 더 명확한 정보를 제공할 수 있을 것으로 전망하고 있다.

금융기관들은 이러한 리스크와 규제 동향을 주시하며 AI 기술을 안전하고 효과적으로 도입하기 위한 노력을 기울이고 있다. 앞으로 AI 기술이 은행 업무의 효율성과 고객 서비스 품질을 크게 향상시킬 것으로 기대되는 가운데, 기술 도입에 따른 부작용을 최소화하는 것이 과제로 남아있다.

테크크런치의 기사는 링크에서 확인할 수 있다.

관련 콘텐츠 더보기