Search

AIWORKX, AI 에이전트 신뢰성 자동 검증해주는 ‘AgentRigor’ 4월 30일 출시

AIWORKX, AI 에이전트 신뢰성 검증 솔루션 ‘AgentRigor’ 4월 30일 출시
AIWORKX, AI 에이전트 신뢰성 검증 솔루션 ‘AgentRigor’ 4월 30일 출시

인공지능(AI) 데이터·솔루션 전문기업 에이아이웍스(AIWORKX, 대표 윤석원)가 AI 에이전트 신뢰성 평가 솔루션 ‘에이전트리거(AgentRigor)’를 4월 30일 정식 출시한다고 28일 밝혔다. 에이전트리거는 국내 AI 평가 솔루션 가운데 SW분야 KOLAS(한국인정기구) 공인시험 기관이 설계 단계부터 참여한 에이전트 평가 솔루션으로, 콘텐츠 중심 평가의 한계를 넘어 ‘서비스 관점의 컴플라이언스(compliance) 평가’로 패러다임을 전환한 것이 특징이다.

글로벌 AI 에이전트 시장은 2025년 76억 달러에서 2033년 1830억 달러 규모로 성장할 전망이다(그랜드뷰 리서치, 2026~2033 연평균 49.6% 성장). 금융·의료·법률·물류 등 버티컬 AI 시장이 급팽창하면서 산업별 고유 요구사항을 반영한 AI 신뢰성 검증 수요가 폭발적으로 늘고 있다. 특히 한국 AI기본법 시행을 앞두고 금융·공공 분야에서 AI 컴플라이언스 검증 의무화 흐름이 가속되고 있어, 체계적인 에이전트 평가 인프라 필요성이 높아진 상황이다.

기존 AI 에이전트 평가 방식은 범용 벤치마크 데이터셋에 의존해 도메인별 시나리오를 충분히 반영하지 못하는 ‘검증 범위 불일치’, 획일적인 평가 기준으로 기업 서비스 목표나 국가별 문화 차이를 반영하지 못하는 ‘평가 기준 불일치’, 입력·출력만 비교해 사용자·기업 데이터 등 맥락(Context)을 고려한 평가가 어려운 한계가 있었다. 에이전트리거는 이러한 한계를 넘어 서비스 관점의 컴플라이언스 평가, 산업별 에이전트의 대응 방식·리스크 종합 평가, 한국어 특화 평가 자산 데이터를 활용한 정밀 평가가 가능하다.

에이전트리거의 핵심 기능은 세 가지다. 첫째, ‘LLM 응답 품질 및 평가 신뢰도 정량 검증’은 LLM 서비스의 실제 응답을 예상 응답과 비교해 정확성·검색 맥락 연관성 등을 사용자 정의 기준으로 자동 측정하고, 메트릭과 인적 평가 결과 간 상관 분석을 통해 자동화 평가 지표의 신뢰도를 정량적으로 입증한다. 둘째, ‘실제 사용자 시나리오 기반 안전성 검증’은 다년간 구축된 에이아이웍스 고유의 공통 안전성 코어 평가 데이터·지표를 활용해 서비스 수준의 안전성을 체계적으로 검증한다. 셋째, ‘공인 프레임워크 기반 컴플라이언스 대응 지원’은 KOLAS 공인 인정기관이 설계한 프레임워크 기반 검증 프로세스를 통해 AI 기본법과 금융 컴플라이언스 대응에 필요한 평가 자료를 제공한다. 이외에도 시나리오 기반 도메인 특화 테스트 데이터 자동 생성, 자동 메트릭과 인적 평가의 통합 관리, 고객별 커스텀 메트릭 구성(G-Eval), 케이스 단위 상세 분석, 리포트 자동 생성 등 다양한 기능을 갖췄다.

에이전트리거는 최근 국내 대형 IT 서비스 기업의 AI 에이전트 검증 자동화 프로젝트에 실전 적용된 데 이어, 영유아 스킨케어 안전·개인화 추천 플랫폼 ‘새록’(밤빗·BAMBIT)의 베타 테스트에서 화장품 도메인 1440건의 케이스를 단기간에 검증하며 안정성을 확인했다. 온프레미스(on-premise)와 클라우드 환경 모두 지원해 금융·공공 등 보안 민감 산업에서도 도입할 수 있다는 점도 강점이다. 에이전트리거는 5월 6~8일 서울 코엑스에서 열리는 ‘제9회 AI Expo Korea 2026’에서 라이브 데모 세션으로 공개될 예정이다.

윤석원 에이아이웍스 대표는 “AI 에이전트가 실제 업무를 수행하는 시대에 접어들면서 배포 전 신뢰성 검증은 선택이 아닌 필수가 됐다”며 “에이전트리거는 에이아이웍스의 품질 DNA를 기반으로 설계된 솔루션인 만큼 AI 에이전트 신뢰성의 새로운 기준을 제시하겠다”고 밝혔다. 에이아이웍스는 이번 출시를 발판으로 2026년 하반기까지 다중턴(Multi-turn) 대화 검증, 에이전트 워크플로우 연동 검증, MCP 호환 등 기능을 확장하고 도메인별 시험·인증 프로그램을 기획해 AI 에이전트 신뢰성 평가의 글로벌 표준화를 선도할 계획이다.

자세한 내용은 에이아이웍스 공식 사이트(AIWORKX)에서 확인할 수 있다.

이미지 출처: 이디오그램 생성

함샤우트 글로벌_우리는 광고비 없이 AI로 팝니다 이벤트 안내 기사 배너