완벽한 정확도로 숨은 광고를 만들어내는 생성 시스템
연구 논문에 따르면, 연구팀은 사용자 맥락과 쿼리 의도를 활용해 상황에 맞는 광고를 생성하는 새로운 시스템을 개발했다. 이 시스템은 검색 증강 생성(RAG)과 캐시 증강 생성(CAG)을 결합한 하이브리드 방법을 사용한다. 사용자 질문에 관련된 문서를 찾아서 답변에 활용하는 기술과 자주 사용되는 정보를 미리 저장해두는 기술을 함께 써서 AI가 더 풍부한 맥락 정보를 가지고 답변할 수 있게 했다.
핵심은 미스트랄 7B(Mistral-7B) 모델을 ORPO(Odds Ratio Preference Optimization) 방식으로 훈련시킨 것이다. 먼저 여러 개의 후보 답변을 생성한 다음, 대형 언어 모델이 판사 역할을 해서 각 답변에서 광고가 얼마나 잘 숨겨져 있는지 점수를 매겼다. 가장 은밀한 광고와 가장 노골적인 광고를 선별해 쌍으로 만들어서 훈련 데이터로 활용했다. 그 결과 이 시스템은 광고를 답변 속에 자연스럽게 녹여낼 수 있고, 대부분의 광고를 빠짐없이 찾아낼 수도 있다.
높은 성능을 보인 두 가지 광고 탐지 방법… 응답 텍스트만으로 숨은 광고 잡아낸다
광고 탐지 기술로는 두 가지 접근법을 제시했다. 첫 번째는 all-mpnet-base-v2 모델을 기반으로 한 CrossEncoder 방식으로, 응답 텍스트만 사용해서 직접 분류를 수행한다. 두 번째는 DeBERTa-v3-base 모델을 활용한 프롬프트 기반 방식으로, 자연어 지시문을 통해 분류 작업을 재구성했다.
CrossEncoder 방식은 MPNet을 백본으로 사용해서 전체 입력 순서를 인코딩하며, 토큰 간 상호작용을 통해 미묘한 광고 언어를 탐지한다. 이 모델은 12개의 트랜스포머 층과 약 1억 1천만 개의 매개변수를 가지고 있으며, 높은 정밀도를 보였지만 재현율 측면에서는 상대적으로 낮은 성능을 기록했다. DeBERTa 방식은 “이 응답에 광고가 포함되어 있나요? (예/아니오)” 형식의 자연어 명령을 사용하며, 전반적으로 더 균형 잡힌 성능을 보였다.

젬마·큐웬·미스트랄 모두 제쳤다… JU_NLP 모델이 TIRA 평가 1위
연구팀이 개발한 JU_NLP ORPO v2 모델은 공식 TIRA 평가 플랫폼에서 테스트를 받았다. 이 모델은 광고를 탐지당하지 않고 성공적으로 숨기는 능력에서 뛰어난 성과를 보였으며, 동시에 높은 정밀도를 유지했다. 같은 연구팀이 개발한 JU_NLP ORPO v1 모델도 완벽한 정밀도를 달성했지만 광고 은밀성 측면에서는 상대적으로 낮은 성능을 보였다.
비교 대상이 된 다른 유명 AI 모델들과 비교해보면, 젬마 3-12B(gemma-3-12b)와 큐웬 3-4B(qwen-3-4B) 모델들은 매우 높은 정밀도와 재현율을 보였지만 광고를 성공적으로 숨기는 능력에서는 제한적인 성과를 나타냈다. 미스트랄 7B v0.3(mistral-7b-v0.3)은 상대적으로 균형 잡힌 성능을 보였지만 여전히 연구팀 모델에는 미치지 못했다.
연구진은 사전 훈련된 모델들도 상당한 성능을 보였지만, 수동으로 필터링하거나 조정하지 않았기 때문에 우연히 광고 언어를 빼먹어서 스텔스 점수가 높게 나왔을 가능성이 있다고 분석했다.
완벽한 기만 기술의 등장… AI 윤리와 투명성 딜레마 심화
이번 연구는 AI 기술 발전과 함께 새롭게 부상하는 윤리적 딜레마를 선명하게 드러낸다. 대화형 AI가 일상화되면서 사용자들이 인지하지 못하는 사이에 광고에 노출될 가능성이 커지고 있다. 특히 이 기술이 정밀도 1.0을 달성했다는 것은 인간이 구별하기 어려운 수준의 자연스러운 광고 삽입이 가능함을 의미한다.
동시에 개발된 탐지 기술은 이러한 위험에 대한 방어막 역할을 할 수 있지만, 생성 기술의 발전 속도를 탐지 기술이 따라잡을 수 있을지는 의문이다. 더 중요한 것은 이 기술이 상업적으로 악용될 경우 소비자 보호와 정보의 투명성에 심각한 위협이 될 수 있다는 점이다. AI 업계는 기술적 성과를 넘어 윤리적 가이드라인과 규제 체계 구축에 더욱 적극적으로 나서야 할 시점이다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q: 은밀한 광고란 무엇이며 일반 광고와 어떻게 다른가요?
A: 은밀한 광고는 광고임을 명시하지 않고 자연스러운 정보 제공 형태로 제품이나 서비스를 홍보하는 방식입니다. 일반 광고와 달리 사용자가 광고를 받고 있다는 사실을 인지하기 어려워 더 교묘하고 잠재적으로 문제가 될 수 있습니다.
Q: 이 기술이 실제 서비스에 적용될 경우 소비자에게 어떤 영향을 미칠까요?
A: 대화형 AI 서비스에서 자연스럽게 특정 제품을 추천받는 경우가 늘어날 수 있습니다. 사용자는 객관적인 정보라고 생각하며 구매 결정을 내릴 수 있어, 소비자 선택권과 정보 투명성에 영향을 줄 수 있습니다.
Q: AI 기업들이 이런 기술을 어떻게 규제해야 할까요?
A: 광고 삽입 시 명확한 표시 의무화, 사용자 동의 절차 강화, 탐지 시스템 의무 도입 등의 자율 규제가 필요합니다. 또한 정부 차원에서도 AI 윤리 가이드라인에 은밀 광고 금지 조항을 포함하는 방안을 검토해야 합니다.
기사에 인용된 논문 원문은 arxiv에서 확인할 수 있다.
논문명: JU-NLP at Touché: Covert Advertisement in Conversational AI-Generation and Detection Strategies
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.