A Deep Dive into Deep Research Tools
검색에서 AI 대화형으로, 이제는 딥 리서치 시대
AI 기반 시장 정보 검색 및 분석 플랫폼 알파센스(Alphasense)가 발표한 보고서에 따르면, 지난 몇 년간 검색 기술은 키워드 기반에서 AI 대화형으로 진화했다. 이제 그 다음 단계인 ‘딥 리서치'(Deep Research)가 등장했다. 딥 리서치는 추론 모델(reasoning models)과 에이전트 기능(agent capabilities)을 결합해 복잡한 질문에 대한 포괄적이고 미묘한 답변을 제공하는 더 정교한 접근 방식이다. 딥 리서치를 특별하게 만드는 것은 단순히 출력물(흔히 출처가 표시된 긴 보고서)뿐만 아니라 그 기저의 프로세스다. 이러한 도구들은 작업을 단계별로 분해하고, 여러 출처를 검색하며, 다양한 영역의 정보를 종합한다.
워튼스쿨의 이단 몰릭(Ethan Mollick) 부교수는 링크드인에서 “고급 모델에 검색 엔진을 제공하고 필요하다고 느끼는 것을 찾아보도록 하는 RAG 전략에는 엄청난 가치가 있다”고 언급했다. 이 단순하지만 강력한 접근 방식은 오늘날 많은 딥 리서치 도구의 기반이 되어 매우 반응성이 높고 증거 기반의 분석을 가능하게 한다. 딥 리서치의 특별한 강점은 투명성에 있다. 사용자는 AI의 추론 과정을 확인하고 참조한 출처를 검토할 수 있다. 금융 분석가, 연구자 또는 지식을 찾는 호기심 많은 사람 모두 이제 종종 몇 분 안에 정교하고 검증 가능한 통찰력을 대규모로 생산할 수 있게 되었다.
오픈AI부터 제미나이까지: 딥 리서치 주요 기업 경쟁 현황
딥 리서치 도구에 대한 모멘텀이 가속화되고 있으며, 점점 더 많은 기업들이 역량 있는 제품을 선보이고 있다. 이 도구들은 단순한 질문-답변을 훨씬 넘어서서 수천 단어의 보고서를 생성하고, 출처를 인용하며, 표, 차트 및 요약과 같은 구조화된 출력물을 생성한다.
2024년 12월, 구글(Google)은 제미나이 딥 리서치(Gemini Deep Research) 도구를 처음 선보였고, 이어서 오픈AI(OpenAI), 퍼플렉시티(Perplexity), 그리고 xAI가 빠르게 뒤를 이었다. 제미나이 딥 리서치, 오픈AI의 딥 리서치, xAI의 그록 딥서치(Grok DeepSearch)(및 최근의 디퍼서치(DeeperSearch))는 독점 대형 언어 모델을 기반으로 한다. 반면 퍼플렉시티의 딥 리서치는 오픈소스 딥시크 R1(DeepSeek R1) 모델의 커스터마이즈 버전을 사용한다. 이 네 가지 모두 주로 공개적으로 이용 가능한 웹 콘텐츠에서 정보를 가져온다.
2025년 3월, 마이크로소프트(Microsoft)는 마이크로소프트 365 코파일럿(Microsoft 365 Copilot) 내에 새로운 기능인 ‘리서처(Researcher)’를 도입했다. 이 기능은 “오픈AI의 딥 리서치 모델과 마이크로소프트 365 코파일럿의 고급 오케스트레이션 및 딥 서치 기능을 결합”한다. 리서처는 웹 데이터와 함께 사용자의 내부 데이터를 활용하며, 세일즈포스(Salesforce), 서비스나우(ServiceNow), 컨플루언스(Confluence)와 같은 외부 소스의 데이터도 통합한다.
기타 딥 리서치 플레이어로는 유닷컴(You.com)의 고급 연구 및 인사이트(Advanced Research & Insights, ARI), 엘리시트 리포트(Elicit Reports), 허깅페이스(Hugging Face)의 오픈 딥 리서치(Open Deep Research) 등이 있다. 4월에는 앤트로픽(Anthropic)이 맥스(Max), 팀(Team), 엔터프라이즈(Enterprise) 플랜을 위한 클로드 리서치(Claude Research)를 도입하여 이 분야를 더욱 확장했다.
딥 리서치 도구의 장단점 비교: 학술부터 금융까지 각기 다른 강점
모든 도구가 동등하지는 않다. 딥 리서치 생태계가 계속 확장됨에 따라 사용자들은 특정 요구 사항에 따라 도구를 선택할 가능성이 높다. 각 도구가 접근하는 데이터 유형부터 결과가 형식화되고 전달되는 방식까지, 이러한 장단점은 연구 경험을 크게 좌우할 수 있다. 고려해야 할 가장 중요한 요소 중 하나는 각 도구가 접근할 수 있는 정보의 종류이다. 엘리시트는 학술 연구를 중심으로 구축되었으며 동료 검토 논문과 과학 문헌에서 정보를 추출한다. 2월에 출시된 엘리시트 리포트는 이러한 콘텐츠를 사용하여 보고서를 생성한다.
xAI의 그록 딥서치는 방대한 소셜 데이터를 활용하여 공개 담론과 트렌드 의견에 대한 실시간 통찰력을 제공한다. 마이크로소프트의 리서처는 웹 데이터와 사용자의 내부 데이터를 결합하고 외부 소스의 데이터도 통합한다. 마찬가지로 클로드의 리서치도 내부 및 웹 데이터 모두에서 검색한다. 알파센스의 딥 리서치 기능은 엔터프라이즈 인텔리전스 사용자의 내부 데이터를 통합하는 것 외에도 전문가 통화 및 브로커 연구를 포함한 프리미엄 비즈니스 인텔리전스를 전문으로 한다. 도구가 데이터를 가져오는 곳을 이해하는 것은 연구의 범위와 요구 사항에 맞는지 확인하는 데 필수적이다.
무료부터 월 200달러까지: 딥 리서치 도구의 가격 전략
가격도 딥 리서치 도구를 선택할 때 중요한 고려 사항이다. 일부 딥 리서치 도구는 무료로 이용할 수 있다. 구글은 작년 말에 딥 리서치 기능을 출시한 최초의 기업 중 하나였다. 3월에 구글은 제미나이 어드밴스드(Gemini Advanced) 구독이 필요 없이 모든 사람에게 이용할 수 있도록 했다. xAI의 딥서치는 X 계정으로 무료로 이용할 수 있다. 다른 도구들은 무료 접근과 유료 플랜을 모두 제공한다. 퍼플렉시티는 “하루에 제한된 수의 답변”에 무료로 접근할 수 있고, 프로 구독자는 무제한 쿼리를 위해 월 20달러를 지불한다. 엘리시트 리포트는 최대 10개의 논문에서 무료로 질문에 답변하며, 더 큰 문서 세트에 접근하기 위한 유료 등급이 있다.
오픈AI의 챗GPT 플러스(ChatGPT Plus) 사용자는 월 20달러를 지불하지만 월 10개의 딥 리서치 쿼리만 사용할 수 있는 반면, 월 200달러를 지불하는 챗GPT 프로(ChatGPT Pro) 사용자는 125개를 사용할 수 있다. 4월 말 기준으로 무료 사용자는 “경량” 딥 리서치 모델에 월 5개의 쿼리에 접근할 수 있다. 클로드의 리서치는 월 100달러의 맥스, 팀 또는 엔터프라이즈 구독이 필요하다.
딥 리서치 도구는 또한 더 넓은 엔터프라이즈 플랫폼에 번들로 제공되고 있다. 알파센스의 딥 리서치 도구는 브로커 연구 및 전문가 인사이트와 같은 프리미엄 콘텐츠에 대한 접근을 포함하는 더 넓은 제품의 일부가 될 것이다. 마찬가지로 마이크로소프트의 리서처 도구는 딥 리서치 기능에 대한 추가 비용 없이 마이크로소프트 365 코파일럿 라이선스가 있는 사용자가 이용할 수 있다. 일반적인 연구 목적, 특히 고도로 전문화된 데이터에 대한 접근이 필요하지 않은 경우 무료 또는 저비용 도구가 충분할 수 있다.
텍스트 너머의 시각화: 차트와 팟캐스트까지 지원하는 멀티모달 딥 리서치
현대 연구 도구는 단순히 텍스트 덩어리를 전달하는 것을 넘어, 가독성 있고 구조화되며 시각적으로 매력적인 출력물을 제공하는 것을 목표로 한다. 멀티모달 기능이 정의적인 특징이 되고 있다. 오픈AI, 구글, 퍼플렉시티, 알파센스와 같은 딥 리서치 도구는 텍스트를 넘어 차트나 표를 포함하여 연구자가 다양한 데이터 유형에서 통찰력을 얻을 수 있게 한다. 이는 연구 경험을 풍부하게 하고 모든 주제에 대해 더 전체적인 관점을 제공한다.
구글의 딥 리서치는 표를 위한 “시트로 내보내기” 기능이 있어 사용자가 스프레드시트 환경에서 분석을 계속할 수 있다. 또한 사용자는 “문서로 내보내기” 버튼을 클릭하여 전체 출력을 Google 문서로 원활하게 변환할 수 있어 공유, 편집 또는 기존 워크플로우에 통합하기 쉽다. 구글의 제미나이 앱은 또한 사용자가 딥 리서치를 기반으로 팟캐스트를 생성할 수 있게 한다. 제미나이가 보고서 생성을 마치면 사용자는 “오디오 개요 생성” 옵션을 선택하여 연구 기반의 오디오 개요를 들을 수 있다.
일부 도구는 긴 심층 보고서를 생성하는 반면, 다른 도구는 짧고 소화하기 쉬운 요약에 맞춰져 있다. 알파센스의 딥 리서치 도구와 엘리시트 리포트는 주요 이점을 가진 포괄적인 응답을 제공한다. 즉, 사용자가 별도 페이지로 이동하지 않고도 딥 리서치 출력 내에서 각 인용의 정확한 위치를 즉시 볼 수 있다.
직관적 인터페이스와 이메일 알림: 사용자 친화적인 연구 경험
전반적으로 딥 리서치 도구는 단순성과 접근성을 강조한다. 사용자는 고품질 출력물을 생산하기 위해 전문가일 필요가 없다. 인터페이스는 일반적으로 최소화되고 직관적이어서 도구의 복잡성이 아닌 콘텐츠에 초점을 맞출 수 있다. 또 다른 특징은 사용자가 출력에 대한 후속 질문을 할 수 있도록 설계되어 있다는 점이다.
워크플로우 효율성을 향상시키기 위해 일부 도구는 알림 옵션도 제공한다. 예를 들어, 퍼플렉시티의 딥 리서치는 보고서가 준비되면 이메일 알림을 받을 수 있는 옵션을 사용자에게 제공한다. 엘리시트 리포트는 기본적으로 보고서가 생성되면 이메일 알림을 보낸다.
일부 도구는 사용자 지정을 강화하는 대화형 컨트롤도 제공한다. 예를 들어, 구글 제미나이의 딥 리서치는 사용자가 생성 전에 연구 계획을 편집할 수 있게 하여 더 타겟팅되고 유연한 탐색을 가능하게 한다. 한편, 오픈AI의 딥 리서치는 응답을 생성하기 전에 쿼리의 의도를 더 잘 이해하기 위해 명확한 후속 질문을 하는 대화형 접근 방식을 취한다.
발전하는 AI 딥 리서치의 정확성과 신뢰성
모든 생성형 AI와 마찬가지로 딥 리서치 도구도 특히 정확성, 환각, 잠재적 편향과 관련하여 결함이 없지는 않다. 예를 들어, 퍼플렉시티의 딥 리서치 사용자들은 출처를 인용함에도 불구하고 때때로 오래된 정보와 잘못된 정보를 제공할 수 있다고 지적했다. 이것은 퍼플렉시티에만 국한된 것이 아니라, 실시간으로 여러 소스의 정보를 종합하는 대형 언어 모델의 더 넓은 도전을 반영한다.
최근 성능 벤치마크는 이러한 도구들의 비교에 도움이 된다. AI에 대한 가장 어려운 테스트 중 하나로 간주되는 ‘Humanity’s Last Exam(HLE)’에서 오픈AI의 딥 리서치는 현재 선두인 26.6%의 정확도를 기록했다. 퍼플렉시티의 점수는 21.1%였다. 3월에 출시된 구글의 제미나이 2.5 프로 모델은 웹 검색이나 다른 도구를 사용하지 않고도 18.8%의 정확도를 달성했다. 비교를 위해 딥시크 R1은 9.4%, 클로드의 3.7 소넷 모델은 8.9%의 점수를 기록했다.
편향은 또 다른 우려 사항이다. 예를 들어, 구글의 딥 리서치는 구글의 검색 인덱스에 의존하며 SEO에 최적화된 콘텐츠를 선호할 수 있다. 인라인 인용을 명확하게 표시하면 사용자가 정보를 빠르게 확인할 수 있다. 위에서 언급했듯이 알파센스와 엘리시트의 딥 리서치 도구는 보고서에서 벗어날 필요 없이 출력 내에서 직접 각 인용의 정확한 위치를 표시한다. 딥 리서치 도구가 더 강력해짐에 따라 신뢰 구축은 모델 정확도 향상뿐만 아니라 사용자가 AI 생성 결과를 더 잘 해석하고 감사할 수 있도록 돕는 데에도 달려있다.
속도 vs 깊이: 트레이드오프의 균형
많은 사용자에게 30분을 기다리는 것은 깊이 연구된 다중 소스 보고서를 위한 가치 있는 교환일 수 있다. 그러나 다른 사용자들, 특히 시간 제약 하에서 작업하거나 빠른 통찰력을 찾는 사용자들은 속도를 우선시할 수 있다. 퍼플렉시티의 딥 리서치 도구는 속도를 우선시하여 3분 이내에 쿼리 결과를 반환한다. xAI와 유닷컴의 딥 리서치 도구는 속도와 깊이의 균형을 맞추어 약 5분 내에 응답을 제공한다. 구글의 제미나이 딥 리서치는 약간 느려서 일반적으로 10분 이내에 출력을 생성한다.
스펙트럼의 다른 끝에서는 오픈AI와 알파센스의 딥 리서치 도구가 매우 포괄적인 응답을 제공하지만 사용자는 완료까지 최대 30분을 기다려야 할 수 있다. 즉각성보다 깊이와 세부 사항을 중시하는 사용자에게는 이러한 교환이 충분히 가치가 있을 수 있다.
다중 모달, 산업별 특화: 딥 리서치의 미래 방향성
딥 리서치의 혁명은 단일 도구나 회사에 관한 것이 아니다. 그것은 우리가 정보에 접근하고, 분석하고, 행동하는 방식의 근본적인 변화를 나타낸다. 대형 언어 모델과 실시간 검색, 멀티모달 기능, 직관적인 사용자 인터페이스를 결합함으로써 연구 프로세스는 더 빠르고, 스마트하며, 접근하기 쉬워지고 있다.
앞으로 딥 리서치 도구는 계속 발전할 것이다. 텍스트, 이미지, 오디오, 비디오 전반에 걸친 분석을 가능하게 하는 더 고급 멀티모달 기능을 기대할 수 있다. 이러한 도구는 내부 및 외부 데이터에 대한 원활한 접근을 가능하게 하면서 엔터프라이즈 워크플로우에 더 깊이 내장될 것이다. 동시에 금융, 법률, 의료, 정책과 같은 분야의 고유한 요구 사항에 맞춘 산업별 딥 리서치 솔루션의 부상을 볼 수 있을 것이다.
기업 전략가, 투자 은행 분석가, 정책 연구원, 학자 또는 단순히 호기심 많은 마음을 가진 사람이든, 이러한 혁신을 수용하는 것은 지식을 생성하고 결정을 내리는 데 있어 더 연결되고, 통찰력 있으며, 효율적인 접근 방식을 활용하는 것을 의미한다. 딥 리서치 도구는 단지 AI의 새로운 단계를 알리는 것이 아니라 지식 발견을 위한 더 지능적이고 통합된 미래의 시작을 의미한다.
FAQ
Q: 딥 리서치 툴이란 정확히 무엇이며 일반 검색 엔진과 어떻게 다른가요?
A: 딥 리서치 툴은 단순히 키워드를 매칭하는 일반 검색 엔진과 달리, 추론 모델과 에이전트 기능을 결합해 복잡한 질문에 대해 여러 출처에서 정보를 검색하고 종합하는 AI 시스템입니다. 이 도구들은 질문을 단계별로 분석하고, 다양한 출처에서 증거를 수집하며, 종합적인 보고서 형태로 결과를 제공합니다. 정보의 출처도 함께 제공하여 투명성을 높인 점이 특징입니다.
Q: 무료로 사용할 수 있는 딥 리서치 툴이 있나요?
A: 네, 여러 무료 옵션이 있습니다. 구글의 제미나이 딥 리서치는 구독 없이 무료로 사용할 수 있으며, xAI의 딥서치는 X 계정만 있으면 무료입니다. 또한 퍼플렉시티와 엘리시트 리포트는 제한된 기능을 무료로 제공하고, 오픈AI는 월 5회까지 ‘경량’ 딥 리서치 기능을 무료 사용자에게 제공합니다. 무료 도구들은 일반적인 연구 목적에 충분히 유용할 수 있습니다.
Q: 딥 리서치 툴의 정확성은 얼마나 신뢰할 수 있나요?
A: 딥 리서치 툴은 발전하고 있지만 완벽하지는 않습니다. 현재 가장 성능이 좋은 오픈AI의 딥 리서치도 HLE 테스트에서 26.6%의 정확도를 보여, 여전히 개선의 여지가 있습니다. 이러한 도구들은 때때로 오래되거나 부정확한 정보를 제공할 수 있으므로, 제공된 출처를 직접 확인하는 것이 중요합니다. 대부분의 도구는 출처 인용 기능을 제공하여 사용자가 정보를 검증할 수 있게 합니다. 중요한 의사결정에는 여러 출처를 통한 교차 검증이 필요합니다.
해당 기사에서 인용한 리포트는 링크에서 확인할 수 있다.
기사는 클로드와 챗GPT를 활용해 작성되었습니다.