핀란드 메트로폴리아 응용과학대학 연구팀이 대규모 언어모델을 활용해 하루치 뉴스를 일주일 단위 인사이트로 자동 변환하는 시스템 ‘ORACLE(오라클)’을 개발했다. 이 시스템은 매일 수집한 핀란드 뉴스를 정치·경제·사회·기술·환경·법률 6개 분야로 나누고, 시간 흐름에 따라 변화하는 요약본을 만들어 대학의 의사결정을 돕는다.
해당 연구 논문에 따르면, 오라클은 단순히 뉴스를 모으는 것을 넘어, 일주일마다 ‘무엇이 새로 생겼는지’, ‘무엇이 사라졌는지’, ‘무엇이 바뀌었는지’를 자동으로 찾아내 대학 관점에서 분석한다. 연구팀은 전문가 회의나 보고서 작성 같은 전통적 방식으로는 매일 쏟아지는 정보를 따라잡을 수 없다고 설명했다.
매일 뉴스 수집하고 변경 사항까지 추적하는 자동화 시스템
오라클은 핀란드 공영방송 같은 주요 언론사의 뉴스를 매일 자동으로 수집한다. 시스템은 뉴스 원본을 보관하면서 핵심 내용만 따로 추출한다. 특히 같은 기사라도 제목이나 내용이 수정되면 이를 감지해 새 버전으로 저장한다. 덕분에 중복된 기사는 걸러내면서도 뉴스가 어떻게 바뀌었는지 기록을 남길 수 있다.
수집된 뉴스는 대학과 관련 있는지 2단계로 걸러진다. 첫 번째 단계에서는 대학 이름, 교육, 연구개발, 지역 산업 같은 키워드로 관련 없는 기사를 빠르게 제거한다. 두 번째 단계에서는 ‘기술 지원금’, ‘교육과정 개편’, ‘지역 혁신’ 같은 미리 준비한 예시 문장과 얼마나 비슷한지 비교해, 애매한 기사도 의미상 가까우면 남긴다. 지금은 관련 없어 보이는 기사도 따로 저장해뒀다가 나중에 필요하면 다시 쓸 수 있다.
각 뉴스는 오픈AI의 텍스트 변환 기술로 처리돼 출처, 발행일, 분야 등의 정보와 함께 데이터베이스에 저장된다. 소규모 AI 분류기가 각 뉴스를 정치·경제·사회·기술·환경·법률 중 하나로 자동 분류한다.

뉴스를 2단계로 압축해 일주일 전체 흐름을 한눈에
오라클의 핵심 기술은 시간에 따라 변하는 요약 구조를 만드는 것이다. 매일 뉴스가 쌓이지만, 일주일에 한 번씩 2단계로 정리된 요약본을 만든다. 모든 뉴스는 하나의 지식 저장소에 계속 쌓이기 때문에, 새 요약을 만들 때 과거 데이터도 함께 참고할 수 있다. 덕분에 주제가 천천히 변하거나 완전히 새로운 이야기가 나타나는 것을 감지할 수 있다.
요약은 2단계로 만들어진다. 1단계에서는 비슷한 뉴스끼리 묶어 묶음마다 사실 중심의 요약문을 만든다. 이름, 날짜, 숫자, 관계 같은 구체적 정보가 담긴다. 2단계에서는 1단계 요약을 다시 묶어 더 큰 주제의 요약을 만든다. 이때는 전반적인 흐름, 경향, 시사점에 초점을 맞추고 구체적 내용은 줄인다. 2단계 요약이 그 주의 전체 상황을 보여준다.
시스템 안정성을 위해 뉴스가 적을 때는 간단한 방식을, 많을 때는 더 효율적인 방식을 자동으로 선택한다. 일주일마다 만들어진 요약은 나중에 다시 확인하거나 빠르게 불러올 수 있도록 저장된다.
일주일 사이 무엇이 새로 생기고 사라졌는지 자동으로 찾아내
연속된 두 주의 요약을 비교해 변화를 찾아낸다. 새 요약마다 이전 주에서 가장 비슷한 요약을 찾아 유사도 점수를 매긴다. 점수가 0.90 이상이면 ‘안정'(거의 변화 없음), 0.70~0.90이면 ‘변화'(내용이 바뀜), 0.70 미만이면 ‘추가'(새로 생김)로 분류한다. 이전 주에는 있었는데 이번 주에 매칭되지 않은 요약은 ‘제거'(사라짐)로 표시된다. 이렇게 하면 막연한 느낌이 아니라 명확한 변화 내역을 얻을 수 있다.
새로 추가되거나 제거된 내용은 사람이 이해하기 쉬운 주제로 정리된다. AI가 각 텍스트에 짧은 라벨을 붙이고, 통계 기법으로 비슷한 라벨끼리 묶어 최종 주제를 만든다. 결과적으로 단계마다 ‘주제 이름, 새로 추가된 내용, 제거된 내용’으로 구성된 목록을 얻는다.
사용자가 관심 분야를 선택하면 각 주제에 대해 제목, 분석 내용, 단계, 그룹, 중요도(0~1점) 형태로 정리된 분석 결과를 받는다. 결과는 데이터베이스에 저장돼 같은 질문을 다시 해도 똑같은 답을 빠르게 받을 수 있다.
AI가 뉴스 읽고 ‘양자컴퓨팅 교육 추가하라’ 제안
연구팀은 오라클의 실제 활용 사례를 소개했다. 한 분석가가 정치와 기술 분야 동향을 확인하려고 23주 차와 28주 차를 비교했다. 오라클은 두 가지 새로운 큰 주제를 강조했다. 유럽연합의 디지털 기술 지원금과 양자컴퓨팅 정책 강화였다. 1단계 요약에서는 프로그램 이름, 지원금 규모, 관련 기관 같은 구체적 사실을 확인할 수 있었다.
분석 결과는 다음과 같은 실행 방안을 제시했다. 유럽연합 기술 기준에 맞춰 선택 수업을 조정하고, 양자컴퓨팅 기초 과정(이론+실습)을 신설하며, 지역 산업체 연구소와 협력을 모색하라는 것이다. 여기서 중요한 것은 미래를 예측하는 것이 아니라, 대학 상황에 맞는 실행 가능한 제안을 근거와 함께 제시한다는 점이다.
구체적인 교육과정 조정 외에도 오라클의 결과물은 여러 학과가 협력할 때 공통 근거 자료로 쓸 수 있다. 모든 제안이 실제 뉴스와 요약으로 연결되기 때문에, 각 학과는 임시방편이나 개인 의견이 아닌 객관적 자료를 바탕으로 결정을 정당화할 수 있다. 이런 추적 가능성은 나중에 결정을 다시 검토할 때도 유용하다. 몇 달 뒤 그 결정이 어떤 정보를 바탕으로 내려졌는지 정확히 확인할 수 있기 때문이다.
실제로 이 시스템은 월간 동향 점검, 연간 전략 수립, 인증 준비 같은 일상적인 업무에 활용 가능하며, 분석가가 매번 처음부터 상황을 파악할 필요를 없앤다. 같은 방식으로 연구 우선순위 결정, 관계자 참여, 지역 협력 계획 같은 다른 의사결정에도 쓸 수 있다.
오라클은 계속 반복되는 배경 이야기와 새로 떠오르는 약한 신호를 모두 잡아내기 때문에, 일시적 유행과 진짜 구조적 변화를 구분하는 데 도움이 된다. 빠르게 변하는 기술과 정책 환경에서 운영되는 대학에 이런 구분은 매우 중요하다. 실험실 건설이나 학위 개편 같은 장기 프로젝트는 지속 가능한 경향의 증거가 필요하고, 단기 자격증 시범 사업 같은 빠른 대응은 새로운 기회를 빨리 발견하는 것이 중요하다. 두 관점을 하나의 반복되는 구조에 담아냄으로써 오라클은 기술 전문가가 아닌 사람도 이런 다층적 판단을 할 수 있게 만든다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q1. 오라클의 2단계 요약 구조는 무엇인가요?
A: 오라클은 매일 수집된 뉴스를 일주일 단위로, 2단계로 압축합니다. 1단계에서는 비슷한 뉴스끼리 묶어 사실 중심 요약을 만들고, 2단계에서는 이것들을 다시 묶어 전체 흐름과 시사점을 정리합니다. 일주일 사이 비교를 통해 새로 생긴 주제, 바뀐 주제, 사라진 주제를 자동으로 찾아냅니다.
Q2. 정치·경제·사회·기술·환경·법률 분석은 왜 중요한가요?
A: 이 6개 분야는 조직 외부 환경을 체계적으로 분석하는 대표적인 방법입니다. 오라클은 각 뉴스를 이 6개 분야로 자동 분류하고, 사용자가 선택한 관점에 따라 분석합니다. 덕분에 조직은 여러 각도에서 변화를 이해하고 대응 전략을 세울 수 있습니다.
Q3. 오라클은 어떻게 정확성을 보장하나요?
A: 오라클은 모든 요약이 원본 뉴스로 추적 가능하도록 설계됐습니다. AI가 만든 요약은 사실 중심으로 작성되도록 유도하고, 모든 결과는 원본과 변경 기록과 함께 저장됩니다. 의사결정자는 AI가 제시한 내용의 근거를 언제든 확인할 수 있어, 믿을 수 있는 전략 수립이 가능합니다.
해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.
논문명: ORACLE: Time-Dependent Recursive Summary Graphs for Foresight on News Data Using LLMs
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.






