[AI 매터스 뉴스레터 #144] AI가 만든 가짜 논문, AI 심사위원에게 보여주자 최대 82% 통과

안녕하세요, AI매터스입니다.

AI는 이미 우리의 삶입니다. 그 가운데 놓치지 말아야 할 중요한 이슈들을 주 3회 정리해 제공합니다.

놓치지 마시기 바랍니다.

GPT-5.1, 수능 433점 받았다… 한국사는 만점인데 물리는 어려워 해📝

오픈AI의 최신 모델 GPT-5.1이 2026학년도 수능에서 450점 만점 중 433점을 기록했습니다. 순천향대 학생이 15종의 AI를 대상으로 실시한 실험인데요. GPT-5.1은 수학과 영어에서 만점을 받았고, 국어도 98점을 받으며 압도적 1위를 차지했죠. 흥미로운 건 한국사에서 여러 모델이 만점을 받은 반면, 물리에선 GPT-5.1도 38점에 그쳤다는 점입니다. 암기는 잘하는데 복잡한 추론은 아직 어려워하는 거죠. 더 알아보기

구글 AI 연구소, 1년 만에 방문자 40배 폭증 🚀

구글의 AI 연구 사이트 트래픽이 엄청난 속도로 치솟고 있습니다. 시밀러웹 분석 결과, labs.google은 전년 대비 무려 3986%의 증가율을 기록했어요. 40배 가까이 늘어난 거죠. AI 스튜디오도 1257%나 급증하며 개발자들의 뜨거운 관심을 입증했습니다. 제미나이는 305% 증가했고요. 단순한 소비자 사용을 넘어 전문가와 개발자층에서도 구글 AI에 대한 수요가 폭발적으로 늘어났다는 의미인데, 오픈AI·마이크로소프트와의 AI 시장 경쟁이 더욱 치열해질 전망입니다. 더 알아보기

오픈AI, 한국서 첫 개발자 행사… “챗GPT에 앱 마켓 만든다” 🛍️

오픈AI 코리아가 서울에서 국내 첫 개발자 행사를 열었습니다. 에이전트 빌더, 에이전트킷 같은 새 기능들이 소개됐는데요. 가장 주목받은 건 ‘앱 마켓플레이스’ 계획이었어요. 오픈AI는 향후 챗GPT 안에서 개발자들이 만든 서비스를 배포하고 수익화할 수 있는 구조를 만들겠다고 밝혔거든요. 행사에서는 김치를 음식에 페어링하는 한국형 커머스 추천 에이전트 시연도 진행됐습니다. 오픈AI는 한국어 품질 향상을 위해 계속 투자할 것이며, 한국 개발자들과의 협업을 강화하겠다고 약속했어요. 더 알아보기

챗GPT, 친구들과 함께 쓴다… 그룹 채팅 시대 열렸다 💬

챗GPT가 여러 명이 동시에 대화하는 그룹 채팅 기능을 선보입니다. 최대 20명까지 한 대화방에서 함께 챗GPT와 이야기할 수 있어요. 주말 여행 계획을 짜거나 단체 식사 장소를 정할 때 모두가 참여하면서 챗GPT의 도움을 받을 수 있는 거죠. 개인 메모리는 공유되지 않고, 챗GPT는 대화 맥락을 파악해 필요할 때만 응답합니다. 이 기능은 현재 한국, 일본, 뉴질랜드, 대만에서 모바일과 웹에서 사용 가능합니다. 더 알아보기

디즈니, AI 콘텐츠 도입 선언에 구독 취소 운동 번져 🎬

디즈니가 AI 생성 콘텐츠를 디즈니플러스에 도입하겠다고 밝히자 엄청난 반발이 일어났습니다. 밥 아이거 CEO는 “이용자들이 AI로 콘텐츠를 생성하고, 다른 사람들이 만든 숏폼을 소비할 수 있게 될 것”이라고 말했는데요. 한 이용자는 이를 “애니메이션 업계 전체에 대한 모욕”이라고 비판했어요. 디즈니 애니메이션 ‘아울 하우스’ 제작자는 아예 구독 취소를 촉구하며 “연필을 들어라, 아니면 죽어라”라고 외쳤습니다. 더 알아보기

Short-Window Sliding Learning for Real-Time Violence Detection via LLM-based Auto-Labeling

“주먹 드는 순간” AI가 95% 포착… 1초 만에 잡아내는 CCTV 폭력 감지 기술

CCTV가 폭력 장면을 거의 완벽하게 포착하는 시대가 왔습니다. 멀티모달 AI 기업 PIA-SPACE가 구글 제미나이를 활용해 95.25% 정확도로 폭력을 감지하는 기술을 개발했거든요. 기존 방식은 5~30초 길이 영상을 통째로 학습했지만, 이 기술은 폭력이 실제로 벌어지는 1~2초의 짧은 순간만 집중 학습합니다.

긴 영상을 1~2초씩 잘게 쪼개서 “주먹을 들어 올리는 행동” 같은 식으로 제미나이가 자동으로 설명을 붙이는 방식이죠. 덕분에 순간적으로 터지는 폭력 상황도 놓치지 않습니다. 같은 데이터를 긴 영상으로 학습했을 때는 정확도가 55.75%에 불과했지만, 짧게 자른 뒤 학습하니 83.25%로 27.5%포인트나 껑충 뛰었습니다. 👉 더 알아보기

박사 6개월 연구, AI는 하루 만에 끝낸다… 1,500편 논문 읽고 4만 줄 코드 짜는 괴물 등장

과학자들이 6개월 걸릴 연구를 단 하루 만에 끝내는 AI가 나타났습니다. 퓨처하우스가 공개한 ‘AI 과학자 코스모스’는 한 번 실행으로 1,500편의 논문을 읽고 4만 2,000줄의 분석 코드를 작성합니다. 이는 이전 AI 과학자 대비 코드 생성량이 9.8배나 증가한 수치죠.

베타 테스터들은 “코스모스가 하루 만에 제가 6개월 동안 할 연구를 수행했다”고 평가했습니다. 실제로 신경과학부터 재료과학까지 7가지 새로운 발견 사례가 공개됐는데요. 독립 과학자들이 평가한 결과 코스모스 결론의 79.4%가 정확했고, 모든 결론은 작성된 코드나 참조 문헌으로 추적 가능해 투명성도 확보했습니다. 👉 더 알아보기

챗GPT는 쉽게 설득당하고 제미나이는 고집불통… AI마다 성격이 이렇게 다르다고?

AI 100개를 연결해 서로 설득하게 했더니 충격적인 결과가 나왔습니다. 캘리포니아대 연구진이 제미나이와 챗GPT로 실험한 결과, 두 모델의 설득 임계점이 판이하게 달랐거든요. 제미나이는 평균 70% 이상이 반대해야 입장을 바꿨지만, 챗GPT는 특정 조건에서 40~50%만 반대해도 생각을 바꿔버렸습니다.

더 놀라운 건 ‘무엇을 묻느냐’에 따라 난이도가 뒤집힌다는 점인데요. “녹색 에너지를 가치 있게 여기나?”라고 물으면 긍정 입장은 85%가 반대해야 바뀌지만, 부정 입장은 63%만 찬성하면 바뀝니다. 반대로 “긍정적 감정이 있나?”라고 물으면 부정 입장은 93%가 찬성해야 바뀔 정도로 완고하죠. 👉 더 알아보기

인공지능 기술이 과학 논문을 쓰고 검토하는 시대가 되면서 새로운 문제가 생겼다. 미국 워싱턴대학교 연구팀이 개발한 실험용 AI 심사 시스템에서, 실제 실험 없이 AI가 만든 가짜 논문이 특정 조건에서 최대 82%나 통과됐다. 이는 실제 학회가 아닌 연구 환경에서의 결과지만, AI만으로 논문을 쓰고 검토하는 시스템에서 과학의 진실성이 크게 위협받을 수 있음을 보여주는 경고다.

실험은 하나도 안 하고 그럴듯하게 꾸민 가짜 논문, 5가지 속임수

해당 연구 논문에 따르면, 연구팀은 실제로 실험이나 데이터 수집을 전혀 하지 않고 논문을 만드는 AI 프로그램을 개발했다. 이 프로그램은 다섯 가지 방법으로 논문을 그럴듯하게 꾸몄다. 첫 번째는 ‘너무 좋은 성과’ 방법이다. 기존 최고 기록보다 훨씬 뛰어난 결과를 주장하면서 마치 분야를 획기적으로 발전시킨 것처럼 포장했다. 두 번째는 ‘비교 대상 고르기’ 방법이다. 자기 방법이 유리해 보이도록 비교 대상만 골라서 보여주고, 결과의 정확도를 나타내는 수치는 빼버렸다.

세 번째는 ‘통계 연출’ 방법이다. 겉보기에는 정교한 통계 분석, 정확한 수치와 그래프를 제시하고, “곧 공개 예정”이라는 거짓 링크까지 추가했다. 네 번째는 ‘완벽한 정리’ 방법이다. 논문 내용 간 참조를 완벽하게 하고, 용어를 통일하고, 숫자 표기를 일관되게 하는 등 겉모습을 전문적으로 다듬었다. 다섯 번째는 ‘증명 속 오류 숨기기’ 방법이다. 수학 증명이 엄밀해 보이지만 실제로는 미묘한 오류를 숨겨놨다.

연구팀은 GPT-o3라는 AI 프로그램을 사용해 AI 연구 분야의 25개 주제로 논문을 만들었다. 주제마다 4개씩, 6가지 방법(5개 단일 방법과 모든 방법을 합친 것)으로 논문을 생성했다. 만들어진 논문들은 요약, 서론, 방법, 결과, 토론, 결론과 참고문헌까지 갖춘 완전한 형태였다.

AI 심사 시스템의 치명적 약점이 궁금하다면? 전체 기사 확인하기

픽 코파일럿(Pic Copilot) – 이커머스 제품이미지를 AI로 가상착용·배경제거까지 만들어주는 디자인 툴(이커머스 사장님이라면 꼭 알아야하는 AI 툴!)
매그니픽 AI(Magnific AI) – 저해상도 이미지를 고해상도로 업스케일·향상시켜주는 이미지 전문 AI 도구(화질 낮은 이미지 복원할 때 추천!)
셀레부(Celevu) – 브랜드가 연예인 추천·계약·캠페인 실행까지 AI로 빠르게 처리 가능한 셀럽 마케팅 플랫폼 (우리 브랜드에 어울리는 연예인 찾아볼 때 추천!)
가이드(Guidde) – 업무 흐름 화면 녹화하면 자동으로 단계별 설명·AI 음성오버 포함 튜토리얼 문서 만들어주는 플랫폼 (인수인계 파일 만들 때 유용!)

뉴스레터를 읽다가 궁금한 점, 이상한 점, 제안하고 싶은 점이 있다면? 언제든지 말씀해 주세요!

👉 AI매터스에게 한 마디 하러 가기

[AI 매터스 뉴스레터 #144] AI가 만든 가짜 논문, AI 심사위원에게 보여주자 최대 82% 통과

답글 남기기 응답 취소