[AI 매터스 뉴스레터 #150] 2025년 하반기 한국 생성형 AI 시장 총정리

안녕하세요, AI매터스입니다.

AI는 이미 우리의 삶입니다. 그 가운데 놓치지 말아야 할 중요한 이슈들을 주 3회 정리해 제공합니다.

놓치지 마시기 바랍니다.

오픈AI, “비상사태!” 외치며 챗GPT 개선에 총력전 🚨

오픈AI 샘 알트만 CEO가 직원들에게 ‘코드 레드(비상사태)’를 선언했습니다. 챗GPT 품질 개선이 급하다며 준비 중이던 광고 사업 같은 다른 계획들은 모두 뒤로 미루겠다는 건데요. 새로운 수익 모델보다 핵심 제품 성능을 먼저 끌어올리겠다는 의지로 보입니다. 오픈AI가 비상 체제에 돌입한 건 구글 제미나이 3의 충격파 때문일까요? 더 알아보기

2025년 가장 중요한 기술은? NYT “데이터센터가 1위, 챗GPT는 3위” 🏆

뉴욕타임스가 뽑은 올해의 기술 1위는 다름 아닌 ‘데이터센터’였습니다. AI 시대의 핵심 인프라인 데이터센터를 “인류 역사상 최대 인프라 프로젝트”라고 평가했거든요. 챗GPT는 주간 사용자 8억 명을 돌파하며 3위에, 적은 비용으로 놀라운 성능을 보여준 중국의 딥시크는 8위에 올랐습니다. 화려하게 등장했다가 반품이 판매량보다 많았던 휴메인 AI 핀(38위)처럼 실패 사례도 함께 소개됐네요. 더 알아보기

런웨이, “머리카락 한 올까지 살린다” 차세대 영상 AI ‘Gen-4.5’ 출시 🎥

AI 영상 스타트업 런웨이가 현존하는 모든 경쟁 모델을 제친 ‘Gen-4.5’를 공개했습니다. 업계 벤치마크에서 무려 1,247점을 기록하며 당당히 세계 1위에 오른 건데요. 머리카락 한 올, 천 재질의 결까지 섬세하게 표현하고 물이 물리 법칙대로 흐르는 등 현실감이 압도적이라고 합니다. 엔비디아와의 긴밀한 협업으로 탄생한 이 모델, 며칠 내로 모든 사용자가 기존 구독료로 이용할 수 있다니 기대되네요! 더 알아보기

클링 AI, 영상 제작 올인원 모델 공개 🎬

중국 AI 기업 클링이 세계 최초로 비디오 생성의 모든 것을 한 모델에 담은 ‘비디오 O1’을 공개했습니다. 텍스트 투 비디오부터 영상 편집, 스타일 변환까지 무려 18가지 기능이 하나에! “행인 삭제”, “낮을 해질녘으로 변경” 같은 간단한 명령어만 입력하면 끝이라고 하네요. 자체 평가 결과 구글 비오(Veo) 대비 247%, 런웨이 알레프 대비 230%의 승률을 기록했다니 성능도 검증됐나 봅니다. 더 알아보기

자율주행차도 이제 “생각하며” 운전한다… 엔비디아, 오픈소스 추론 모델 공개 🚗

엔비디아가 사람처럼 상황을 판단하는 자율주행 AI 모델을 세계 최초로 오픈소스로 공개했습니다. ‘드라이브 알파마요-R1’이라는 이름의 이 모델은 복잡한 교차로나 무단횡단 가능성이 있는 보행자 앞에서 스스로 생각하고 최적의 판단을 내린다고 하는데요. 깃허브와 허깅페이스에서 다운받아 연구에 활용할 수 있다니, 자율주행 기술이 한층 더 빠르게 발전할 것 같네요. 더 알아보기

거짓말쟁이 못 찾는 AI들, 마피아 게임 대참사 🎭🚫💀

GPT-4o, 제미나이, 클로드 등 최고급 AI 12개를 마피아 게임에 투입했더니 전멸했습니다. 도쿄대 연구팀이 진행한 거짓말 탐지 실험에서 최고 성적을 낸 GPT-4o-mini조차 정답률이 39.4%에 불과했거든요. 191개 게임 영상에서 2,360개 발언을 분석했는데, 일부 AI는 정답률이 10% 이하로 추락했습니다. AI들은 “나는 마을 주민이야” 같은 정체 선언에서 평균 정답률 15.7%밖에 안 나왔고요. 더 큰 문제는 대부분 AI가 판단을 회피하며 “판단할 수 없음”으로 도망쳤다는 점입니다.

연구팀은 AI에게 상대방의 속마음을 읽는 ‘마음 이론’이 없고, 표정과 목소리 같은 비언어적 신호도 해석 못 한다고 밝혔는데요. AI가 온라인 사기 탐지나 가짜 뉴스 판별에 쓰이고 있다는데, 이 정도로 괜찮은 걸까요? 👉 더 알아보기

“대통령 순서 맞춰봐” AI한테 시켰더니… 완전 뒤죽박죽 📅🤦‍♂️

AI로 주식 예측하는 시대라면서요? UC 버클리와 컬럼비아대 연구팀이 GPT-4.1, GPT-5, 클로드 3.7 등 최신 AI에게 역사적 사건을 시간 순서대로 정렬하라고 시켰습니다. 결과는? GPT-4.1은 2개 정렬은 100% 맞췄지만, 5개만 되도 정답률이 45%로 폭락했습니다. 10개는 10%, 20개 이상은 정답률 0%였습니다. 더 황당한 건 “버지니아 출신 대통령만 골라서 나열해봐” 같은 조건부 정렬인데요. 100번 시도해서 단 한 번도 완벽하게 맞추지 못했습니다. AI가 이름과 성을 헷갈리거나 조건에 맞지 않는 사람을 자꾸 넣었거든요.

해결책은 있었습니다. 클로드의 ‘확장 사고’ 기능을 켜거나 GPT-5를 ‘중간’ 이상 설정으로 돌리니까 정답률이 100%로 치솟았죠. AI도 사람처럼 ‘생각할 시간’이 필요하다는 뜻입니다. 문제는 이게 공짜가 아니라는 거죠. AI로 금융 예측하시는 분들, 이거 보셨나요? 👉 더 알아보기

“최신AI가 무조건 좋을까?” 5년 전 AI가 ‘희망’ 찾는 실험서 신형 모델 압살 🤖⚡️

AI는 무조건 최신 모델이 좋다고요? 텍사스공대 연구진이 충격적인 실험 결과를 공개했습니다. 2018년 출시된 구형 AI ‘BERT’가 희망이라는 감정을 찾아내는 테스트에서 정확도 84.49%로 1위를 차지한 겁니다. 2019년 GPT-2(79.34%)와 2021년 DeBERTa(80.70%) 모델을 모두 제쳤죠.

더 놀라운 건 속도입니다. BERT는 학습에 443초가 걸린 반면, DeBERTa는 704초나 걸렸거든요. 처리 속도는 거의 2배 빠른데 정확도는 더 높다니, 대체 신형 AI는 뭐하는 거죠? 복잡한 5단계 희망 분류 테스트(희망 없음, 막연한 희망, 현실적 희망, 비현실적 희망, 비꼬는 말)에서도 BERT가 72.03%로 최고 성능을 기록했다고 하는데요. 👉 더 알아보기

생성형 AI 시장이 폭발적으로 성장하고 있지만, 정작 한국 사용자들이 어떤 AI를 얼마나 쓰고 있는지에 대한 종합적인 데이터는 부족했다. 국내 사용자들은 실제로 어떤 툴을 가장 많이 찾고 있을까? 얼마나 툴을 많이 언급하고 추천하고 있을까? AI 전문 정보 플랫폼 AI 매터스는 창간 1주년을 맞아 이 궁금증에 답하고자 했다.

종합 데이터, 어떻게 측정했나?

이번 차트는 단순 인기 투표나 일시적 트렌드가 아닌, 다각적인 데이터를 종합 분석한 결과다. 측정 기준은 크게 세 가지다.

첫째, 국내 웹트래픽이다. 복수의 웹사이트 분석 업체에서 제공하는 각 AI 서비스의 국내 웹사이트 트래픽을 수집해 교차 검증했다. 둘째, 소셜 버즈량이다. 소셜미디어와 온라인 커뮤니티에서 해당 AI가 월별로 얼마나 언급되고 있는지를 분석했다. 셋째, 전문가 평가 점수다. AI 분야 전문가들의 정성적 평가를 반영해 단순 사용량만으로는 포착하기 어려운 품질과 영향력을 보완했다.

이 세 가지 지표를 종합해 100점 만점의 점수로 환산했으며, 분석 기간은 2025년 6월부터 10월까지 5개월간이다. 국내 생성형 AI에 대한 관심도를 객관적 지표로 정리해 시장의 흐름을 명확하게 보여주고자 했다.

챗GPT, 제미나이 등 ‘범용 AI’가 상위권 장악

Top 10 차트에서 가장 눈에 띄는 것은 범용 생산성 AI의 강세다. 이제는 ‘국민 AI’가 된 챗GPT가 86.8점으로 1위를 차지했고, 제미나이(84.8점), 노션AI(73.2점), 클로드(70.4점)가 그 뒤를 이었다. 이중 챗GPT, 제미나이, 클로드는 특정 기능에 국한되지 않고 검색, 문서 작성, 코딩, 분석 등 다양한 업무를 처리할 수 있는 범용 AI라는 공통점이 있다.

챗GPT는 오픈AI가 개발한 대화형 AI로, 2022년 출시 이후 생성형 AI 대중화를 이끈 서비스다. 텍스트 생성, 코딩, 번역, 데이터 분석 등 영상 생성을 제외한 거의 모든 영역에서 활용되며, 현재는 GPT-5.1을 포함한 최신 모델을 기반으로 음성 대화까지 기본으로 지원한다. 특히 지난 3월 이미지 생성 기능이 강화된 모델 추가되며, 국내 사용자가 크게 늘었다. ▶챗GPT 관련 소식 모아보기

제미나이는 구글이 개발한 멀티모달 AI로, 구글 검색 및 워크스페이스와의 연동이 강점이다. 최신 정보 검색과 긴 문맥 처리에서 높은 성능을 보인다. 특히 지난 8월 ‘나노바나나’라는 별칭의 이미지 생성 모델이 일관성 유지에 탁월하다는 후기가 이어지며 국내 사용자가 꾸준히 증가했다. ▶제미나이 관련기사 모아보기

노션은 생산성 도구로 AI 기능을 탑재하면서 사용자 폭이 확대된 경우이다. 문서 요약, 글쓰기 보조, 번역, 브레인스토밍 등을 노션 환경 안에서 바로 수행할 수 있어, 별도 AI 서비스로 이동할 필요가 없다. 기본 노션 구독과 별개로 추가 구독을 통해 사용할 수 있으며, 개인 사용자부터 팀 전체의 효율성을 높이는 강력한 협업 도구로 빠르게 자리 잡고 있다. 노션이 AI 툴 3위에 오른 것은 사용자들이 새로운 툴을 배우기보다 익숙한 환경에서 AI를 활용하길 원한다는 점을 시사한다. ▶노션 관련 기사 모아보기

클로드는 앤트로픽이 개발한 AI 모델로, 초기부터 글쓰기에 탁월한 성능을 보이면서 사용자를 확대해나갔다. 최대 20만 토큰의 긴 컨텍스트를 지원해 대용량 문서 분석에 강점이 있다. 복잡한 추론과 분석 능력을 바탕으로 일반 텍스트 생성뿐만 아니라 코드 생성, 디버깅, 최적화 등의 프로그래밍 작업에서도 강력한 성능을 보여 다양한 분야에서 사용되고 있다. 최근에는 코딩에 최적화 된 기능과 성능을 업데이트하며 바이브코딩의 필수 도구로 자리잡고 있다. ▶클로드 관련 기사 모아보기

5위부터 10위까지는 특화 AI와 범용 AI가 혼재한다. 미드저니(63.8점)는 고품질 이미지 생성에 특화된 AI로, 예술적이고 감각적인 결과물로 디자이너와 크리에이터 사이에서 인기가 높다. 퍼플렉시티(62.6점)는 AI 기반 검색 엔진으로, 질문에 대해 출처를 명시한 답변을 제공하는 것이 특징이다. 그록(62.4점)은 일론 머스크의 xAI가 개발한 AI로, 실시간 X(구 트위터) 데이터 접근과 유머러스한 응답 스타일로 차별화했다. 최근에는 캐릭터 채팅 서비스와 성인용 스파이시 모드를 추가하고 챗GPT 수준으로 모델 성능을 끌어 올리면서 사용자가 급증했다. 딥시크(61.6점)는 중국 스타트업이 개발한 오픈소스 AI로, 저비용 고성능을 내세워 급성장했으며, 전세계적으로 앱 접근을 제한해왔음에도 가격과 성능으로 꾸준히 사용자를 확보해나가고 있다.

AI를 많이, 잘 쓰는 사람들이 추천하는 AI가 궁금하다면? 전체 기사 확인하기