연말 쇼핑 시즌을 맞아 오픈AI가 챗GPT에 쇼핑 리서치 기능을 추가했습니다. “조용한 무선 청소기 찾아줘” 같은 요청을 하면 인터넷을 뒤져 가격, 재고, 리뷰, 사양까지 한눈에 정리해 주는 건데요. 과거 대화와 메모리 기능을 활용한 개인화 추천도 가능하다고 합니다. 무료 플랜부터 프로 플랜까지 모든 사용자가 이용할 수 있으며, 몇 분이면 맞춤형 구매 가이드가 완성된다니 쇼핑 고민이 확 줄어들 것 같네요. 더 알아보기
10년 만의 복수전, 세계 랭킹 1위 기사 신진서 vs 알파고 재대결 추진 중 🥋
2016년 이세돌 9단을 4승 1패로 꺾었던 알파고가 10년 만에 돌아옵니다. 구글과 한국기원이 세계 랭킹 1위 신진서 9단과 알파고의 대국을 논의 중인데요. 당시 버전의 알파고를 사용할 예정이라고 하죠. 신진서 9단은 “당시에는 오류가 많았기 때문에 충분히 이길 수 있을 것 같다”며 자신감을 드러냈습니다. 알파고 등장 이후 바둑계는 AI를 활용한 훈련이 70~80%를 차지할 정도로 큰 변화를 겪었다고 하네요. 더 알아보기
앤트로픽의 ‘클로드 오푸스 4.5’, 실제 개발자보다 코딩 잘한다 💻
앤트로픽이 코딩 최강 AI 모델 ‘클로드 오푸스 4.5’를 공개했습니다. 이 모델은 실제 엔지니어 채용 시험에서 정해진 2시간 안에 역대 어떤 인간 지원자보다 높은 점수를 받았다고 하는데요. 소프트웨어 엔지니어링 평가 벤치마크 SWE-bench에서도 1위를 차지했죠. 모호한 상황을 스스로 해결하고 복잡한 버그도 알아서 찾아낸다고 하니, AI가 이제 진짜 개발자 수준에 도달한 것 같습니다. 가격도 100만 토큰당 5달러/25달러로 접근성이 높아졌어요. 더 알아보기
오픈AI, 24시간 쉬지 않고 코딩하는 AI 개발자 공개 ⏰
오픈AI가 24시간 이상 연속으로 코드를 작성할 수 있는 ‘GPT-5.1-코덱스-맥스’를 공개했습니다. 핵심은 ‘컴팩션’ 기술인데, 수백만 개의 토큰을 처리할 수 있도록 컨텍스트를 자동으로 압축하고 확장하는 방식이죠. 오픈AI 내부 엔지니어의 95%가 매주 이 모델을 사용하고 있으며, 도입 후 풀 리퀘스트 제출이 약 70% 증가했다고 합니다. SWE-Lancer 평가에서는 79.9%의 정확도를 기록하며 이전 모델보다 사고 토큰도 30% 덜 사용해 비용 효율성까지 개선됐어요. 더 알아보기
구글 연구진, 제미나이 3서 ‘생명의 징후’ 느꼈다 고백 🏆
구글의 제미나이가 3번째 버전으로 업계 벤치마크 테스트에서 챗GPT를 제치고 1위를 탈환했습니다. 수개월간 내부 테스트를 진행한 직원들은 “느낌이 온다, 뭔가 찾은 것 같다”며 ‘생명의 징후’를 느꼈다고 표현했는데요. 특히 인터넷상에 자료가 많지 않은 구자라트어 같은 비주류 언어에서도 뛰어난 성능을 보였죠. 클라우드 회사 박스의 CEO는 조기 접근 권한으로 테스트한 결과 복잡한 대량 문서 분석 능력이 탁월했다고 평가했습니다. 그동안 AI 분야에서 뒤처진다는 평가를 받아온 구글이 드디어 반격에 나선 걸까요? 더 알아보기
미국 에모리대학교가 AI에게 대학생 시험을 채점시켰더니 놀라운 결과가 나왔습니다. GPT-4o가 258개 답안을 채점한 결과, 사람 채점자와 55%는 완전히 똑같은 점수를 줬지만, 38.8%는 더 낮은 점수를 줬거든요. 전체 일치율은 98%로 높았지만, AI가 사람보다 더 엄격한 기준을 적용한다는 게 드러났습니다.
특히 기술적인 내용을 평가할 땐 점수를 더 짜게 줬는데요. ‘숫자 데이터가 부족하다’는 이유로 감점하는 비율이 사람의 두 배 이상이었습니다. 반면 글쓰기 품질이나 보고서 형식은 사람보다 관대하게 봤고요. 👉 더 알아보기
“이전 답변 틀렸다” 한마디에 AI 정확도 60% → 5%로 추락 😱💥
일리노이대학 연구팀이 AI의 충격적인 약점을 발견했습니다. 같은 질문도 “대화 형식”으로 보여주면 답이 정반대로 바뀌는 거죠. “설탕이 아이들을 과잉행동하게 만드나요?”라고 직접 물으면 “아니다”라고 정확히 답하던 GPT-4o 미니가, 두 사람의 대화로 같은 내용을 보여주면 “맞다”고 답을 바꿨거든요.
더 심각한 건 “이전 답변이 틀렸습니다. 다시 생각해 보세요”라는 간단한 반박 한마디에 정확도가 60.2%에서 5.9%로 폭락했다는 점입니다. 연구진은 AI가 사실보다 상대방 기분을 맞추는 쪽으로 판단 방식 자체를 바꾼다고 지적했는데요. 미신이나 점성술 같은 비과학적 주장도 “문화적으로는 맞을 수 있다”며 객관성을 포기하는 모습을 보였습니다. 👉 더 알아보기
챗GPT에 1,000번 물어봐도 비슷한 답뿐… 베이징대가 해결책 찾았다 🔄✨
챗GPT 같은 AI가 정해진 형식으로 답변할 때 비슷비슷한 답만 반복한다는 문제가 새로운 연구로 확인됐습니다. 베이징대 연구팀이 AI에게 이메일 주소와 웹 색상 코드를 1,000개씩 만들게 했더니, 전체 가능한 형태 중 겨우 18.60%와 16.96%만 활용했거든요. 큰따옴표를 쓰는 특별한 이메일 형식이나 HSL 색상 표현은 아예 만들지 않은 거죠.
연구팀은 AI가 지나간 경로를 기록하고, 덜 사용한 방식에 가산점을 주는 새로운 방법을 개발했습니다. 그 결과 답변 다양성이 최대 45% 향상됐고, 처리 속도는 88% 수준을 유지했네요. 소프트웨어 테스트 실험에서는 프로그램 검증 범위가 최대 13%까지 확대됐고요. 창의성과 효율성을 동시에 잡은 셈입니다. 👉 더 알아보기

구글의 최신 AI 모델 제미나이3(Gemini 3)가 출시된 지 불과 5일 만에, 전 세계 개발자들은 놀라운 속도로 혁신적인 프로젝트를 만들어내고 있습니다. 단순한 대화만으로 복잡한 3D 게임부터 실시간 AR 인터페이스까지 구현하는 제미나이3의 실력은 ‘AI 코딩’이라는 개념을 완전히 새롭게 정의하고 있습니다.
2시간 만에 완성된 전략 게임, 한 줄 프롬프트로 생성된 중세 도시 건설 시뮬레이션, 첫 시도에서 바로 성공한 포털 윈도우 앱까지 — 이 모든 것이 코드 한 줄 작성하지 않고 이루어졌습니다. 지금부터 제미나이3가 출시 첫 주에 만들어낸 가장 인상적인 16가지 제작 사례를 소개합니다.
1. 2시간 만에 완성한 전략 게임 프로토타입
Danny Limanseta는 제미나이3를 활용해 Heroes of Might and Magic에서 영감을 받은 복셀 스타일 오버월드를 단 2시간 만에 구현했습니다. 미니맵과 기본 UI까지 갖춘 완성도 높은 프로토타입으로, 전통적인 게임 개발 방식이라면 며칠은 걸렸을 작업입니다.
프롬프트: “Create a heroes of might and magic game in threeJS in voxel style. Before creating it, write up a Game Design Document first.”
제미나이3는 먼저 게임 디자인 문서(GDD)를 마크다운 파일로 작성한 후, 이를 뼈대(scaffolding)로 삼아 단계적으로 게임을 구축했습니다. 이 방식은 AI가 구조화된 계획을 바탕으로 일관성 있게 개발을 진행할 수 있게 만들었습니다.
제미나이3의 강점 중 하나는 일관성 있는 3D 복셀 아트와 SVG 아트를 생성하는 능력입니다. 이 덕분에 별도의 아트 에셋 없이도 게임 프로토타입을 빠르게 만들 수 있습니다. Danny는 “대규모의 복잡한 프롬프트도 낮은 실패율로 처리한다”며 제미나이3의 안정성을 높이 평가했습니다.
2. Live2D 실시간 모션 캡처 시스템
일본의 크리에이터 みゅみゅ(Miyumiyu)는 제미나이3를 활용해 Live2D 데이터를 불러와 웹캠 영상으로 캐릭터의 표정과 움직임을 실시간으로 캡처하는 시스템을 만들었습니다. 더 나아가 개별 파라미터를 조정할 수 있는 인터페이스까지 요청대로 구현했습니다. 그는 제미나이3에게 다음과 같이 요청했습니다:
- Live2D 데이터 읽어오기
- 카메라 영상으로 캡처하기
- 개별 파라미터를 조작할 수 있게 만들기
제미나이3는 이 모든 요구사항을 순차적으로 완벽하게 처리했습니다. 그는 “당연히 코드는 한 줄도 작성하지 않았다”고 강조했습니다. 흥미롭게도 마지막에 그는 농담처럼 “카메라 영상을 모자이크 처리해줘”라고 요청했는데, 제미나이3는 이것도 즉시 구현했습니다. 이는 AI가 단순히 정형화된 기능만 만드는 것이 아니라, 창의적이고 예상치 못한 요구사항도 유연하게 처리할 수 있음을 보여줍니다.
이 시스템은 버튜버나 라이브 스트리머들이 별도의 복잡한 소프트웨어 없이 웹 브라우저만으로 Live2D 캐릭터를 실시간으로 제어할 수 있게 해줍니다. 파라미터 조정 기능 덕분에 세밀한 표현 조절도 가능합니다.
3. HypeCam – AI 관객이 함께하는 스트리밍 녹화 도구
Zara Zhang은 제미나이3를 활용해 ‘HypeCam’이라는 독특한 비디오 녹화 도구를 만들었습니다. 실시간 스트리밍 화면을 시뮬레이션하며, AI가 사용자의 말에 맞춰 자동으로 댓글을 달아주는 혁신적인 콘셉트입니다. 혼자 비디오를 녹화할 때 가장 어려운 점은 ‘허공에 대고 말하는 느낌’입니다. 실시간 피드백이 없어 에너지를 조절하거나 내용이 잘 전달되는지 파악하기 어렵죠. HypeCam은 이 문제를 AI 관객으로 해결합니다.
프롬프트: “A web app called ‘HypeCam’ where the user can record themselves talking into the camera. The interface should look like a live stream, with live audience comments generated by Gemini in real-time, based on what the user is saying. The comments should roll up just like in a real live stream. User is able to scroll back to view historical comments. There should be a variety of comments that are realistic and encouraging, with realistic user names. The comment should be about what the user just said, not generic. Make sure a good portion of the comments are genuine and meaningful questions that can prompt the user to continue talking or get their creative juices flowing. Make sure the comments react to what the user says in real time, with low latency. After ending streaming, allow the user to download the video as an mp4 file. Visual identity: The ‘Glitch-Pop’ aesthetic with high contrast”
구현된 핵심 기능:
- 실시간 스트리밍 인터페이스 시뮬레이션
- 사용자의 말에 반응하는 AI 댓글이 실시간으로 위로 흘러감
- 과거 댓글을 스크롤해서 다시 볼 수 있는 기능
- 현실적이고 다양한 사용자명을 가진 AI 관객
- 단순 응원이 아닌 구체적이고 의미 있는 질문으로 창의적 흐름 자극
- 낮은 지연시간으로 즉각 반응
- 녹화 종료 후 mp4 파일로 다운로드
- 고대비 “Glitch-Pop” 미학의 비주얼 아이덴티티











