AI 이미지의 고질병 ‘뒤틀린 손·돌아간 눈’ 잡았다, PixAI ‘츠바키.2’ 정식 출시 🎨🤖
AI가 그린 그림, 손가락이 6개거나 눈이 이상하게 돌아간 경험 한 번쯤 있으시죠? 글로벌 AI 창작 플랫폼 PixAI가 이 불편함을 정면으로 겨냥한 차세대 모델 ‘츠바키.2’를 오늘(3월 13일) 전 세계에 정식 공개했습니다. 긴 프롬프트(원하는 이미지를 설명하는 입력 문장)도 의도대로 정확히 반영하고, 역동적인 액션 장면에서도 인체 왜곡을 줄인 것이 핵심입니다. 여러 캐릭터가 함께 등장하는 복잡한 장면도 훨씬 자연스러워졌고, 35종 이상의 원클릭 스타일과 4가지 생성 모드까지 지원합니다. 전 세계 1,000만 크리에이터의 플랫폼이 내놓은 이번 모델, 얼마나 달라졌을지 직접 확인해 보세요.
더 알아보기
벚꽃 사진 한 장이면 개화일 뚝딱…AI가 꽃놀이 날짜를 잡아준다 🌸📱
“올해 벚꽃 언제 피지?” 매년 반복되는 그 질문을 AI가 대신 풀어주기 시작했습니다. 일본 날씨 앱 웨더뉴스(ウェザーニュース)가 벚꽃 봉오리 사진 한 장으로 개화일과 만개일을 예측하는 ‘AI 벚꽃 개화 예측’ 서비스를 시작했습니다. 사진을 보내면 AI가 봉오리의 생장 상태를 7단계로 자동 판정하고, 여기에 기상 예측 데이터를 결합해 개화일을 계산합니다. 만개일 예측은 한 발 더 나아가, 20년 이상 축적된 생장 데이터를 기반으로 꽃이 가장 아름다운 절정 시기까지 짚어줍니다. 정확도를 높이기 위해 전문가가 6,000장 이상의 이미지를 직접 검수했다고 하는데요. AI가 꽃놀이 날짜까지 잡아주는 시대, 한국에도 생기면 어떨까요? 더 알아보기
구글, 텍스트·이미지·영상·음성 한 번에 처리하는 AI 출시 🔍🎬🎙️
기존 AI 검색엔진의 고질적인 문제가 있었습니다. 음성을 검색하려면 먼저 텍스트로 바꾸고, 이미지를 찾으려면 설명글로 변환부터 해야 했죠. 번거로운 전처리 과정에서 정보는 뭉개지고, 시간과 비용은 늘어만 갔습니다. 구글 딥마인드가 이 구조를 통째로 뒤집는 신모델 ‘제미나이 임베딩 2’를 출시했습니다. 텍스트·이미지·영상·음성·문서, 다섯 가지를 하나의 공간에서 변환 없이 바로 처리합니다. 텍스트 최대 8,192 토큰, 영상 최대 120초, 음성 최대 80초까지 처리하고 100개 이상의 언어를 지원하며, 클라우드 저장 비용은 최대 절반까지 줄일 수 있다고 구글은 밝혔습니다. 검색 AI의 판이 바뀌는 중일까요? 더 알아보기
메타, 2년 안에 자체 AI 칩 4종 출시…”엔비디아 없어도 된다” 🚀💡
AI 칩 시장의 절대 강자는 엔비디아였습니다. 그런데 메타가 정면 도전장을 내밀었습니다. 메타가 자체 개발한 AI 전용 반도체 ‘MTIA’ 신규 라인업 4종을 향후 2년 내 순차 출시한다고 공식 발표한 건데요. 통상 AI 칩 신제품 출시 주기가 1~2년인 것을 감안하면 이례적으로 빠른 속도입니다. 이 중 MTIA 300은 이미 실제 서비스에서 가동 중이고, MTIA 400·450·500은 생성형 AI 추론(AI가 학습한 내용을 바탕으로 결과를 만들어내는 과정) 처리에 최적화해 2027년까지 운용될 예정입니다. 메타는 범용 칩 대비 연산 효율이 높아 비용 절감 효과가 크다고 강조했는데, 엔비디아 의존도를 줄이려는 빅테크들의 움직임이 본격화되는 신호탄일까요? 더 알아보기
공대생들, 챗GPT 기여도 스스로 30%로 제한한다 🎓💻
“AI한테 다 맡기면 편하지 않나?” 실상은 달랐습니다. 영국 UCL 연구진이 컴퓨터공학과 학부생들을 심층 인터뷰한 결과, 학생들은 생각보다 훨씬 전략적으로 챗GPT를 쓰고 있었습니다. 코드 생성·오류 수정·보고서 다듬기엔 적극 활용하면서도, 소프트웨어 구조 설계나 창의적 판단이 필요한 영역은 스스로 담당했습니다. 가장 놀라운 점은 외부 강제 없이 스스로 챗GPT 기여도를 30% 이하로 제한하는 내적 기준을 세우고 있다는 것입니다. 그러나 우려도 공존합니다. AI 답변이 그럴듯해 보이면 깊이 검토하지 않고 넘어가는 경향이 확인됐고, 한 학생은 “챗GPT가 갑자기 없어지면 혼자서 과제를 완수하기 어려울 것”이라고 솔직하게 털어놓기도 했습니다. AI 시대 공대생들의 민낯, 당신의 생각은 어떤가요? 더 알아보기
가짜 X선 사진으로 폐렴을 92% 정확도로 잡아낸 AI 🫁🤖
의료 AI의 고질적인 문제가 있습니다. 환자 데이터를 구하기가 너무 어렵다는 것입니다. 개인정보 보호, 병원 간 데이터 공유 제한…좋은 알고리즘을 만들고도 데이터가 없어 상용화에 실패하는 사례가 반복돼 왔죠. 그런데 옥스퍼드대학교 등 공동 연구팀이 이 문제를 정면 돌파했습니다. 실제 환자 사진은 단 한 장도 쓰지 않고, 구글의 이미지 생성 AI ‘나노 바나나’로 만든 합성 X선 사진 300장만으로 폐렴 진단 AI를 훈련시켜 실제 데이터에서 92.3%의 정확도를 달성한 겁니다. 흥미로운 건 이미지 하단 30%를 잘라내는 단순한 후처리 하나가 정확도를 0.853에서 0.923으로 끌어올렸다는 점인데요. 가짜 사진으로 훈련한 AI가 진짜 환자를 진단하는 시대, 의료 현장은 어떻게 달라질까요? 더 알아보기
챗GPT, 직장보다 집에서 2배 더 효율적이었다 🏠💡
AI는 일할 때 쓰는 도구? 데이터는 정반대를 말합니다. 스탠퍼드·UCLA·USC 연구진이 20만 개 이상의 미국 가정 브라우저 기록을 분석한 결과, 챗GPT로 인한 생산성 향상이 가정에서 최대 176%에 달했습니다. 직장 연구들의 수치인 25~55%를 훌쩍 뛰어넘는 수준입니다. 이유는 단순합니다. 직장에서는 전문가가 익숙한 업무를 처리하지만, 집에서는 세금·수리·자녀 숙제처럼 비전문가가 낯선 분야를 혼자 해결해야 하는 상황이 훨씬 많기 때문입니다. 흥미로운 건, 챗GPT를 쓴 가정의 여가 브라우징 시간이 최대 4.5배까지 늘었다는 점인데요. AI 덕에 생산적 과제를 빠르게 끝내고, 남은 시간을 즐기는 데 쓰는 것입니다. 챗GPT가 바꾸고 있는 건 업무 방식만이 아니었습니다. 더 알아보기

AI가 내 PC를 대신 일한다, ‘오픈클로’란 무엇인가
AI 에이전트 열풍을 이끌고 있는 오픈클로가 등장한 지 한 달 만에 다양한 파생 상품들이 쏟아지고 있다. PC 설치형부터 USB 크기의 초소형 기기, 스마트 안경 연동 버전까지 선택지가 크게 넓어졌다. AI 전문 유튜브 채널 ‘AI 매터스’는 오픈클로 파생 상품 5종을 소개하며 사용자 니즈에 따른 활용법을 제시했다. 오픈클로는 사용자의 PC에 설치해 컴퓨터를 직접 조작하며 업무를 대신 처리해주는 AI다. 클로드 코드나 챗GPT 코덱스와 달리, 모르는 방법도 인터넷에서 기술 문서를 스스로 찾아 해결한다는 점이 특징이다. 다만 설정에 따라 API 비용이 과다 발생할 수 있어 주의가 필요하다.
안경부터 USB까지, 파생 상품 5종 한눈에
첫 번째 파생 상품은 비전클로다. 디스플레이가 없는 메타 레이벤 스마트 안경과 오픈클로를 연동하는 방식이다. 사용자가 보는 화면을 AI와 함께 공유하면서 코드 수정, 글쓰기, 사이트 제작 등을 실시간으로 협업할 수 있다. 기존 오픈클로가 대화형 동반자였다면, 비전클로는 ‘시각을 공유하는 동반자’로 활용도가 높다는 평가다.
두 번째는 미미클로다. ESP32-S3 마이크로 컨트롤러라는 초소형 칩셋 기반으로, USB 크기의 기기에서 구동된다. 리눅스 환경 없이 C 언어로 동작해 실행 환경이 매우 가볍다. 배터리와 소형 저장장치를 합쳐도 주먹 크기 정도로, 항상 휴대 가능한 AI 에이전트가 된다. 다만 구축 난이도가 높은 편이다.
세 번째는 피코클로다. 라즈베리 파이 같은 초저전력 보드 PC에서 구동되며, 홈 오토메이션에 특화돼 있다. 조명, 커튼 등 집 안의 기기를 AI가 자동으로 제어할 수 있어 ‘자비스’ 같은 스마트홈 환경을 직접 구축할 수 있다. 오픈클로 구동을 위해 맥 미니를 구매했다가 구축에 실패하고 되파는 사례가 늘고 있는 가운데, API 방식은 로컬 모델을 돌리는 게 아니기 때문에 고성능 PC가 반드시 필요하지 않다는 점도 강조됐다..
보안이 걱정된다면? 목적별 추천 가이드
네 번째는 데스크클로다. 데스크탑 PC에 오픈클로를 설치해 그래픽 유저 인터페이스 전체를 AI가 직접 조작하도록 권한을 부여하는 방식이다. 영상 편집 등 복잡한 업무도 처리 가능한 것으로 알려졌으나, 그만큼 보안 위험이 높아 전문 지식 없이는 설치를 권장하지 않는다고 강조했다. 대안으로는 클라우드 환경에서 구동되는 퍼플렉시티의 컴퓨터 버전이 언급됐다. 챗GPT와 클로드 API를 별도 설정 없이 활용할 수 있고, PC에 직접 접근하지 않아 보안 사고 가능성이 낮다는 이유에서다.
다섯 번째는 카페24 VPS 호스팅과 미니클로다. 카페24는 국내 쇼핑몰 빌더로, 월 5,500원 수준의 리눅스 서버 위에 오픈클로 구축 자동화 서비스를 출시했다. API 키만 입력하면 설정이 완료되고, 한국어 지원이 완벽하다는 장점이 있다. 미니클로는 중국 AI 기업 미니맥스의 자체 모델을 활용하는 클라우드 방식으로, 클로드나 오픈AI API 대비 비용이 저렴하다. 특정 폴더에만 접근 권한을 부여하는 샌드박싱 기능을 지원해 보안 우려도 상대적으로 적다. 두 서비스 모두 활용 범위는 제한적이지만, 구축 난이도와 보안 리스크가 낮아 입문자에게 적합하다는 평가다.











![[AI 트렌드] 말 한마디로 내 노래가 생긴다? 제미나이 음악 생성 프롬프트](https://aimatters.co.kr/wp-content/uploads/2026/03/AI-매터스-기사-썸네일-3.jpg)