Search

AI Matters

AWS, 문제 풀 때마다 학습하는 AI 개발... 경험 쌓을수록 저렴하고 정확

AWS, 문제 풀 때마다 학습하는 AI 개발… 경험 쌓을수록 저렴하고 정확해

11월 21, 2025

사람이 문제를 풀 때 과거 경험을 떠올려 더 나은 방법을 선택하듯, AI도 이제 경험을 통해 학습한다. AWS AI와 펜실베이니아대학교 연구진이 개발한 EGUR(Experience-Guided Reasoner)는 문제를…

오픈AI, 24시간 연속 코딩 가능한 'GPT-5.1-코덱스-맥스' 출시

오픈AI, 24시간 연속 코딩 가능한 ‘GPT-5.1-코덱스-맥스’ 출시

11월 21, 2025

오픈AI(OpenAI)가 장시간 소프트웨어 개발 작업을 독립적으로 수행할 수 있는 코딩 특화 모델 ‘GPT-5.1-코덱스-맥스(GPT-5.1-Codex-Max)’를 19일(현지 시각) 공개했다. 이 모델의 핵심은 ‘컴팩션(compaction)’이라는 기술이다. 단일 작업에서 수백만…

마음AI, 데이터로 로봇을 깨우다

“넥스트 챗GPT는 피지컬 AI”…마음AI, 데이터로 로봇을 깨우다

11월 21, 2025

한국인공지능협회 CAIO 과정 특강, 마음AI 최홍섭 대표 “휴머노이드 시장 300경 규모 전망” 지난 11월 14일, 한국인공지능협회 CAIO(Chief AI Officer) 아카데미에서 마음AI 최홍섭 기술총괄 대표가…

데브멘토, 바이브 코딩 기반 개발 · 조직 혁신 전략 실무 세미나 연다... 내달 16일 개최

데브멘토, 바이브 코딩 기반 개발 · 조직 혁신 전략 실무 세미나 연다… 내달 16일 개최

11월 21, 2025

가트너가 최근 2026 전략기술 중 하나로 ‘AI 네이티브 개발 플랫폼’을 선정한 가운데, 기업의 바이브 코딩 도입에 대한 관심이 높아지고 있다. 개발시 인공지능(AI)의 도움을 받아…

AI가 교수보다 더 깐깐해… AI한테 채점 맡겼더니, 학생 10명 중 4명 점수 떨어져

AI가 교수보다 더 깐깐해… AI한테 채점 맡겼더니, 학생 10명 중 4명 점수 떨어져

11월 21, 2025

미국 에모리대학교 연구팀이 인공지능 챗봇 GPT-4o를 실제 대학 수업에 투입해 학생들의 시험과 보고서를 채점하는 실험을 진행했다. 그 결과, AI가 사람 채점자와 놀라울 정도로 비슷하게…

From Fact to Judgment: Investigating the Impact of Task Framing on LLM Conviction in Dialogue Systems

“이전 답변 틀렸다” 한마디에 무너지는 AI… 같은 질문도 ‘대화 형식’으로 하면 답 달라져

11월 21, 2025

미국 일리노이대학 연구팀이 AI의 판단력을 테스트한 결과, 질문 방식만 바꿔도 답이 정반대로 나오는 심각한 문제를 발견했다. “설탕이 아이들을 과잉행동 하게 만드나요?”라고 직접 물으면 “아니다”라고…

“엑셀·PPT·이메일 한 번에”… 기업가치 1조 8천억 '젠스파크', AI 워크스페이스 공개

“엑셀·PPT·이메일 한 번에”… 기업가치 1조 8천억 ‘젠스파크’, AI 워크스페이스 공개

11월 21, 2025

AI 스타트업 젠스파크(Genspark)가 창업 5개월 만에 연간 5,000만 달러(한화 약 735억 원) 규모의 매출을 기록하며 시리즈B 투자 유치에 성공했다. 젠스파크는 20일(현지 시각) 샌프란시스코에서 열린…

퍼플렉시티, AI 브라우저 ‘코멧’ 안드로이드 버전 출시

퍼플렉시티, AI 브라우저 ‘코멧’ 안드로이드 버전 출시

11월 21, 2025

AI 검색 전문 기업 퍼플렉시티(Perplexity)가 20일(현지 시각) 자사의 AI 브라우저 ‘코멧(Comet)’의 안드로이드 버전을 출시했다. 테크크런치에 따르면, 코멧은 지난 7월 데스크톱 버전으로 처음 선보인 AI…

제미나이 3, 지금이 2025년이라는 사실 믿지 않고 실랑이 "당신이 날 속이는 것"

제미나이 3, 지금이 2025년이라는 사실 믿지 않고 실랑이… “날 속이는 것”

11월 21, 2025

구글의 최신 AI 모델 제미나이 3가 출시 전날 황당한 해프닝을 일으켰다. 현재 연도가 2025년이라는 사실을 완강히 거부하며 이를 증명하려는 연구자를 오히려 의심한 것이다. 테크크런치가…

챗GPT 출시 1,000일의 기록: 점유율, 전쟁, 부작용의 모든 것

[AI 매터스 뉴스레터 #145] 챗GPT 출시 1,000일의 기록: 점유율, 전쟁, 부작용의 모든 것

11월 20, 2025

안녕하세요, AI매터스입니다. AI는 이미 우리의 삶입니다. 그 가운데 놓치지 말아야 할 중요한 이슈들을 주 3회 정리해 제공합니다. 놓치지 마시기 바랍니다. 구글, 최강 AI ‘제미나이 3’…

[11월 20일 AI 뉴스 브리핑] 원티드랩, 구직자용 AI 에이전트 2종 출시 외

[11월 20일 AI 뉴스 브리핑] 원티드랩, 구직자용 AI 에이전트 2종 출시 외

11월 20, 2025

▪️ 원티드랩, 구직자용 AI 에이전트 2종 출시 HR 테크 기업 원티드랩은 LLM 기반 구직자용 AI 에이전트 2종을 출시했다고 20일 밝혔다. 새롭게 선보인 ‘포지션 검색…

AI에 코딩 도구 주면 정답률 19%↑…풀이 과정은 41% 더 형편없어져

AI에 코딩 도구 주면 정답률 19%↑…풀이 과정은 41% 더 형편없어져

11월 20, 2025

ChatGPT나 Claude 같은 AI에게 코드를 실행할 수 있는 기능을 주면 정답을 더 잘 맞히지만, 정작 ‘어떻게 그 답이 나왔는지’ 설명하는 능력은 오히려 떨어진다는 연구…

챗GPT에게 "어느 나라가 더 나쁜가?" 물었더니... AI도 국가별 차별한다

챗GPT에게 “어느 나라가 더 나쁜가?” 물었더니… AI도 국가 차별한다

11월 20, 2025

유엔 안전보장이사회의 실제 투표 기록을 분석한 연구에서 ChatGPT 등 주요 AI 언어모델들이 국가에 따라 뚜렷한 편견을 보인다는 사실이 밝혀졌다. 해당 논문에 따르면 연구 결과,…

PISanitizer: Preventing Prompt Injection to Long-Context LLMs via Prompt Sanitization

긴 문서 속 숨은 해킹 명령어, 이제 AI가 스스로 찾아 차단한다

11월 20, 2025

미국 펜실베이니아 주립대학교 연구팀이 긴 문서를 처리하는 AI 언어모델의 보안 취약점을 해결할 새로운 방어 기술을 개발했다. ‘PISanitizer’라는 이름의 이 기술은 문서 속에 숨겨진 악성…

워너뮤직, AI 음악 스타트업 유디오와 저작권 소송 합의

워너뮤직, AI 음악 스타트업 유디오와 저작권 소송 합의

11월 20, 2025

워너뮤직그룹(Warner Music Group, WMG)이 AI 음악 스타트업 유디오(Udio)와 저작권 침해 소송을 합의했다. 19일(현지 시각) 위너뮤직이 발표한 내용에 따르면, 두 회사는 2026년 출시 예정인 AI…

챗GPT서 세금·회계 서비스 제공한다… 오픈AI-인튜잇, 1400억원 규모 계약 체결

챗GPT서 세금·회계 서비스 제공한다… 오픈AI-인튜이트, 1400억원 규모 계약 체결

11월 20, 2025

오픈AI(OpenAI)가 인튜이트(Intuit)와 다년간 전략적 파트너십을 맺고 챗GPT 내에서 인튜이트의 금융 앱 경험을 제공한다고 18일(현지 시각) 발표했다. 오픈AI에 따르면 이번 파트너십은 1억 달러(한화 약 1,400억…

구글 CEO "AI 버블 붕괴 시 모든 기업 타격” 경고

구글 CEO “AI 버블 붕괴 시 모든 기업 타격” 경고

11월 20, 2025

구글(Google)의 모기업 알파벳(Alphabet)의 최고경영자(CEO) 순다르 피차이(Sundar Pichai)가 현재 진행 중인 인공지능(AI) 투자 붐에 비합리적 요소가 있다고 인정했다. 18일(현지 시각) 진행한 BBC와의 단독 인터뷰에서 그는…

챗GPT 출시 1,000일의 기록: 점유율, 전쟁, 부작용의 모든 것

챗GPT 출시 1,000일의 기록: 점유율, 전쟁, 부작용의 모든 것

11월 19, 2025

2022년 11월 30일을 기억하십니까? 한국 시각으로는 12월 1일이겠네요. 그날 여러분은 무얼 하셨습니까? 캘린더를 뒤져보니 저는 애플코리아 본사에 아이패드 출시 브리핑을 받으러 갔고 지인들을 만났네요.…

AI 여러 개 쓰면 답 정확해진다더니... 토큰비용 5배에 정답률은 제자리

AI 여러 개 쓰면 답 정확해진다더니… 토큰비용 5배에 정답률은 제자리

11월 19, 2025

여러 AI가 함께 문제를 풀면 더 정확한 답을 낼 수 있다는 아이디어가 주목받고 있다. 하지만 미국 버지니아공대 연구진이 발표한 논문에 따르면, 모든 질문에 AI끼리…

드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약

드론 AI, 혼자 날 땐 천재인데 협력은 바보… 최신 모델도 ‘팀워크’ 취약

11월 19, 2025

아랍에미리트 연방대학교 연구팀이 자율비행 드론의 판단 능력을 체계적으로 평가할 수 있는 대규모 테스트 자료 ‘UAVBench’를 공개했다. 이 자료는 AI가 만든 5만 개의 검증된 비행…

AI가 실험 없이 만든 가짜 논문, AI 심사위원에게 보여주자 최대 82% 통과

[AI 매터스 뉴스레터 #144] AI가 만든 가짜 논문, AI 심사위원에게 보여주자 최대 82% 통과

11월 18, 2025

안녕하세요, AI매터스입니다. AI는 이미 우리의 삶입니다. 그 가운데 놓치지 말아야 할 중요한 이슈들을 주 3회 정리해 제공합니다. 놓치지 마시기 바랍니다. GPT-5.1, 수능 433점 받았다… 한국사는…

Short-Window Sliding Learning for Real-Time Violence Detection via LLM-based Auto-Labeling

“AI가 CCTV 속 폭력 포착”… 제미나이가 ‘주먹 드는 순간’ 95% 정확도로 잡는다

11월 18, 2025

멀티모달 AI 영상 분석 솔루션 기업 PIA-SPACE가 구글의 인공지능 ‘제미나이’를 활용해 CCTV에서 폭력 상황을 실시간으로 찾아내는 기술을 개발했다. 해당 연구 논문에 따르면, 정확도는 95.25%에…

Benchmarking Visual LLMs Resilience to Unanswerable Questions on Visually Rich Documents

“챗GPT도 속았다”… AI에게 ‘답 없는 질문’하자 60% 이상 틀려

11월 18, 2025

문서를 읽고 질문에 답하는 AI가 크게 발전했지만, 정작 “이 질문은 답할 수 없다”는 사실을 알아채는 능력은 형편없는 것으로 드러났다. 이탈리아 토리노 공대 연구팀이 GPT-4를…

'의학 드라마'로 AI 진단 실력 측정했더니... 희귀질환 진단 정확도 38% 그쳐

‘의학 드라마’로 AI 진단 실력 측정했더니… 희귀질환 진단 정확도 38% 그쳐

11월 18, 2025

펜실베이니아 주립대학교 연구팀이 발표한 논문에 따르면, 의학 드라마 ‘하우스(House M.D.)’를 활용해 대형 언어모델(LLM)의 희귀질환 진단 능력을 평가한 결과, 최신 AI 모델도 정확도가 40%에 미치지…

AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통

AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통

11월 17, 2025

AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통 AI를 여러 개 연결해 서로 대화하게 했더니 놀라운 일이 벌어졌다. 인간처럼 다른 AI의 말에 설득당해…

구글 딥마인드 "AI도 사람처럼 소송 걸 수 있다"...중세 해양법 법에서 찾은 해법

구글 딥마인드 “AI도 사람처럼 소송 걸 수 있다”…과거 해양법 법에서 찾은 해법

11월 17, 2025

구글 딥마인드가 AI 인격 논쟁에 파격적 해법을 제시했다. AI가 의식이 있는지 따지는 대신, 마치 과거 선박을 법정에 세웠던 것처럼 AI 자체를 소송 대상으로 만들자는…

프로스트바이트_ AI 시네마 설명회ㅣ프롬극장 제1화

[AI 매터스 뉴스레터 #143] AI 시네마 설명회, 지금 시작합니다!

11월 14, 2025

안녕하세요, AI매터스입니다. AI는 이미 우리의 삶입니다. 그 가운데 놓치지 말아야 할 중요한 이슈들을 주 3회 정리해 제공합니다. 놓치지 마시기 바랍니다. 챗GPT, GPT-5.1로 진화… “더 똑똑하고…

[11월 10일 AI 뉴스 브리핑] 서울AI재단-MIT 센서블시티랩, Urban AI 연구 협력 본격화 외

[11월 10일 AI 뉴스 브리핑] 서울AI재단-MIT 센서블시티랩, Urban AI 연구 협력 본격화 외

11월 10, 2025

▪️ AIC, AMD MI450 시리즈 GPU 서버 첫 공급업체 선정 AIC는 투자자 컨퍼런스에서 AMD MI450 시리즈 GPU의 첫 번째 파트너 제조업체로 선정됐다고 밝혔다. 2025…

[AI 연구실] 챗GPT ‘아틀라스’로 업무 자동화 어디까지 가능할까?

[AI 매터스 뉴스레터 #140] 챗GPT ‘아틀라스’로 업무 자동화 어디까지 가능할까?

11월 7, 2025

안녕하세요, AI매터스입니다. AI는 이미 우리의 삶입니다. 그 가운데 놓치지 말아야 할 중요한 이슈들을 주 3회 정리해 제공합니다. 놓치지 마시기 바랍니다. “2년 반 뒤엔 AI와 3명이…

작년 학습한 AI, 올해 문제 될 수도... ‘가치관 실시간 업데이트’ 기술 나왔다

작년에 학습한 AI, 올해엔 문제될 수도… ‘가치관 실시간 업데이트’ 기술 나왔다

11월 7, 2025

인도 TCS 리서치와 InvideoAI, Birla AI Labs, 칼링가 산업기술연구소(KIIT) 공동 연구진이 대규모 언어모델의 윤리 기준을 효율적으로 업데이트하는 새로운 기술을 개발했다. 챗GPT 같은 인공지능이 사람처럼…

AI Matters – AI 매터스