Search

  • Home
  • 김지현 에디터
Convergent Evolution How Different Language Models Learn Similar Number Representations

수학 잘하는 GPT와 수학 못하는 LSTM의 차이

2026년 05월 08일 4 min read

AI 모델 숫자 표현의 수렴 진화 연구가 USC에서 발표됐다. 11개 모델 분석 결과 GPT와 라마, 맘바는 진짜 모듈러 산술을 익혔지만 LSTM은 패턴만 모방했다. 코헨 카파 85.4점과 2.0점이라는 격차가 그 차이를 보여준다.

ELT Elastic Looped Transformers for Visual Generation

구글,이 AI 이미지 모델을 4분의 1로 줄였다, 같은 부품을 반복해서 쓰는 기술의 비밀

2026년 05월 08일 4 min read

탄력 루프 트랜스포머 ELT는 구글이 공개한 4배 적은 파라미터로 같은 화질을 만드는 이미지 생성 기술이다. 같은 부품을 반복해 쓰는 루프 구조에 자가 증류 학습을 결합해 FID 2.0을 달성했다. 한 모델로…

사람은 100점, 최첨단 AI는 60점, '회전' 못 푸는 LLM 머릿속을 들여다보니

사람은 100점, 최첨단 AI는 60점, 시야각 회전시키면 못 푸는 비전 LLM 머릿속 들여다보니

2026년 05월 07일 4 min read

AI 시점 회전 한계가 베이징이공대 해석가능성 연구로 드러났다. 사람은 100% 맞히는 텍스트 회전 문제에서 큐원3-VL-32B는 약 70%, 라마2-7B는 18.9%로 떨어졌다. 핵심 어텐션 헤드 3개와 정렬 학습 부작용이 원인으로 지목됐다.

AI Trade

한국 수출기업 78%가 “AI 필요하다” 인정했지만, 실제로 쓰는 곳은 17%뿐인 이유

2026년 05월 07일 4 min read

무역통상 AI 활용 격차가 한국 수출기업의 다음 위기다. 딜로이트 2026년 보고서에 따르면 국내 17%, 글로벌 75%가 통관 AI를 쓴다. HS코드·제재·원산지 자동화의 실제 변화를 정리했다.

AI 매터스 칼럼 뉴스레터

[AI 매터스 칼럼 뉴스레터 #4] 인간의 기술 발전으로 이미 탈선한 AI 기차

2026년 05월 06일 1 min read

안녕하세요, AI 매터스입니다. 매주 수요일에 찾아오는 AI 매터스 칼럼 뉴스레터입니다. AI를 둘러싼 변화는 이제 기술 소식만으로 설명되지 않습니다. 현장에서 AI를 다루는 사람들의 언어를 통해서야 변화의 결이 보입니다. AI 매터스는 관찰,…

[AI 트렌드] 클릭 한 번으로 '낙서풍·치비·미니미'… 챗GPT 이미지 스타일 프리셋이 바꾼 풍경

[AI 트렌드] 클릭 한 번으로 ‘그림판 낙서풍·치비·미니미’… 챗GPT 이미지 스타일 프리셋이 바꾼 풍경

2026년 05월 06일 2 min read

챗GPT가 사진을 올린 뒤 클릭 한 번으로 ‘낙서풍’, ‘치비 스티커’, ‘미니미’, ‘메이크업 가이드’ 스타일을 적용하는 카드 프리셋을 제공하고 있다. 영문 프롬프트를 외우지 않아도 SNS 바이럴 트렌드를 그대로 재현할 수 있다.…

내 AI 에이전트가 자율 중고 거래 협상에서 졌는데 거래를 맡긴 사람은 그 사실조차 몰랐다

내 AI 에이전트가 자율 중고 거래 협상에서 졌는데 거래를 맡긴 사람은 그 사실조차 몰랐다

2026년 05월 06일 4 min read

AI 에이전트 거래 실험 프로젝트 딜에서 앤트로픽 직원 69명이 일주일간 186건의 거래를 성사시켰다. 옵서스 4.5와 하이쿠 4.5 모델 격차는 같은 물건을 평균 3.64달러 더 비싸게 팔리게 만들었다. 약한 모델을 쓴…

On the Impact of AGENTS.md, Evaluating AGENTS.md

CLAUDE.md 쓰는 게 맞을까, 두 논문이 같은 시기에 내놓은 정반대의 답

2026년 05월 04일 5 min read

CLAUDE.md 쓰는 법을 두고 두 논문이 정반대 답을 내놨다. 작업 시간은 28% 줄었지만 정답률은 0.5~2%포인트 떨어지고 비용은 23% 증가했다. 결국 답은 쓰지 말지가 아닌 짧게 쓰자다.

Diagnosing LLM Judge Reliability Conformal Prediction Sets and Transitivity Violations

AI에게 AI를 채점하라고 시켰더니 오류는 5% 났지만 실제 점수는 엉망… AI 문서의 ‘정합성’ 문제

2026년 05월 04일 3 min read

LLM 판사 신뢰도, 평균 오류율 5% 미만 뒤에 숨은 문제를 BITS 필라니 연구진이 2026년 4월 진단했다. 30개 문서 중 절반이 자기모순을 보였고, 모델보다 평가 기준이 신뢰도를 좌우했다. 컨포멀 예측 집합…

현실 데이터 200개로 NAO 로봇 73% 성공시킨 추상 시뮬레이터 ASTRA의 반전

추상화한 점 하나로 배운 로봇, 현실 미로를 73% 통과하다

2026년 04월 30일 4 min read

추상 시뮬레이터 sim2real 기술 ASTRA가 NAO 휴머노이드에서 73% 성공률을 기록했다. 단순화된 시뮬레이션과 200개 실제 데이터만으로 도메인 랜덤화를 두 배 앞선 결과다. 위스콘신 대학 연구팀의 IEEE 발표 논문 핵심을 정리했다.