알리바바 Qwen - AI매터스

알리바바 Qwen

Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free

LLM의 고질병 ‘첫 단어 집착증’ 개선… 알리바바, ‘뉴립스’ 최고 논문상 수상

12월 1, 2025

중국 알리바바의 Qwen 팀이 AI 언어모델의 오래된 문제를 해결하는 간단한 방법을 찾아냈다. 마치 문지기처럼 작동하는 ‘게이트’라는 장치를 AI 내부에 추가했더니, 성능이 크게 좋아지고 학습도…

딥시크, 단일 GPU에서 구동 가능한 소형 R1 AI 모델 공개

딥시크, 단일 GPU에서 구동 가능한 축소 버전 R1 AI 모델 공개

5월 30, 2025

중국 AI 연구소 딥시크(DeepSeek)가 새로운 추론 AI 모델 R1의 업데이트 버전이 이번 주 AI 커뮤니티의 주목을 받고 있지만, 이와 함께 ‘축소(distilled)’ 버전인 DeepSeek-R1-0528-Qwen3-8B도 출시했다.…

1
2
3

Trending

AI 매터스 기사 썸네일 (1) 함샤우트 글로벌 ATR 2026 — AI MATE 한국인의 AI 동반자 지도

“AI 이미 포화됐다고?” 전 세계 84%는 AI를…

공인희 편집인 2월 24, 2026

한 질문에 AI 4개가 토론한다…xAI, '그록 4.20' 공개

한 질문에 AI 4개가 토론한다…xAI, ‘그록 4.20’…

이종철 수석 에디터 2월 23, 2026

AI 매터스 기사 썸네일 AI Arms and Influence

AI 전쟁 시뮬레이션, 가장 먼저 핵 투하를…

공인희 편집인 2월 24, 2026

알리바바 Qwen - AI매터스