Search

  • Home
  • 알리바바 Qwen

알리바바 Qwen

Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free

LLM의 고질병 ‘첫 단어 집착증’ 개선… 알리바바, ‘뉴립스’ 최고 논문상 수상

12월 1, 2025

중국 알리바바의 Qwen 팀이 AI 언어모델의 오래된 문제를 해결하는 간단한 방법을 찾아냈다. 마치 문지기처럼 작동하는 ‘게이트’라는 장치를 AI 내부에 추가했더니, 성능이 크게 좋아지고 학습도…

딥시크, 단일 GPU에서 구동 가능한 소형 R1 AI 모델 공개

딥시크, 단일 GPU에서 구동 가능한 축소 버전 R1 AI 모델 공개

5월 30, 2025

중국 AI 연구소 딥시크(DeepSeek)가 새로운 추론 AI 모델 R1의 업데이트 버전이 이번 주 AI 커뮤니티의 주목을 받고 있지만, 이와 함께 ‘축소(distilled)’ 버전인 DeepSeek-R1-0528-Qwen3-8B도 출시했다.…

알리바바 Qwen - AI매터스