중국 알리바바의 Qwen 팀이 AI 언어모델의 오래된 문제를 해결하는 간단한 방법을 찾아냈다. 마치 문지기처럼 작동하는 ‘게이트’라는 장치를 AI 내부에 추가했더니, 성능이 크게 좋아지고 학습도…
중국 AI 연구소 딥시크(DeepSeek)가 새로운 추론 AI 모델 R1의 업데이트 버전이 이번 주 AI 커뮤니티의 주목을 받고 있지만, 이와 함께 ‘축소(distilled)’ 버전인 DeepSeek-R1-0528-Qwen3-8B도 출시했다.…