Lower Latency and Higher Throughput with Multi-Node DeepSeek Deployment 8개 A100 GPU로 지연시간 20% 단축, 처리량 8배 증가한…
오픈AI 최고경영자 샘 알트만(Sam Altman)이 4일(현지 시간) 자사 X를 통해, 자사의 대규모 언어 모델 출시 계획을 변경했다고 발표했다.…
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts 1조 규모 AI 모델의 숨은 병목: 디바이스 간 통신이 실행 시간의 47%를…
강화학습(RL)을 대규모로 적용하면 기존의 사전 훈련 및 후속 훈련 방법을 넘어서는 모델 성능을 실현할 수 있다. 퀜(Qwen) 팀이…
Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던…
애틀란틱 카운슬(Atlantic Council) 보도에 따르면 중국의 오픈소스 추론 대규모 언어모델(LLM) 개발사인 딥시크(DeepSeek)가 자사의 ‘딥시크-R1(DeepSeek-R1)’ 모델로 오픈AI(OpenAI)의 o1 모델과…
Top 10 opportunities for technology companies in 2025 글로벌 회계·컨설팅 기업 EY가 발표한 ‘2025년 기술기업을 위한 10대 기회’…
Large Language Models for Interpretable Mental Health Diagnosis 1000페이지 진단 매뉴얼의 복잡성 해결을 위한 혁신적 접근 남부 캘리포니아…
엔비디아가 CES 2025 키노트를 통해 일반 전기 콘센트만으로 구동 가능한 개인용 AI 슈퍼컴퓨터 ‘프로젝트 디짓(Project DIGITS)’을 공개했다. 이…
인공지능 기술기업 엑소랩스(EXO Labs)가 26년 된 인텔 펜티엄2 CPU와 128MB RAM이 장착된 윈도우98 PC에서 대규모 언어모델(LLM)을 구동하는데 성공했다.…