화웨이(Huawei)의 AI 연구 부문이 자사의 판구 프로(Pangu Pro) 대규모 언어 모델이 알리바바(Alibaba)의 큐엔(Qwen) 모델을 표절했다는 의혹을 강력히 부인했다.…
Artificial Eyes: Generative AI in China’s Military Intelligence 중국 인민해방군(PLA)이 생성형 인공지능을 군사정보 분야에 적극 도입하고 있다는 새로운…
Fighting Scams on Search 구글, AI 기반 사기 방지 시스템으로 검색 결과 99% 안전성 확보 구글이 공개한 보안…
파이낸셜타임스(FT)의 보도에 따르면, 중국 검색 기업 바이두(Baidu)의 창업자가 자국 생성형 AI 기업 딥시크(DeepSeek)가 개발하는 텍스트 기반 모델에 대한…
Lower Latency and Higher Throughput with Multi-Node DeepSeek Deployment 8개 A100 GPU로 지연시간 20% 단축, 처리량 8배 증가한…
오픈AI 최고경영자 샘 알트만(Sam Altman)이 4일(현지 시간) 자사 X를 통해, 자사의 대규모 언어 모델 출시 계획을 변경했다고 발표했다.…
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts 1조 규모 AI 모델의 숨은 병목: 디바이스 간 통신이 실행 시간의 47%를…
강화학습(RL)을 대규모로 적용하면 기존의 사전 훈련 및 후속 훈련 방법을 넘어서는 모델 성능을 실현할 수 있다. 퀜(Qwen) 팀이…
Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던…
애틀란틱 카운슬(Atlantic Council) 보도에 따르면 중국의 오픈소스 추론 대규모 언어모델(LLM) 개발사인 딥시크(DeepSeek)가 자사의 ‘딥시크-R1(DeepSeek-R1)’ 모델로 오픈AI(OpenAI)의 o1 모델과…