• Home
  • 대규모언어모델

대규모언어모델

Lower Latency and Higher Throughput with Multi-Node DeepSeek Deployment

AI 응답 지연 없앤 퍼플렉시티, 처리량 8배 높인…

4월 22, 2025

Lower Latency and Higher Throughput with Multi-Node DeepSeek Deployment 8개 A100 GPU로 지연시간 20% 단축, 처리량 8배 증가한…

오픈AI, 챗GPT-5 출시 연기… 대신 o3와 o4-미니 모델 몇 주 내 출시

오픈AI, 챗GPT-5 출시 연기… 대신 o3와 o4-미니 모델…

4월 7, 2025

오픈AI 최고경영자 샘 알트만(Sam Altman)이 4일(현지 시간) 자사 X를 통해, 자사의 대규모 언어 모델 출시 계획을 변경했다고 발표했다.…

Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts

바이트댄스, 트릴리언급 모델을 47% 빠르게 만드는 ‘코멧’ 기술…

3월 18, 2025

Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts 1조 규모 AI 모델의 숨은 병목: 디바이스 간 통신이 실행 시간의 47%를…

알리바바, 추론 모델 QwQ-32B 모델 공개… 20배 작은 규모로도 딥시크 R1과 비슷한 성능 달성

알리바바, 추론 모델 QwQ-32B 모델 공개… 20배 작은…

3월 6, 2025

강화학습(RL)을 대규모로 적용하면 기존의 사전 훈련 및 후속 훈련 방법을 넘어서는 모델 성능을 실현할 수 있다. 퀜(Qwen) 팀이…

Large language models surpass human experts in predicting neuroscience results

대규모 언어모델, 뇌과학 실험 결과 예측에서 전문가 능력…

2월 18, 2025

Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던…

AI Matters 썸네일_AI Chip

중국 AI 기업 딥시크, 오픈AI와 맞먹는 성능 입증…美…

1월 29, 2025

애틀란틱 카운슬(Atlantic Council) 보도에 따르면 중국의 오픈소스 추론 대규모 언어모델(LLM) 개발사인 딥시크(DeepSeek)가 자사의 ‘딥시크-R1(DeepSeek-R1)’ 모델로 오픈AI(OpenAI)의 o1 모델과…

Top 10 opportunities for technology companies in 2025

2025년 기업 생존의 키워드는 ‘자율형 AI’… EY가 전망한…

1월 24, 2025

Top 10 opportunities for technology companies in 2025 글로벌 회계·컨설팅 기업 EY가 발표한 ‘2025년 기술기업을 위한 10대 기회’…

Large Language Models for Interpretable Mental Health Diagnosis

AI가 정신건강 진단을 돕는다…정확도 100% 달성한 하이브리드 진단시스템…

1월 23, 2025

Large Language Models for Interpretable Mental Health Diagnosis 1000페이지 진단 매뉴얼의 복잡성 해결을 위한 혁신적 접근 남부 캘리포니아…

[CES 2025] 엔비디아, 3000달러짜리 AI 슈퍼컴퓨터 '프로젝트 디짓' 공개...200B 매개변수 모델 구동 가능

[CES 2025] 엔비디아, 3000달러짜리 AI 슈퍼컴퓨터 ‘프로젝트 디짓’…

1월 7, 2025

엔비디아가 CES 2025 키노트를 통해 일반 전기 콘센트만으로 구동 가능한 개인용 AI 슈퍼컴퓨터 ‘프로젝트 디짓(Project DIGITS)’을 공개했다. 이…

윈도우98 PC에서 라마 AI 구동 성공…26년 전 PC로 AI 언어모델 돌린다

윈도우98 PC에서 라마 AI 구동 성공…26년 전 PC로…

1월 2, 2025

인공지능 기술기업 엑소랩스(EXO Labs)가 26년 된 인텔 펜티엄2 CPU와 128MB RAM이 장착된 윈도우98 PC에서 대규모 언어모델(LLM)을 구동하는데 성공했다.…

대규모언어모델 – AI 매터스