대규모언어모델

AWS, 클릭 몇 번으로 맞춤형 AI 모델 만든다… 신규 기능 대거 발표

12월 4, 2025

아마존웹서비스(Amazon Web Services, AWS)가 기업들이 자체 AI 모델을 손쉽게 제작할 수 있는 새로운 기능을 대거 내놨다. 테크크런치에 따르면, AWS는 3일(현지 시각) 리인벤트(re:Invent) 컨퍼런스에서 아마존…

화웨이 AI 연구소, 알리바바 모델 표절 의혹 강력 부인… “독립적으로 개발했다”

7월 8, 2025

화웨이(Huawei)의 AI 연구 부문이 자사의 판구 프로(Pangu Pro) 대규모 언어 모델이 알리바바(Alibaba)의 큐엔(Qwen) 모델을 표절했다는 의혹을 강력히 부인했다. 어니스트AGI(HonestAGI)라는 단체가 깃허브(Github)에 게시한 논문은 화웨이의…

Artificial Eyes: Generative AI in China’s Military Intelligence

中, 챗GPT·메타 AI 군에 투입… “군사정보 전 과정 자동화 시도”

6월 18, 2025

Artificial Eyes: Generative AI in China’s Military Intelligence 중국 인민해방군(PLA)이 생성형 인공지능을 군사정보 분야에 적극 도입하고 있다는 새로운 보고서가 공개됐다. 레코디드 퓨처(Recorded Future)의 인시크트…

구글 검색 결과에서 매일 수억 개의 사기 콘텐츠 차단… AI로 20배 더 효과적 방어

5월 12, 2025

Fighting Scams on Search 구글, AI 기반 사기 방지 시스템으로 검색 결과 99% 안전성 확보 구글이 공개한 보안 보고서에 따르면, 구글 검색은 사용자가 관련성…

바이두 창업자 “텍스트 기반 AI 시장 축소 중”… 딥시크 겨냥한 발언 주목

4월 28, 2025

파이낸셜타임스(FT)의 보도에 따르면, 중국 검색 기업 바이두(Baidu)의 창업자가 자국 생성형 AI 기업 딥시크(DeepSeek)가 개발하는 텍스트 기반 모델에 대한 수요가 “축소되고 있다”고 발언해 관심을 모으고…

Lower Latency and Higher Throughput with Multi-Node DeepSeek Deployment

AI 응답 지연 없앤 퍼플렉시티, 처리량 8배 높인 멀티노드 기술 공개

4월 22, 2025

Lower Latency and Higher Throughput with Multi-Node DeepSeek Deployment 8개 A100 GPU로 지연시간 20% 단축, 처리량 8배 증가한 퍼플렉시티의 멀티노드 전략 퍼플렉시티(Perplexity)가 멀티노드 환경에서…

오픈AI, 챗GPT-5 출시 연기… 대신 o3와 o4-미니 모델 몇 주 내 출시

4월 7, 2025

오픈AI 최고경영자 샘 알트만(Sam Altman)이 4일(현지 시간) 자사 X를 통해, 자사의 대규모 언어 모델 출시 계획을 변경했다고 발표했다. 당초 계획과 달리 O3와 O4-미니를 출시하기로…

Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts

바이트댄스, 트릴리언급 모델을 47% 빠르게 만드는 ‘코멧’ 기술 공개

3월 18, 2025

Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts 1조 규모 AI 모델의 숨은 병목: 디바이스 간 통신이 실행 시간의 47%를 차지 아주 큰 규모의 인공지능(AI) 모델을…

알리바바, 추론 모델 QwQ-32B 모델 공개… 20배 작은 규모로도 딥시크 R1과 비슷한 성능 달성

3월 6, 2025

강화학습(RL)을 대규모로 적용하면 기존의 사전 훈련 및 후속 훈련 방법을 넘어서는 모델 성능을 실현할 수 있다. 퀜(Qwen) 팀이 최근 320억 개의 파라미터만으로 6710억 개…

Large language models surpass human experts in predicting neuroscience results

대규모 언어모델, 뇌과학 실험 결과 예측에서 전문가 능력 18% 앞서

2월 18, 2025

Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던 유니버시티 칼리지(UCL)와 앨런 튜링 연구소 연구진이…

중국 AI 기업 딥시크, 오픈AI와 맞먹는 성능 입증…美 수출 통제 실효성 논란

1월 29, 2025

애틀란틱 카운슬(Atlantic Council) 보도에 따르면 중국의 오픈소스 추론 대규모 언어모델(LLM) 개발사인 딥시크(DeepSeek)가 자사의 ‘딥시크-R1(DeepSeek-R1)’ 모델로 오픈AI(OpenAI)의 o1 모델과 대등한 성능을 입증했다. 특히 이 모델은…

Top 10 opportunities for technology companies in 2025

2025년 기업 생존의 키워드는 ‘자율형 AI’… EY가 전망한 기술 기업의 10대 기회

1월 24, 2025

Top 10 opportunities for technology companies in 2025 글로벌 회계·컨설팅 기업 EY가 발표한 ‘2025년 기술기업을 위한 10대 기회’ 보고서에 따르면, 2025년은 기업들이 인공지능(AI) 도입의…

Large Language Models for Interpretable Mental Health Diagnosis

AI가 정신건강 진단을 돕는다…정확도 100% 달성한 하이브리드 진단시스템 개발

1월 23, 2025

Large Language Models for Interpretable Mental Health Diagnosis 1000페이지 진단 매뉴얼의 복잡성 해결을 위한 혁신적 접근 남부 캘리포니아 대학교(USC) 연구진이 개발한 임상의사결정지원시스템(CDSS)이 대규모 언어모델(LLM)과…

[CES 2025] 엔비디아, 3000달러짜리 AI 슈퍼컴퓨터 ‘프로젝트 디짓’ 공개…200B 매개변수 모델 구동 가능

1월 7, 2025

엔비디아가 CES 2025 키노트를 통해 일반 전기 콘센트만으로 구동 가능한 개인용 AI 슈퍼컴퓨터 ‘프로젝트 디짓(Project DIGITS)’을 공개했다. 이 시스템은 전 세계 AI 연구자, 데이터…

윈도우98 PC에서 라마 AI 구동 성공…26년 전 PC로 AI 언어모델 돌린다

1월 2, 2025

인공지능 기술기업 엑소랩스(EXO Labs)가 26년 된 인텔 펜티엄2 CPU와 128MB RAM이 장착된 윈도우98 PC에서 대규모 언어모델(LLM)을 구동하는데 성공했다. 엑소랩스는 지난 달 29일(현지 시간) X를…

Could Savannah be the Next San Jose? The Downstream Effects of Large Language Models

AI 시대, 새로운 실리콘밸리는 어디가 될까…LLM이 바꿀 미국의 일자리 지형도

12월 27, 2024

Could Savannah be the Next San Jose?The Downstream Effects of Large Language Models LLM이 가져올 노동시장의 구조적 변화 대규모 언어모델(LLM)의 광범위한 도입이 미국 노동시장의…

AI 시대, 미국인 90% ‘AI 안다’…그런데 생성 AI는 절반도 모른다

12월 20, 2024

NATIONAL AI OPINION MONITOR “AI는 알지만 챗GPT는 모른다”…美 AI 인지도 실태 인공지능(AI)에 대한 미국인들의 인지도는 90%를 넘어섰지만, 실제 사용률은 53% 수준에 그친 것으로 나타났다.…

아마존, 프라임 비디오에 ‘AI 토픽스’ 베타 서비스 출시…시청자 취향 저격한다

12월 17, 2024

아마존 뉴스에 따르면, 지난 13일(현지 시간) 프라임 비디오(Prime Video)가 시청자들의 콘텐츠 탐색 시간을 줄이고 시청 시간을 늘리기 위해 인공지능 기반의 새로운 기능 ‘AI 토픽스(AI…

알리바바, 추론 능력 강화한 대규모 언어모델 ‘마르코-o1’ 공개

12월 2, 2024

알리바바(Alibaba)는 기존 문제 해결과 개방형 문제 해결이 모두 가능한 대규모 언어모델(LLM) ‘마르코-o1(Marco-o1)’을 발표했다. 알리바바의 마르코폴로(MarcoPolo) 팀이 개발한 마르코-o1은 수학, 물리학, 코딩을 비롯해 명확한 기준이…

넷플릭스, 전사적 AI 도입 위한 대규모 인재 채용 나서

11월 1, 2024

넷플릭스(Netflix)가 콘텐츠 제작부터 현지화까지 모든 영역에서 AI를 활용하기 위해 대대적인 채용에 나섰다. “AI가 엔터테인먼트 산업에 미칠 영향에 대해 과대 광고가 많지만, 크리에이터들이 이 새로운…

A Third Transformation? Generative AI and Scholarly Publishing

생성형 AI가 학술 출판의 새로운 변혁을 이끈다…이타카 S+R 보고서

10월 31, 2024

학술 출판계에서 생성형 AI(Generative AI)의 영향력이 급속도로 확대되고 있다. 이타카 S+R(Ithaka S+R)이 발표한 새로운 보고서에 따르면, 2023년 발표된 학술 논문의 약 1%가 대규모 언어모델(LLM)의…

Thinking LLMs: General Instruction Following with Thought Generation

AI의 진화, ‘생각하는 능력’ 갖춘 LLM 개발…메타, 혁신적 훈련 방법 ‘TPO’ 공개

10월 22, 2024

메타(Meta)가 대규모 언어모델(LLM)에 ‘생각하는 능력’을 부여하는 혁신적인 훈련 방법을 개발했다. 기존의 AI 모델들이 입력에 대해 즉각적으로 답변을 생성했던 것과 달리, 이번에 개발된 방식은 인간처럼…

문샷AI, ‘Kimi 익스플로러 에디션’ 공개… OpenAI의 GPT-O1에 도전장

10월 14, 2024

복수의 외신에 따르면 중국 AI 기업 문샷AI가 OpenAI의 최신 대규모 언어 모델 GPT-O1에 도전장을 내밀었다. 문샷AI는 10일 ‘키미 익스플로러 에디션’을 공개했다. 이 신제품은 수학,…

DisTrO_Distributed Training Over-the-Internet

DisTrO, 대규모 AI 모델 학습의 새로운 지평을 열다

9월 3, 2024

인공지능(AI) 기술의 발전과 함께 대규모 언어 모델(Large Language Models, LLMs)과 대규모 확산 모델(Large Diffusion Models, LDMs)의 중요성이 날로 커지고 있다. 그러나 이러한 모델들의 학습에는…

A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism

웹의 충격적인 사실, 상당 부분이 기계 번역으로 이뤄져

9월 3, 2024

인공지능(AI) 기술의 발전으로 웹상의 콘텐츠 생태계가 크게 변화하고 있다. 최근 AWS AI 연구소와 UC 산타바바라 연구진이 발표한 보고서에 따르면, 웹상의 상당 부분이 기계 번역으로…

Authors sue Claude AI chatbot creator Anthropic for copyright infringement

9월 2, 2024

생성형 AI의 추론 능력, 테스트 시 연산 최적화로 크게 향상

8월 28, 2024

생성형 AI 모델의 추론 능력을 높이는 방법으로 모델 크기를 키우는 것 외에도 추론 시 연산을 최적화하는 방법이 주목받고 있다. 최근 연구에 따르면, 테스트 시…

AI 모델의 ‘붕괴’ 현상, 장기적 학습에 위협될 수 있어

8월 27, 2024

인공지능(AI) 기술이 급속도로 발전하면서 생성형 AI 모델들이 쏟아져 나오고 있다. ChatGPT, DALL-E, Midjourney 등 다양한 생성형 AI가 주목받고 있지만, 이러한 모델들이 자신들이 생성한 데이터로…

SPRi, 우리나라 AI 기술 수준의 급속한 성장

8월 26, 2024

인공지능(AI) 기술이 하루가 다르게 발전하면서 글로벌 기술 패권 경쟁이 더욱 치열해지고 있다. 이러한 상황에서 한국의 AI 기술 수준이 빠르게 성장하며 글로벌 경쟁력을 강화하고 있다는…

인공지능(AI)이 인공지능을 평가한다? 메타 AI 연구진, 혁신적인 ‘Self-Taught Evaluator’ 방식 제안

8월 26, 2024

인공지능(AI) 기술이 빠르게 발전하면서 AI 모델의 성능을 정확하게 평가하는 것이 중요한 과제로 떠올랐다. 특히 대규모 언어 모델(LLM)의 등장으로 AI의 능력이 비약적으로 향상되면서, 이를 제대로…