아마존웹서비스(Amazon Web Services, AWS)가 기업들이 자체 AI 모델을 손쉽게 제작할 수 있는 새로운 기능을 대거 내놨다. 테크크런치에 따르면, AWS는 3일(현지 시각) 리인벤트(re:Invent) 컨퍼런스에서 아마존…
화웨이(Huawei)의 AI 연구 부문이 자사의 판구 프로(Pangu Pro) 대규모 언어 모델이 알리바바(Alibaba)의 큐엔(Qwen) 모델을 표절했다는 의혹을 강력히 부인했다. 어니스트AGI(HonestAGI)라는 단체가 깃허브(Github)에 게시한 논문은 화웨이의…
Artificial Eyes: Generative AI in China’s Military Intelligence 중국 인민해방군(PLA)이 생성형 인공지능을 군사정보 분야에 적극 도입하고 있다는 새로운 보고서가 공개됐다. 레코디드 퓨처(Recorded Future)의 인시크트…
Fighting Scams on Search 구글, AI 기반 사기 방지 시스템으로 검색 결과 99% 안전성 확보 구글이 공개한 보안 보고서에 따르면, 구글 검색은 사용자가 관련성…
파이낸셜타임스(FT)의 보도에 따르면, 중국 검색 기업 바이두(Baidu)의 창업자가 자국 생성형 AI 기업 딥시크(DeepSeek)가 개발하는 텍스트 기반 모델에 대한 수요가 “축소되고 있다”고 발언해 관심을 모으고…
Lower Latency and Higher Throughput with Multi-Node DeepSeek Deployment 8개 A100 GPU로 지연시간 20% 단축, 처리량 8배 증가한 퍼플렉시티의 멀티노드 전략 퍼플렉시티(Perplexity)가 멀티노드 환경에서…
오픈AI 최고경영자 샘 알트만(Sam Altman)이 4일(현지 시간) 자사 X를 통해, 자사의 대규모 언어 모델 출시 계획을 변경했다고 발표했다. 당초 계획과 달리 O3와 O4-미니를 출시하기로…
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts 1조 규모 AI 모델의 숨은 병목: 디바이스 간 통신이 실행 시간의 47%를 차지 아주 큰 규모의 인공지능(AI) 모델을…
강화학습(RL)을 대규모로 적용하면 기존의 사전 훈련 및 후속 훈련 방법을 넘어서는 모델 성능을 실현할 수 있다. 퀜(Qwen) 팀이 최근 320억 개의 파라미터만으로 6710억 개…
Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던 유니버시티 칼리지(UCL)와 앨런 튜링 연구소 연구진이…
애틀란틱 카운슬(Atlantic Council) 보도에 따르면 중국의 오픈소스 추론 대규모 언어모델(LLM) 개발사인 딥시크(DeepSeek)가 자사의 ‘딥시크-R1(DeepSeek-R1)’ 모델로 오픈AI(OpenAI)의 o1 모델과 대등한 성능을 입증했다. 특히 이 모델은…
Top 10 opportunities for technology companies in 2025 글로벌 회계·컨설팅 기업 EY가 발표한 ‘2025년 기술기업을 위한 10대 기회’ 보고서에 따르면, 2025년은 기업들이 인공지능(AI) 도입의…
Large Language Models for Interpretable Mental Health Diagnosis 1000페이지 진단 매뉴얼의 복잡성 해결을 위한 혁신적 접근 남부 캘리포니아 대학교(USC) 연구진이 개발한 임상의사결정지원시스템(CDSS)이 대규모 언어모델(LLM)과…
엔비디아가 CES 2025 키노트를 통해 일반 전기 콘센트만으로 구동 가능한 개인용 AI 슈퍼컴퓨터 ‘프로젝트 디짓(Project DIGITS)’을 공개했다. 이 시스템은 전 세계 AI 연구자, 데이터…
인공지능 기술기업 엑소랩스(EXO Labs)가 26년 된 인텔 펜티엄2 CPU와 128MB RAM이 장착된 윈도우98 PC에서 대규모 언어모델(LLM)을 구동하는데 성공했다. 엑소랩스는 지난 달 29일(현지 시간) X를…
Could Savannah be the Next San Jose?The Downstream Effects of Large Language Models LLM이 가져올 노동시장의 구조적 변화 대규모 언어모델(LLM)의 광범위한 도입이 미국 노동시장의…
NATIONAL AI OPINION MONITOR “AI는 알지만 챗GPT는 모른다”…美 AI 인지도 실태 인공지능(AI)에 대한 미국인들의 인지도는 90%를 넘어섰지만, 실제 사용률은 53% 수준에 그친 것으로 나타났다.…
아마존 뉴스에 따르면, 지난 13일(현지 시간) 프라임 비디오(Prime Video)가 시청자들의 콘텐츠 탐색 시간을 줄이고 시청 시간을 늘리기 위해 인공지능 기반의 새로운 기능 ‘AI 토픽스(AI…
알리바바(Alibaba)는 기존 문제 해결과 개방형 문제 해결이 모두 가능한 대규모 언어모델(LLM) ‘마르코-o1(Marco-o1)’을 발표했다. 알리바바의 마르코폴로(MarcoPolo) 팀이 개발한 마르코-o1은 수학, 물리학, 코딩을 비롯해 명확한 기준이…
넷플릭스(Netflix)가 콘텐츠 제작부터 현지화까지 모든 영역에서 AI를 활용하기 위해 대대적인 채용에 나섰다. “AI가 엔터테인먼트 산업에 미칠 영향에 대해 과대 광고가 많지만, 크리에이터들이 이 새로운…
학술 출판계에서 생성형 AI(Generative AI)의 영향력이 급속도로 확대되고 있다. 이타카 S+R(Ithaka S+R)이 발표한 새로운 보고서에 따르면, 2023년 발표된 학술 논문의 약 1%가 대규모 언어모델(LLM)의…
메타(Meta)가 대규모 언어모델(LLM)에 ‘생각하는 능력’을 부여하는 혁신적인 훈련 방법을 개발했다. 기존의 AI 모델들이 입력에 대해 즉각적으로 답변을 생성했던 것과 달리, 이번에 개발된 방식은 인간처럼…
복수의 외신에 따르면 중국 AI 기업 문샷AI가 OpenAI의 최신 대규모 언어 모델 GPT-O1에 도전장을 내밀었다. 문샷AI는 10일 ‘키미 익스플로러 에디션’을 공개했다. 이 신제품은 수학,…
인공지능(AI) 기술의 발전과 함께 대규모 언어 모델(Large Language Models, LLMs)과 대규모 확산 모델(Large Diffusion Models, LDMs)의 중요성이 날로 커지고 있다. 그러나 이러한 모델들의 학습에는…
인공지능(AI) 기술의 발전으로 웹상의 콘텐츠 생태계가 크게 변화하고 있다. 최근 AWS AI 연구소와 UC 산타바바라 연구진이 발표한 보고서에 따르면, 웹상의 상당 부분이 기계 번역으로…
인공지능(AI) 스타트업 앤트로픽(Anthropic)이 인기 챗봇 클로드(Claude)를 훈련시키는 과정에서 해적판 도서를 무단으로 사용했다는 이유로 저자들이 대규모 저작권 침해 소송을 제기했다. 경쟁사인 오픈AI(OpenAI)의 챗GPT(ChatGPT)를 상대로 한…
생성형 AI 모델의 추론 능력을 높이는 방법으로 모델 크기를 키우는 것 외에도 추론 시 연산을 최적화하는 방법이 주목받고 있다. 최근 연구에 따르면, 테스트 시…
인공지능(AI) 기술이 급속도로 발전하면서 생성형 AI 모델들이 쏟아져 나오고 있다. ChatGPT, DALL-E, Midjourney 등 다양한 생성형 AI가 주목받고 있지만, 이러한 모델들이 자신들이 생성한 데이터로…
인공지능(AI) 기술이 하루가 다르게 발전하면서 글로벌 기술 패권 경쟁이 더욱 치열해지고 있다. 이러한 상황에서 한국의 AI 기술 수준이 빠르게 성장하며 글로벌 경쟁력을 강화하고 있다는…
인공지능(AI) 기술이 빠르게 발전하면서 AI 모델의 성능을 정확하게 평가하는 것이 중요한 과제로 떠올랐다. 특히 대규모 언어 모델(LLM)의 등장으로 AI의 능력이 비약적으로 향상되면서, 이를 제대로…