사람이 문제를 풀 때 과거 경험을 떠올려 더 나은 방법을 선택하듯, AI도 이제 경험을 통해 학습한다. AWS AI와 펜실베이니아대학교 연구진이 개발한 EGUR(Experience-Guided Reasoner)는 문제를…
The Hallucination Tax of Reinforcement Finetuning OpenAI o1처럼 똑똑해진 AI의 치명적 약점 발견 강화학습 파인튜닝(Reinforcement Finetuning, RFT)이 대형언어모델(LLM)의 수학 추론 능력을 크게 향상시키지만, 동시에…
구글의 최첨단 AI 모델 제미나이(Gemini)가 29년 된 비디오 게임 ‘포켓몬 블루’를 완료하는 이정표를 달성했다. 구글 CEO 순다르 피차이는 소셜 미디어를 통해 이 성과를 공식적으로…
마이크로소프트(Microsoft)가 18일(현지 시간) 자사 홈페이지를 통해 뇌과학 연구에 기반한 혁신적인 AI 기술 개발 업체인 이네잇(inait)과 협력하여 디지털 두뇌 기반 인공지능을 다양한 산업에 배포한다고 발표했다.…
오픈AI가 더 강력한 성능을 갖춘 새로운 AI 모델 ‘o1-pro’를 API를 통해 출시했다. 이 모델은 기존 o1 모델보다 더 많은 컴퓨팅 자원을 사용해 일관되게 향상된…
SPRi AI Brief 인공지능 산업의 최신 동향: 정책・법제 EU, 2천억 유로 규모 ‘인베스트AI’ 계획으로 AI 기가팩토리 구축 추진 EU 집행위원회가 경쟁력 강화를 위한 5개년…
구글 딥마인드(Google DeepMind)의 데미스 하사비스(Demis Hassabis) CEO가 인간과 동등하거나 그 이상의 능력을 가진 인공지능, 즉 범용 인공지능(AGI)이 향후 5~10년 내에 등장할 것이라고 전망했다. CNBC가…
중국 인터넷 대기업 바이두(Baidu)가 치열한 AI 경쟁에서 두각을 나타내기 위해 두 가지 새로운 인공지능 모델을 출시했다. 특히 그중 하나는 추론에 중점을 둔 모델로, 중국…
인셉션 랩스(Inception Labs)가 지난달 27일(현지 시간) 자사 웹사이트를 통해 세계 최초의 상업용 디퓨전 대규모 언어 모델(dLLM) ‘머큐리(Mercury)’를 공개했다. 이 새로운 모델은 기존 LLM보다 최대…
딥시크(DeepSeek)가 자사의 오픈소스 주간 6일차를 맞아 놀라운 AI 추론 시스템 성능과 수익성을 공개했다. 딥시크는 1일(현지 시간) 자사 X를 통해, 최근 발표한 딥시크-V3/R1(DeepSeek-V3/R1) 추론 시스템이…
딥시크(DeepSeek)가 25일(현지 시간) 오픈소스 주간(#OpenSourceWeek) 둘째 날을 맞아 혼합 전문가(MoE, Mixture of Experts) 모델 훈련과 추론을 위한 최초의 오픈소스 EP 통신 라이브러리인 ‘DeepEP’를 공개했다.…
엔비디아(Nvidia)의 창업자이자 최고경영자(CEO)인 젠슨 황이 딥시크(DeepSeek)의 기술 발전이 자사의 사업에 미치는 영향에 대한 시장의 우려를 일축했다. 테크크런치가 2일(현지 시간) 보도한 내용에 따르면, 황 CEO는…
구글 클라우드(Google Cloud)가 20일(현지 시간) 자사 블로그에 발표한 내용에 따르면, 구글 클라우드가 엔비디아(NVIDIA) GB200 NVL72를 탑재한 A4X VM(가상머신)을 프리뷰로 공개했다. 이는 AI 추론 모델의…
s1: Simple test-time scaling 1,000개 데이터로 o1 모델 능가… S1-32B 모델의 혁신적 성과 스탠포드와 워싱턴 대학교 연구진이 언어모델의 추론 능력을 향상시키는 새로운 방법을 발견했다.…
오픈AI가 자사 공식 X를 통해 AI 모델의 사고 과정(Chain of Thought, CoT) 기능을 업데이트했다. 이번 업데이트는 무료·유료 사용자용 O3-미니(o3-mini)와 유료 사용자 전용 O3-미니-하이(o3-mini-high) 모델에…
UC 버클리(UC Berkeley) 연구진이 30달러(약 4만3750원)라는 저비용으로 딥시크(DeepSeek)의 핵심 기술을 재현하는데 성공했다. 해당 연구진은 데이프시크 R1 제로(DeepSeek R1 Zero)의 카운트다운과 곱셈 작업을 재현한 ‘TinyZero’를…
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs 중국의 기술 기업 텐센트가 설립한 AI랩과 상하이자오통대학교 연구진이 발표한 최신 논문에…
검색 강화 생성(Retrieval-Augmented Generation, RAG) 시스템은 인공지능의 응답 생성 능력을 높이기 위해 외부 지식을 활용하는 기술이다. 하지만 기존 RAG 시스템들은 부적절한 정보 검색으로 인한…
오픈AI(OpenAI)가 2주 내에 자사의 인공지능 챗봇 서비스인 챗GPT(ChatGPT)에 ‘스트로베리(Strawberry)’라는 새로운 기능을 탑재할 계획이라고 밝혔다. 로이터 통신이 The Information의 보도를 인용해 10일(현지시간) 전했다. 더인포메이션에 따르면,…