AI 추론

엔비디아 CEO "딥시크 R1, AI 시장 확대할 것...시장 반응은 잘못됐다"

엔비디아 CEO “딥시크 R1, AI 시장 확대할 것…시장…

2월 24, 2025

엔비디아(Nvidia)의 창업자이자 최고경영자(CEO)인 젠슨 황이 딥시크(DeepSeek)의 기술 발전이 자사의 사업에 미치는 영향에 대한 시장의 우려를 일축했다. 테크크런치가 2일(현지…

구글, AI 추론 모델용 'A4X VM' 공개... 엔비디아 GB200 탑재해 성능 4배 향상

구글, AI 추론 모델용 ‘A4X VM’ 공개… 엔비디아…

2월 24, 2025

구글 클라우드(Google Cloud)가 20일(현지 시간) 자사 블로그에 발표한 내용에 따르면, 구글 클라우드가 엔비디아(NVIDIA) GB200 NVL72를 탑재한 A4X VM(가상머신)을…

s1: Simple test-time scaling

AI 연산량 늘리기만 해도 성능이 좋아진다… 스탠포드·워싱턴대, 50달러로…

2월 10, 2025

s1: Simple test-time scaling 1,000개 데이터로 o1 모델 능가… S1-32B 모델의 혁신적 성과 스탠포드와 워싱턴 대학교 연구진이 언어모델의…

오픈AI, ‘o3-미니' 추론 과정 일부 공개… 딥시크 의식하나

오픈AI, ‘o3-미니’ 추론 과정 일부 공개… 딥시크 의식하나

2월 10, 2025

오픈AI가 자사 공식 X를 통해 AI 모델의 사고 과정(Chain of Thought, CoT) 기능을 업데이트했다. 이번 업데이트는 무료·유료 사용자용…

30달러로 구현한 AI 추론 능력..."UC 버클리, 딥시크 핵심기술 재현 성공"

30달러로 구현한 AI 추론 능력…”UC 버클리, 딥시크 핵심기술…

2월 3, 2025

UC 버클리(UC Berkeley) 연구진이 30달러(약 4만3750원)라는 저비용으로 딥시크(DeepSeek)의 핵심 기술을 재현하는데 성공했다. 해당 연구진은 데이프시크 R1 제로(DeepSeek R1…

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs

2+3=X를 위해 13번 고민하는 AI… 텐센트, AI 모델의…

1월 3, 2025

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs 중국의 기술 기업 텐센트가 설립한…

ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems

RAG 시스템의 혁신, ‘ChunkRAG’ – 청크 단위 필터링으로…

10월 30, 2024

검색 강화 생성(Retrieval-Augmented Generation, RAG) 시스템은 인공지능의 응답 생성 능력을 높이기 위해 외부 지식을 활용하는 기술이다. 하지만 기존…

openai

OpenAI, ‘스트로베리’ 출시 임박… ChatGPT에 새 기능 탑재

9월 12, 2024

오픈AI(OpenAI)가 2주 내에 자사의 인공지능 챗봇 서비스인 챗GPT(ChatGPT)에 ‘스트로베리(Strawberry)’라는 새로운 기능을 탑재할 계획이라고 밝혔다. 로이터 통신이 The Information의…

AI 추론 – 페이지 2 – AI 매터스 l AI Matters