Search

  • Home
  • 대규모언어모델

대규모언어모델

Thinking LLMs: General Instruction Following with Thought Generation

AI의 진화, ‘생각하는 능력’ 갖춘 LLM 개발…메타, 혁신적…

10월 22, 2024

메타(Meta)가 대규모 언어모델(LLM)에 ‘생각하는 능력’을 부여하는 혁신적인 훈련 방법을 개발했다. 기존의 AI 모델들이 입력에 대해 즉각적으로 답변을 생성했던…

kimi

문샷AI, ‘Kimi 익스플로러 에디션’ 공개… OpenAI의 GPT-O1에 도전장

10월 14, 2024

복수의 외신에 따르면 중국 AI 기업 문샷AI가 OpenAI의 최신 대규모 언어 모델 GPT-O1에 도전장을 내밀었다. 문샷AI는 10일 ‘키미…

DisTrO_Distributed Training Over-the-Internet

DisTrO, 대규모 AI 모델 학습의 새로운 지평을 열다

9월 3, 2024

인공지능(AI) 기술의 발전과 함께 대규모 언어 모델(Large Language Models, LLMs)과 대규모 확산 모델(Large Diffusion Models, LDMs)의 중요성이 날로…

A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism

웹의 충격적인 사실, 상당 부분이 기계 번역으로 이뤄져

9월 3, 2024

인공지능(AI) 기술의 발전으로 웹상의 콘텐츠 생태계가 크게 변화하고 있다. 최근 AWS AI 연구소와 UC 산타바바라 연구진이 발표한 보고서에…

Authors sue Claude AI chatbot creator Anthropic for copyright infringement

저자들, AI 챗봇 ‘클로드’ 개발사 앤트로픽 상대로 저작권…

9월 2, 2024

인공지능(AI) 스타트업 앤트로픽(Anthropic)이 인기 챗봇 클로드(Claude)를 훈련시키는 과정에서 해적판 도서를 무단으로 사용했다는 이유로 저자들이 대규모 저작권 침해 소송을…

생성형 AI의 추론 능력, 테스트 시 연산 최적화로…

생성형 AI의 추론 능력, 테스트 시 연산 최적화로…

8월 28, 2024

생성형 AI 모델의 추론 능력을 높이는 방법으로 모델 크기를 키우는 것 외에도 추론 시 연산을 최적화하는 방법이 주목받고…

AI 모델의 ‘붕괴’ 현상, 장기적 학습에 위협될 수…

AI 모델의 ‘붕괴’ 현상, 장기적 학습에 위협될 수…

8월 27, 2024

인공지능(AI) 기술이 급속도로 발전하면서 생성형 AI 모델들이 쏟아져 나오고 있다. ChatGPT, DALL-E, Midjourney 등 다양한 생성형 AI가 주목받고…

SPRi, 우리나라 AI 기술 수준의 급속한 성장

SPRi, 우리나라 AI 기술 수준의 급속한 성장

8월 26, 2024

인공지능(AI) 기술이 하루가 다르게 발전하면서 글로벌 기술 패권 경쟁이 더욱 치열해지고 있다. 이러한 상황에서 한국의 AI 기술 수준이…

Self-Taught Evaluators

인공지능(AI)이 인공지능을 평가한다? 메타 AI 연구진, 혁신적인 ‘Self-Taught…

8월 26, 2024

인공지능(AI) 기술이 빠르게 발전하면서 AI 모델의 성능을 정확하게 평가하는 것이 중요한 과제로 떠올랐다. 특히 대규모 언어 모델(LLM)의 등장으로…

대규모언어모델 – 페이지 3 – AI 매터스 l AI Matters