LLM 가속화 – AI 매터스

LLM 가속화

LayerSkip: Enabling Early Exit Inference and Self-Speculative Decoding

메타, LLM 추론 속도 혁신하는 ‘LayerSkip’ 기술 공개…최대…

10월 28, 2024

메타(Meta)가 대규모 언어 모델(Large Language Model, LLM)의 추론 속도를 획기적으로 개선할 수 있는 ‘LayerSkip’ 기술을 공개했다. 이 기술은…

1
2
3

Trending

Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy (short paper)

“무례하게 물어봐야 정답률 높다”…챗GPT, 공손한 질문엔 오히려…

김은영 에디터10월 15, 2025

[Q&AI] 최대 30만원… 상생페이백 환급 일정은?

[Q&AI] 최대 30만원… 상생페이백 환급 일정은?

김은영 에디터10월 15, 2025

"AI 도입 고민 끝" 스마일샤크-AWS, 기업 맞춤 생성형 AI 솔루션 한번에 제공

“AI 도입 고민 끝” 스마일샤크-AWS, 기업 맞춤…

김은영 에디터10월 15, 2025

LLM 가속화 – AI 매터스