SpecInfer

SpecInfer：小模型撬动大模型高效推理

近日，来自卡耐基梅隆大学（CMU）的 Catalyst Group 团队发布了一款「投机式推理」引擎 SpecInfer，可以借助轻量化的小模型来帮助大模型，在完全不影响生成内容准确度的情况下，实现两到三倍的推理加速。随着 ChatGPT 的出现，大规模语言模型（LLM）研究及其应用得到学术界和工 ......

模型 SpecInfer更新时间 2023-05-30

共1篇 :1/1页 首页上一页1下一页尾页

JZTXT

SpecInfer

SpecInfer：小模型撬动大模型高效推理