lmdeploy v0.12.2 发布!全面支持 GLM5、Qwen3.5,性能与兼容性双升级,大模型部署再提速
模型支持更全面:覆盖GLM5、Qwen3.5、GLM-4.7等最新主流大模型,同时兼容Qwen、Internlm、Llama等经典模型,满足不同开发者的模型选型需求。推理性能更强劲:TurboMind引擎深度优化、MLA内核升级、FP8量化在线支持,大幅提升推理速度、降低显存占用,让大模型部署更高效、低成本。兼容性更广泛:适配Transformers 5.0、昇腾S1-Pro芯片、V100等主流硬
所有评论(0)