DeepSpeed v0.18.8 发布:稳定性、Evoformer、多架构构建与ZeRO优化全面升级详解
日志与内存监控优化:减少无意义的日志噪音Evoformer Attention 多架构构建修复:解决编译与调度根因FP16 loss_scale 校验增强:避免隐性训练错误ZeRO Stage1/2/3 稳定性改进:CUDA stream 与日志行为修复Bloom 模型推理测试修复华为 Ascend NPU Async IO 构建问题修复AI 编码代理项目规范新增测试覆盖增强版本号更新代码地址:g
所有评论(0)