登录社区云,与社区用户共同成长
邀请您加入社区
·从多模态生成模型的原理与发展演进讲起 ·深入解析MindIE SD 推理加速套件的核心架构与关键特性 ·讲解如何高效完成生成模型的推理部署全流程
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐
BoostKit 鲲鹏数据库优化原理分析从 MySQL 到 MariaDB 的性能突破
鲲鹏原生加速之力:BoostKit KVecTurbo 源码解析与实战
mean triton确定性算子适配
作者:昇腾实战派 1、背景概述 在深度学习中,算子的确定性计算对于确保模型训练和推理的可复现性至关重要。然而,许多算子(如均值计算算子)在默认实现下可能存在非确定性问题,尤其是在float32数据类型上,这是由于浮点数计算不满足结合律,导致多核并行计算顺序不一致引入的数值偏差。本文以mean算子为例,系统性地复现了其在GPU和NPU上的非确定性计算问题,对比了确定性实现与非确定性实现的性能差异,
扫一扫分享内容
所有评论(0)