登录社区云,与社区用户共同成长
邀请您加入社区
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐
CANN 7升级到CANN 8常见问题与性能分析测评
昇腾平台多模态微调与推理实战,从理论到落地的完整探索
深度解析昇腾Catlass:C++模板元编程与高性能算子开发范式(1)
/ 1. 定义基本的形状配置// 一个AI Core处理的大小// 一个Warp处理的大小// 基础指令处理的大小// 2. 定义流水线策略 (Pipeline Strategy)// Stage=2 意味着开启 Double Buffering (双缓冲),这是高性能的关键!对齐是生命线:Catlass 极其依赖向量化指令。你的输入矩阵维度(M, N, K)如果不能被16或32整除,模板实例化可
扫一扫分享内容
所有评论(0)