登录社区云,与社区用户共同成长
邀请您加入社区
鲲鹏BoostKit搜推广场景致力于为互联网领域的搜索、推荐与广告业务场景提供基于鲲鹏平台的全栈加速能力。
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐
Ascend C 异构编程环境搭建全流程指南
摘要:本文详细介绍了华为昇腾AI处理器原生算子开发语言AscendC的环境搭建全流程。首先分析了硬件兼容性要求,包括Atlas训练/推理系列芯片和操作系统版本;其次讲解了系统依赖安装、Python环境配置和CANNToolkit部署方法;然后重点阐述了环境变量配置技巧;最后通过一个简单的Add算子示例,展示了工程目录结构、核心代码实现和CMake构建方法,并提供了编译运行及调试技巧。文档覆盖910
NVIDIA迁移昇腾踩坑记:为何数据拷贝成了“背锅侠”?(附1.5s→0.7s优化复盘)
本次小模型迁移性能调优实战,从最初的性能衰退到最终的超越原平台性能,整个过程充满了技术挑战和发现。最关键的是,我们打破了直觉的误导,通过科学的Profiling分析找到了真正的性能瓶颈。目前CANN的迭代速度很快,建议大家在迁移时如果遇到性能瓶颈,不要死磕代码逻辑,先跑一遍Profiler,大概率能帮你省下几天排查时间。如果常规手段搞不定,试试Torchair或者MindIE这种针对性的推理后端,
vLLM-Ascend推理部署与性能调优深度实战指南:架构解析、环境搭建与核心配置
扫一扫分享内容
所有评论(0)