登录社区云,与社区用户共同成长
邀请您加入社区
面向昇腾AI处理器,聚焦高性能算子开发:基于AscendNPUIR进行编译接入与联创,融合编译器优化手段,并依托FlagOS社区拓展FlagTree TLE原语,最大化挖掘昇腾硬件潜力与编译能力,编写高性能算子。
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐
昇腾NPU上编译Apex:从踩坑到搞定
更新系统# 编译工具# Python开发包# torchApex编译看似简单,实则暗藏许多细节。本文通过真实案例,深入剖析了从网络代理到系统库路径的各个环节。Docker守护进程代理配置容易漏lib和lib64路径差异编译脚本会覆盖手动修改希望大家可以学习一些经验教训,对于大模型训练来说,Apex基本是必备工具。昇腾适配版虽然有些小坑,但整体可用性还不错,注明:昇腾PAE案例库对本文写作亦有帮助。
099 05黄大年茶思屋榜文第99期 第5题 面向磁带介质的低冗余信道编码算法
099 04黄大年茶思屋榜文第99期 第4题 大窗长下的高性能LZ压缩算法
扫一扫分享内容
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
所有评论(0)