CANN 学习资源指南：从入门到精通的完整路线

刚接触昇腾CANN那会，我被一堆概念砸懵了。AscendCL、Ascend C、算子开发、图编译、推理部署……每个词都认识，连在一起完全不知道从哪下手。后来我发现，CANN 开源社区有个专门的仓库叫 cann-learning-hub，把所有学习资源都整理好了。问题是，资源太多，新手反而不知道怎么走。今天就跟大家聊聊 CANN 的学习资源体系，帮你理清一条从入门到精通的路线。

程咬金爱吃

73人浏览 · 2026-05-20 12:50:47

程咬金爱吃 · 2026-05-20 12:50:47 发布

刚接触昇腾CANN那会，我被一堆概念砸懵了。AscendCL、Ascend C、算子开发、图编译、推理部署……每个词都认识，连在一起完全不知道从哪下手。

后来我发现，CANN 开源社区有个专门的仓库叫 cann-learning-hub，把所有学习资源都整理好了。问题是，资源太多，新手反而不知道怎么走。

今天就跟大家聊聊 CANN 的学习资源体系，帮你理清一条从入门到精通的路线。

CANN 学习资源的"全家桶"结构

CANN 的学习资源不是零散的博客文章，而是一套完整的学习体系。核心有七个仓库：

仓库名	定位	内容
cann-learning-hub	社区学习中心	教程、博客、竞赛、学习路线
cann-samples	代码示例	ACL 单算子、图模式、推理样例
cann-recipes-infer	推理配方	预训练模型推理实战
cann-recipes-train	训练配方	分布式训练实战
cann-recipes-embodied-intelligence	具身智能	机器人、自动驾驶场景
cann-recipes-spatial-intelligence	空间智能	3D 视觉、SLAM 场景
cann-recipes-harmony-infer	鸿蒙推理	鸿蒙设备端推理

这就像一个完整的学习体系：理论（learning-hub）→ 示例→ 实战→ 行业应用。

cann-learning-hub：你的学习起点

cann-learning-hub 是 CANN 社区学习中心，里面有三类内容：

1. 系列教程

按难度分级，从 L1（入门）到 L4（专家级）。比如：

L1：CANN 架构概览、环境搭建
L2：ACL 单算子调用、图模式开发
L3：Ascend C 算子开发、性能调优
L4：分布式训练、大模型部署

每个教程都有配套代码和练习题。

2. 社区博客

来自社区贡献者的实战经验分享。比如"如何在 Atlas 300I 上部署 YOLOv8"、"FlashAttention 性能调优踩坑记录"这类文章。

博客的好处是接地气，作者会写踩过的坑和解决方案，不像官方文档那样四平八稳。

3. 学习路线图

cann-learning-hub 提供了三套学习路线：

推理工程师路线：ACL → 图模式 → 模型部署 → 性能调优
算子开发者路线：Ascend C → 算子开发 → 融合优化 → 硬件适配
训练工程师路线：分布式训练 → 框架适配 → 大模型训练

你可以根据自己的角色选择对应路线，不用从头到尾啃所有文档。

cann-samples：代码示例库

学编程最好的方式是看代码、改代码、跑代码。

cann-samples 提供了大量可运行的代码示例，按场景分类：

1. ACL 单算子示例

展示如何用 AscendCL 调用单个算子。比如：

MatMul 矩阵乘法
Softmax 归一化
FlashAttention（来自 ops-transformer）

每个示例都有完整的 CMake 配置和运行脚本，clone 下来直接能跑。

2. 图模式示例

展示如何用图模式构建计算图。比如：

ResNet 推理图
Transformer 推理图
自定义算子接入图

图模式是 CANN 的核心能力，理解图模式对后续的模型部署很重要。

3. 模型推理示例

完整的模型推理流程。比如：

YOLO 目标检测
ResNet 图像分类
Whisper 语音识别

从模型转换、图编译到推理执行，全流程展示。

cann-recipes：实战配方

如果说 cann-samples 是"代码片段"，那 cann-recipes 就是"完整项目"。

cann-recipes-infer：推理配方

针对具体模型的推理实战。比如：

LLaMA2-70B 推理（使用 ops-transformer 的 FlashAttention）
Stable Diffusion 图像生成
Whisper 语音识别

每个配方都包含：

模型权重准备
CANN 算子配置
性能调优参数
预期性能数据

cann-recipes-train：训练配方

分布式训练实战。比如：

LLaMA 预训练（千亿参数）
多机多卡配置
梯度检查点和显存优化

训练配方对硬件要求高，但如果你想深入了解大模型训练，这是最好的学习材料。

行业配方

cann-recipes-embodied-intelligence：机器人、自动驾驶场景
cann-recipes-spatial-intelligence：3D 视觉、SLAM
cann-recipes-harmony-infer：鸿蒙设备端推理

这些配方展示了 CANN 在垂直行业的应用，如果你在相关领域工作，可以直接参考。

学习路线推荐

根据你的角色，推荐不同的学习路径：

如果你是推理工程师（部署模型）：

cann-learning-hub L1-L2（基础概念）
 ↓
cann-samples（ACL 示例）
 ↓
cann-recipes-infer（模型推理）
 ↓
ops-transformer（高性能算子）

重点掌握：ACL 调用、图模式推理、FlashAttention 等算子优化。

如果你是算子开发者：

cann-learning-hub L2-L3（Ascend C）
 ↓
ops-transformer（算子实现）
 ↓
catlass（算子模板）
 ↓
社区博客（调优经验）

重点掌握：Ascend C 编程、达芬奇架构、算子融合。

如果你是训练工程师：

cann-learning-hub L3-L4（分布式训练）
 ↓
cann-recipes-train（训练配方）
 ↓
hccl/hcomm（通信库）
 ↓
ge/runtime（图引擎）

重点掌握：分布式训练配置、通信优化、大模型训练技巧。

学习资源的关系图

这些仓库之间有明确的依赖关系：

cann-learning-hub（学习中心）
 ↓ 指引
cann-samples（代码示例）
 ↓ 参考
cann-recipes-infer/train（实战配方）
 ↓ 使用
ops-transformer / catlass（核心算子）

正确的学习方式：先看 learning-hub 的教程，理解概念；再跑 samples 的代码，动手实践；最后用 recipes 做完整项目。

错误的学习方式：直接 clone 一个 recipes，报错了不知道为什么，然后放弃。

学习资源对比

资源类型	优点	局限	适用阶段
官方文档	全面、权威	篇幅长、偏理论	查阅参考
cann-learning-hub	系统化、有路线	更新频率一般	入门学习
cann-samples	可运行、直观	场景有限	动手实践
cann-recipes	完整项目、有深度	硬件要求高	进阶实战
社区博客	实战经验、接地气	零散、质量参差	补充学习