昇腾系列芯片命名

Ascend310（基本淘汰）

顺其自然~

13578人浏览 · 2025-03-21 08:15:55

顺其自然~ · 2025-03-21 08:15:55 发布

Ascend310系列

Ascend310（基本淘汰）

B系列

Ascend310B1

Ascend310B2

Ascend310B3（Atlas200I A2芯片）

Ascend310B4（香橙派AI Pro芯片）

P系列

Ascend310P1（Atlas300I Pro、Atlas300V Pro）

Ascend310P3（*2 ——>Atlas300I DUO卡 48G）

Ascend910系列

A系列

初代量产版本。于2019年发布，采用7nm工艺，是AI训练芯片。目前主要存在于早期部署的集群中。

Ascend910A—————————————————————32G显存

Ascend910B （不带数字，还是A系列） —————————32G显存

Ascend910ProA（Pro系列，cube_freq较前代提升100）——32G显存

Ascend910ProB（Pro系列，看似910B，实则910A） ———32G显存

Ascend910PremiumA —————————————————32G显存

B系列

当前主力量产版本。华为通过架构优化提升了能效比。它是目前国产智算中心（如科大讯飞“飞星一号”、各地智算中心）的绝对主力，性能对标A100。

Ascend910B1（Atlas800T A2 训练卡）——————64G显存

Ascend910B2（Atlas800T A2 训练卡）——————64G显存

Ascend910B3（Atlas800T A2 训练卡）——————64G显存

Ascend910B4（Atlas800I A2 推理卡）——————32G显存

C系列

新一代高性能版本（预计2024-2025年大规模交付）。据行业消息，910C可能采用了Chiplet（小芯片）或双Die合封设计（将两颗910B的核心封装在一起），以突破单芯片面积和良率的限制，性能目标直指英伟达H100。

Ascend910C1

Ascend910C2

Ascend910C3

Ascend910C4

ATB算子（产品线）—— 针对Transformer

定义：ATB算子是 Ascend Transformer Boost 加速库中的一种算子，主要用于优化Transformer模型中的计算，特别是针对大规模张量运算的优化

特点：ATB算子通过tiling技术将大的计算任务分解成更小的块，来提高计算效率。这种技术可以更好地利用高速缓存，减少内存访问延迟，并且更适合并行计算环境

应用场景：ATB算子特别适用于处理大规模数据集和复杂模型，如自然语言处理和图像识别任务中的Transformer模型

ACLNN算子（海思）—— 所有昇腾卡上能跑的NN模型

定义：ACLNN算子是 Ascend Computing Language Neural Network 算子库中的一部分，提供了一系列深度优化过的高性能算子API，用于在昇腾AI处理器上执行NN计算

特点：ACLNN算子库包括多种算子，如NN算子、DVPP算子和HCCL算子等，支持高性能媒体数据处理和分布式训练中的高效数据传输

应用场景：ACLNN算子适用于各种深度学习任务，包括但不限于图像识别、语音识别和推荐系统等

ATB算子更专注于Transformer模型的优化（大模型）

ACLNN算子提供更广泛的算子支持，适用于多种深度学习任务（大小模型）

算子库分类：

NN（Neural Network）算子库：Softmax、MatMul、Conv 等常见深度学习算法

BLAS（Basic Linear Algebra Subprograms）算子库：矩阵乘法、最大/最小值计算、加法等基本线性代数运算

DVPP（Digital Vision Pre-Processing）算子库：图像和视频预处理能力，支持高效视频编解码和图像处理

AIPP（AI Pre-Processing）算子库：针对图像数据的AI预处理进行优化，使数据可以直接用于推理

HCCL（Huawei Collective Communication Library）算子库：提供单机多卡及多机多卡间DP、TP集合通信方案

MindIE——用的自己的atb算子库

转自：昇腾系列芯片命名搞不清？看这一篇就够了！！！_910b2和910b4区别-CSDN博客

昇腾910B版本全解析

“为何昇腾910B的价格差异如此之大？又何为910B3与910B4？”

—昇腾910B

这款产品并非单一版本，而是拥有多个小版本，这也正是客户在选购时可能发现价格差异的原因。接下来，我们将深入探讨这些数字编号背后的含义。

10B型号后的数字并非随意排列，而是代表着不同的算力规格。这些数字编号的核心差异体现在两个方面：一是FP16算力，二是显存容量。这两种规格的差异，将直接影响昇腾910B的性能和应用范围。

—DeepSeek一体机满血版

谈及昇腾910B，DeepSeek一体机无疑是焦点所在。众多客户热衷于获取满血版的671B模型，对一般蒸馏版则不屑一顾。而我们的需求则相对简单明确：“我们需要部署满血的DeepSeek671B大模型，请协助我们寻找两台华为算力服务器，并确保每台服务器配备8张910B算力卡。”

1）满血版的部署可并不简单，仅仅两台服务器显然不够。通常，原厂推荐的方案是4台的集群，以确保模型的稳定运行。这背后涉及到模型对硬件显存的精密计算，虽然在此不详细展开，但足以说明满血版并非轻而易举就能实现。

2）每位客户都希望以最优惠的价格获得所需产品，然而在配置上却往往忽视关键细节。例如，每台服务器需配备8张910B算力卡，这里其实推荐使用的是910 B3及以上的版本。

转自：https://blog.csdn.net/weixin_44659309/article/details/145998682

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

更多推荐

SenseVoicecpp ggml-cann.cpp大模型[AI人工智能(七十六)]—东方仙盟

鲲鹏昇腾开发者社区

DeepSeek-V3.2热度拉满，DMXAPI安心调用，免费大模型API有哪些？

鲲鹏昇腾开发者社区

昇腾MindSpore实战经验分享：从入门到工业级部署的全方位指南

本文介绍了昇腾MindSpore框架的核心优势与开发实践。作为华为全栈AI解决方案的关键组件，MindSpore具备全场景协同、性能优异和生态完善等特点。文章详细讲解了环境配置、核心特性（如动态/静态图模式、混合精度训练）、性能优化技巧（数据流水线、分布式训练）以及模型迁移经验。特别强调了在昇腾硬件上的最佳实践，包括算子开发、社区资源利用和性能监控方法。随着昇腾NPU算力持续提升，MindSpor