智能驾驶算力芯片大战:英伟达DRIVE Thor vs 地平线J6E vs 华为昇腾
·
为什么智能驾驶对芯片要求这么高?
理解算力需求,先理解算法:
| 算法阶段 | 代表算法 | 算力特点 |
|---|---|---|
| 感知(Perception) | BEV感知、Transformer、YOLO | 大矩阵乘法,需要强INT8/FP16算力 |
| 预测(Prediction) | 轨迹预测Transformer | 序列处理,Attention计算密集 |
| 规划(Planning) | NN Planner / PDM-Closed | 批量推理,实时性要求高 |
| 地图(Mapping) | 在线向量化建图 | 内存带宽敏感 |
| 融合控制(PNC) | 模型预测控制MPC | CPU实时计算 |
以目前主流的**端到端自动驾驶架构(E2E + VLM)**为例,单帧处理需要:
- 6~12路摄像头输入,分辨率1920×1080+
- 每秒30帧以上的完整感知-规划闭环
- 峰值算力需求:100~400 TOPS(INT8)
- 内存带宽需求:100~400 GB/s
这正是芯片厂商们疯狂堆算力的根本原因。
三款芯片快速画像
英伟达 DRIVE Thor
英伟达DRIVE Thor是2022年发布、2025年开始规模量产的新一代车载计算平台,定位旗舰智能驾驶+智能座舱融合计算。
核心规格:
- 算力:2000 TOPS(INT8)
- GPU架构:Hopper架构(同数据中心H100同代)
- CPU:12× Arm Cortex-A78AE(ASIL-B)
- 内存:LPDDR5,带宽 1 TB/s
- 制程:4nm(台积电)
- 功耗:TDP约 60W
- 量产车型:极氪、比亚迪(部分高端车型)
技术亮点:
- Transformer Engine(TE):支持FP8精度,Transformer类算法效率提升2×+
- CUDA生态壁垒:全球80%+的自动驾驶算法工程师用CUDA开发,迁移成本极高
- DriveOS + DriveIX:完整的BSP+中间件+算法SDK体系
- ISO 26262 ASIL-B认证(安全岛独立),支持冗余架构升级至ASIL-D
典型应用: 高阶NOA/城市领航、端到端大模型推理
地平线 征程J6E / J6P
地平线是目前国内量产出货量最大的高阶自动驾驶芯片厂商,J6系列于2023年发布,2024年开始大规模上量。
J6E 核心规格:
- 算力:128 TOPS(INT8)
- BPU(Brain Processing Unit)架构:BPU Nash
- CPU:8× Arm Cortex-A55 + 2× Cortex-R5
- 内存:LPDDR5,带宽 102 GB/s
- 制程:16nm
- 功耗:TDP约 10W
- ASIL:ASIL-B(可组合至ASIL-D)
- 量产车型:理想L6/L9、极越、长安、奇瑞等
J6P 核心规格:
- 算力:560 TOPS(INT8)
- BPU:BPU Nash(升级版)
- 内存带宽:256 GB/s
- 制程:5nm
- 量产:2024年下半年开始
技术亮点:
- BEV亲和架构:BPU Nash专门针对BEV(Bird's Eye View)感知算法的Transformer算子做了硬件加速,实测BEV感知效率领先同类竞品
- 低功耗高效能:J6E 10W功耗实现128 TOPS,能效比(TOPS/W)行业领先
- Horizon Open Platform(HOP):完整的算法开发工具链,支持量化、部署、仿真一体化
- 量产经验丰富:地平线J系列已累计装车超300万颗,OTA迭代数据积累深厚
典型应用: 城市NOA入门/主流量产、ADAS L2/L2+、成本敏感高阶场景
华为 昇腾MDC系列
华为MDC(Mobile Data Center,移动数据中心)是针对自动驾驶量产的完整计算平台,基于昇腾系列芯片。
MDC 610 核心规格(代表产品):
- 算力:200 TOPS(FP16)/ 400 TOPS(INT8)
- 芯片:昇腾610
- CPU:Cortex-A55×8
- 内存:LPDDR4X,带宽 136 GB/s
- 制程:7nm
- 功耗:TDP约 40W
- 认证:ISO 26262 ASIL-B,整机ASIL-D可达
- 量产车型:极狐阿尔法S HI版、阿维塔11/12、问界M9
技术亮点:
- 鸿蒙HOS+AOS双系统:智能驾驶与智能座舱统一在华为生态内,OTA、AI服务无缝打通
- 华为ADS算法自研:硬件+软件+算法一体化,避开Tier1分工带来的集成风险
- CANN算子库:华为自研AI计算框架,对国内算法工程师有较好支持
- 华为MDC生态:提供完整的Hardware+OS+Middleware+Application栈,高度闭环
制约因素:
- 供应链仍受出口管制约束,高阶制程存在不确定性
- 生态相对封闭,第三方Tier1接入成本较高
四维深度对比
原始算力 vs 有效算力
注意:不同厂商的TOPS标注方式不一致,需要区分INT8、FP16、稀疏算力等。
| 芯片 | 标称算力 | 精度类型 | 实际BEV感知性能 |
|---|---|---|---|
| DRIVE Thor | 2000 TOPS | INT8 | Hopper架构Transformer加速极强 |
| 昇腾MDC 610 | 400 TOPS | INT8 | CANN优化下效果较好 |
| 地平线 J6P | 560 TOPS | INT8 | PU Nash对BEV专项加速 |
| 地平线 J6E | 128 TOPS | INT8 | 主流感知任务够用 |
关键结论:原始TOPS数字不等于实际性能,算子支持度+内存带宽+编译器优化才是决定实际吞吐的三大因素。
能效比(TOPS/W)
能效比在车载场景极为关键——功耗直接影响散热设计、电池续航、PCB成本。
| 芯片 | 算力 | 功耗 | 能效比 |
|---|---|---|---|
| DRIVE Thor | 2000 TOPS | ~60W | 33 TOPS/W |
| 地平线 J6E | 128 TOPS | ~10W | 12.8 TOPS/W |
| 地平线 J6P | 560 TOPS | ~25W | 22.4 TOPS/W |
| 昇腾MDC 610(整机) | 400 TOPS | ~40W | 10 TOPS/W |
地平线 J6系列在能效比上表现突出,这是其在成本敏感量产车型中大规模上量的核心原因。
软件生态成熟度
| 维度 | 英伟达 DRIVE Thor | 地平线 J6 | 华为昇腾MDC |
|---|---|---|---|
| 算法工具链 | CUDA / TensorRT | HOP / HRT | MindSpore / CANN |
| 模型量化工具 | TensorRT | HQuant | AMCT |
| 仿真工具 | DRIVE Sim(基于Omniverse) | ADAS DV工具 | MDC仿真环境 |
| OTA能力 | DriveOS原生支持 | 支持 | 鸿蒙OTA |
| 算法工程师迁移成本 | 低(CUDA通用) | 中等(需学HOP) | 较高(华为生态) |
| 开放第三方算法接入 | 完全开放 | 开放 | 部分开放 |
量产落地与成本
| 维度 | 英伟达 DRIVE Thor | 地平线 J6E | 华为昇腾MDC |
|---|---|---|---|
| 量产状态 | 2025年开始上量 | 2024年大规模量产 | 2023年批量交付 |
| 参考BOM成本 | 最贵 | 中等 | 较贵 |
| 国内车厂接受度 | 高 | 极高 | 中等 |
| 供应链稳定性 | 中等 | 高 | 中等 |
| 本土服务支持 | 一般 | 强 | 强 |
选型决策树
你的车型定位是?
├── 旗舰/豪华(BOM不敏感,追求极致体验)
│ └── → 英伟达 DRIVE Thor
│ (CUDA生态强,算力余量大,未来升级空间充足)
│
├── 主流/中高端(性价比优先,快速量产)
│ ├── 整车厂有算法自研团队 → 地平线 J6P
│ └── 依赖供应商算法集成 → 地平线 J6E / NXP S32G(网关层)
│
└── 华为系合作车型 / 鸿蒙生态优先
└── → 华为昇腾 MDC
(端到端闭环,ADS算法直接复用)
2026年市场格局展望
| 趋势 | 影响 |
|---|---|
| 端到端(E2E)算法普及 | 对Transformer硬件加速要求持续提升,英伟达Thor优势扩大 |
| BEV感知成标配 | 地平线BPU Nash的专项优化价值凸显 |
| 国产替代政策 | 地平线、华为获得更多国内整车厂优先考量 |
| VLM(大视觉语言模型)上车 | 算力天花板继续上移,512 TOPS+成新标准 |
| 域融合架构 | 单颗芯片承载智驾+座舱,Thor跨域计算优势明显 |
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐
所有评论(0)