为什么智能驾驶对芯片要求这么高?

理解算力需求,先理解算法:

算法阶段 代表算法 算力特点
感知(Perception) BEV感知、Transformer、YOLO 大矩阵乘法,需要强INT8/FP16算力
预测(Prediction) 轨迹预测Transformer 序列处理,Attention计算密集
规划(Planning) NN Planner / PDM-Closed 批量推理,实时性要求高
地图(Mapping) 在线向量化建图 内存带宽敏感
融合控制(PNC) 模型预测控制MPC CPU实时计算

以目前主流的**端到端自动驾驶架构(E2E + VLM)**为例,单帧处理需要:

  • 6~12路摄像头输入,分辨率1920×1080+
  • 每秒30帧以上的完整感知-规划闭环
  • 峰值算力需求:100~400 TOPS(INT8)
  • 内存带宽需求:100~400 GB/s

这正是芯片厂商们疯狂堆算力的根本原因。


三款芯片快速画像

英伟达 DRIVE Thor

英伟达DRIVE Thor是2022年发布、2025年开始规模量产的新一代车载计算平台,定位旗舰智能驾驶+智能座舱融合计算。

核心规格:
- 算力:2000 TOPS(INT8)
- GPU架构:Hopper架构(同数据中心H100同代)
- CPU:12× Arm Cortex-A78AE(ASIL-B)
- 内存:LPDDR5,带宽 1 TB/s
- 制程:4nm(台积电)
- 功耗:TDP约 60W
- 量产车型:极氪、比亚迪(部分高端车型)

技术亮点:

  • Transformer Engine(TE):支持FP8精度,Transformer类算法效率提升2×+
  • CUDA生态壁垒:全球80%+的自动驾驶算法工程师用CUDA开发,迁移成本极高
  • DriveOS + DriveIX:完整的BSP+中间件+算法SDK体系
  • ISO 26262 ASIL-B认证(安全岛独立),支持冗余架构升级至ASIL-D

典型应用: 高阶NOA/城市领航、端到端大模型推理


地平线 征程J6E / J6P

地平线是目前国内量产出货量最大的高阶自动驾驶芯片厂商,J6系列于2023年发布,2024年开始大规模上量。

J6E 核心规格:
- 算力:128 TOPS(INT8)
- BPU(Brain Processing Unit)架构:BPU Nash
- CPU:8× Arm Cortex-A55 + 2× Cortex-R5
- 内存:LPDDR5,带宽 102 GB/s
- 制程:16nm
- 功耗:TDP约 10W
- ASIL:ASIL-B(可组合至ASIL-D)
- 量产车型:理想L6/L9、极越、长安、奇瑞等

J6P 核心规格:
- 算力:560 TOPS(INT8)
- BPU:BPU Nash(升级版)
- 内存带宽:256 GB/s
- 制程:5nm
- 量产:2024年下半年开始

技术亮点:

  • BEV亲和架构:BPU Nash专门针对BEV(Bird's Eye View)感知算法的Transformer算子做了硬件加速,实测BEV感知效率领先同类竞品
  • 低功耗高效能:J6E 10W功耗实现128 TOPS,能效比(TOPS/W)行业领先
  • Horizon Open Platform(HOP):完整的算法开发工具链,支持量化、部署、仿真一体化
  • 量产经验丰富:地平线J系列已累计装车超300万颗,OTA迭代数据积累深厚

典型应用: 城市NOA入门/主流量产、ADAS L2/L2+、成本敏感高阶场景


华为 昇腾MDC系列

华为MDC(Mobile Data Center,移动数据中心)是针对自动驾驶量产的完整计算平台,基于昇腾系列芯片。

MDC 610 核心规格(代表产品):
- 算力:200 TOPS(FP16)/ 400 TOPS(INT8)
- 芯片:昇腾610
- CPU:Cortex-A55×8
- 内存:LPDDR4X,带宽 136 GB/s
- 制程:7nm
- 功耗:TDP约 40W
- 认证:ISO 26262 ASIL-B,整机ASIL-D可达
- 量产车型:极狐阿尔法S HI版、阿维塔11/12、问界M9

技术亮点:

  • 鸿蒙HOS+AOS双系统:智能驾驶与智能座舱统一在华为生态内,OTA、AI服务无缝打通
  • 华为ADS算法自研:硬件+软件+算法一体化,避开Tier1分工带来的集成风险
  • CANN算子库:华为自研AI计算框架,对国内算法工程师有较好支持
  • 华为MDC生态:提供完整的Hardware+OS+Middleware+Application栈,高度闭环

制约因素:

  • 供应链仍受出口管制约束,高阶制程存在不确定性
  • 生态相对封闭,第三方Tier1接入成本较高

四维深度对比

原始算力 vs 有效算力

注意:不同厂商的TOPS标注方式不一致,需要区分INT8、FP16、稀疏算力等。

芯片 标称算力 精度类型 实际BEV感知性能
DRIVE Thor 2000 TOPS INT8 Hopper架构Transformer加速极强
昇腾MDC 610 400 TOPS INT8 CANN优化下效果较好
地平线 J6P 560 TOPS INT8 PU Nash对BEV专项加速
地平线 J6E 128 TOPS INT8 主流感知任务够用

关键结论:原始TOPS数字不等于实际性能,算子支持度+内存带宽+编译器优化才是决定实际吞吐的三大因素。


能效比(TOPS/W)

能效比在车载场景极为关键——功耗直接影响散热设计、电池续航、PCB成本。

芯片 算力 功耗 能效比
DRIVE Thor 2000 TOPS ~60W 33 TOPS/W
地平线 J6E 128 TOPS ~10W 12.8 TOPS/W
地平线 J6P 560 TOPS ~25W 22.4 TOPS/W
昇腾MDC 610(整机) 400 TOPS ~40W 10 TOPS/W

地平线 J6系列在能效比上表现突出,这是其在成本敏感量产车型中大规模上量的核心原因。


软件生态成熟度

维度 英伟达 DRIVE Thor 地平线 J6 华为昇腾MDC
算法工具链 CUDA / TensorRT HOP / HRT MindSpore / CANN
模型量化工具 TensorRT HQuant AMCT
仿真工具 DRIVE Sim(基于Omniverse) ADAS DV工具 MDC仿真环境
OTA能力 DriveOS原生支持 支持 鸿蒙OTA
算法工程师迁移成本 低(CUDA通用) 中等(需学HOP) 较高(华为生态)
开放第三方算法接入 完全开放 开放 部分开放

量产落地与成本

维度 英伟达 DRIVE Thor 地平线 J6E 华为昇腾MDC
量产状态 2025年开始上量 2024年大规模量产 2023年批量交付
参考BOM成本 最贵 中等 较贵
国内车厂接受度 极高 中等
供应链稳定性 中等 中等
本土服务支持 一般

选型决策树

你的车型定位是?
├── 旗舰/豪华(BOM不敏感,追求极致体验)
│   └── → 英伟达 DRIVE Thor
│       (CUDA生态强,算力余量大,未来升级空间充足)
│
├── 主流/中高端(性价比优先,快速量产)
│   ├── 整车厂有算法自研团队 → 地平线 J6P
│   └── 依赖供应商算法集成 → 地平线 J6E / NXP S32G(网关层)
│
└── 华为系合作车型 / 鸿蒙生态优先
    └── → 华为昇腾 MDC
        (端到端闭环,ADS算法直接复用)

2026年市场格局展望

趋势 影响
端到端(E2E)算法普及 对Transformer硬件加速要求持续提升,英伟达Thor优势扩大
BEV感知成标配 地平线BPU Nash的专项优化价值凸显
国产替代政策 地平线、华为获得更多国内整车厂优先考量
VLM(大视觉语言模型)上车 算力天花板继续上移,512 TOPS+成新标准
域融合架构 单颗芯片承载智驾+座舱,Thor跨域计算优势明显

 

 

Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐