华为服务器NPU环境配置+踩坑点
摘要:本文介绍了在Linux系统上安装昇腾910B NPU驱动的完整流程。首先通过yum安装必要的依赖包,然后从昇腾社区下载驱动并设置权限。创建专用用户组后运行驱动安装脚本,遇到内核头文件缺失报错时,需通过yum install kernel-devel解决。最后安装固件并通过npu-smi info验证驱动是否成功安装。整个过程涵盖了依赖安装、驱动配置、错误排查等关键步骤,为昇腾NPU环境搭建提
1. 安装服务器依赖
sudo yum install -y gcc gcc-c++ make cmake unzip zlib-devel libffi-devel openssl-devel pciutils net-tools sqlite-devel lapack-devel gcc-gfortran python3-devel
yum install dkms
2. 下载驱动程序
进入昇腾社区下载稳定驱动

下载两个驱动包,并上传服务器。
上传完毕后,cd到下载驱动的路径,给两个驱动文件赋予root用户权限。
chmod 777 ./Ascend*
3. 创建用户
sudo groupadd HwHiAiUser
sudo useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash
sudo usermod -aG HwHiAiUser $USER
4. 安装驱动
#这里Ascend-hdk-910b-npu-driver_***.run可以替换为上面步骤2下载好驱动的绝对路径+文件名
sudo sh Ascend-hdk-910b-npu-driver_***.run --full --install-for-all
安装过程中提示:
[WARNING]rebuild ko has something wrong, detail in /var/log/ascend_seclog/ascend_rebuild.log
Do you want to try build driver after input kernel absolute path? [y/n]:
输入y之后,要求填入路径,输入如下:
/lib/modules/`uname -r`/build
但此时会报错如下:

原因:
没有安装内核头文件(kernel headers)
在大部分 Linux 发行版中,默认不会安装内核头文件,只装了运行内核。编译驱动或第三方模块时需要额外安装。
解决方法:
(1)确认当前内核版本:
uname -r
(2)根据发行版本安装内核头文件(CentOs系统):
sudo yum install kernel-devel-$(uname -r)
(3)安装完成后检查目录是否存在:
ls -l /lib/modules/$(uname -r)/build
如果能看到目录或符号链接,说明正常安装。
安装内核头文件后,再次运行上述代码:
/lib/modules/`uname -r`/build
重复上述过程,输入y之后再次输入路径
/lib/modules/`uname -r`/build
即可顺利完成安装(*有时候配置好内核头文件后输入y之后会自动检测,此时无需手动输入路径也会自动完成驱动安装)
5. 检测驱动是否安装成功
输入
npu-smi info
如果可以看到系统的多块npu运行情况,则证明驱动安装成功(同windows下gpu命令nvi-smi)
6. 安装firmware
#这里Ascend-hdk-910b-npu-firmware_***.run可以替换为上面步骤2下载好驱动的绝对路径+文件名
sudo sh Ascend-hdk-910b-npu-firmware_***.run --full --install-for-all
即完成NPU基础配置
参考资料:
昇腾NPU环境搭建-CSDN博客
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐

所有评论(0)