昇腾Atlas 300I Pro卡通过MINDIE部署qwen2.5-7b

横石拦浪

22人浏览 · 2026-06-16 19:52:26

横石拦浪 · 2026-06-16 19:52:26 发布

MINDIE镜像下载，选择对应镜像
https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f
可以选择Atlas 300I-Duo对应镜像

docker pull --platform=arm64 swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie:2.1.RC2-300I-Duo-py311-openeuler24.03-lts

启动docker容器

docker run -it -d --net=host --shm-size=500g 
--privileged 
--name mindie-qwen-7b 
--device=/dev/davinci_manager 
--device=/dev/hisi_hdc 
--device=/dev/devmm_svm 
-v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro 
-v /usr/local/sbin:/usr/local/sbin:ro 
-v /mnt/data/Qwen2.5-7B-Instruct:/data_1 #挂载模型路径
02efebd6ce64  #镜像ID

修改配置

docker exec -it mindie-qwen-7b bash
vim /usr/local/Ascend/mindie/latest/mindie-service/conf/config.json

需要修改

{
"ServerConfig" :
    {
"ipAddress" : "0.0.0.0",
"port" : 1025,
"managementPort" : 1026,
"metricsPort" : 1027,
"allowAllZeroIpListening" : true,
"httpsEnabled" : false,
}，
"BackendConfig": {
    "npuDeviceIds": [[0, 1]],  // 指定使用的NPU设备ID，根据实际卡数填写
    "ModelDeployConfig": {
      "truncation": false,
      "ModelConfig": [
        {
          "modelName": "qwen-vl-7b",           // 模型名称，调用时使用
          "modelWeightPath": "/容器内模型挂载路径", // 容器内模型权重挂载路径
          "worldSize": 2                       // 使用的NPU卡数，与npuDeviceIds对应
        }
      ]
    }
}

修改完配置启动模型服务

cd /usr/local/Ascend/mindie/latest/mindie-service/bin
./mindieservice_daemon        # 前台启动，方便查看日志
# 或
nohup ./mindieservice_daemon > output.log 2>&1 &  # 后台启动，日志写入文件

测试调用

curl http://192.168.5.100:1025/generate -d '{"inputs":"What is deep learning?","max_new_tokens":32,"stream":false,"do_sample":true,"temperature":0.7,"top_p":0.9,"top_k":20,"model":"Qwen2.5-7B-Instruct"}'

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

更多推荐

【公开测试招募】九章排错法：没有查不出来的bug，不靠经验，只靠规则

【摘要】"九章排错法"公开测试招募开启，提供标准化代码排错解决方案。该方法宣称不依赖经验，通过统一规则覆盖所有编程语言（C/C++/Python等）、代码类型（内核/框架/应用）和问题类型（架构/内存/数值等），10倍于人工的排错效率，3分钟完成千行代码分析。已成功验证于龙芯内核、昇腾算子等复杂场景，可生成带修复建议的标准化报告，区分代码缺陷与外部问题。测试免费开放，支持脱敏代码提交，承诺无死角定