MindSpore数据集报错【The data pipeline is not a tree】

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档。

菜刀l四庭柱

332人浏览 · 2023-06-30 15:58:06

菜刀l四庭柱 · 2023-06-30 15:58:06 发布

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

MindSpore数据集报错【The data pipeline is not a tree】

数据集有两个消费节点发生冲突
错误日志：
在这里插入图片描述

ValueError: The data pipeline is not a tree (i.e. one node has 2 consumers)
错误描述：

dataset 定义上发生了分支，导致 dataset 无法确定分叉的走向。

参考解决方法：

检查数据集名称，通常一直保持同一个数据集名称即可。

参考实例链接：链接: The data pipeline is not a tree
---------------------------------------------------------以上未能解决我的问题T-T
我的代码:

def my_create_dataset(dataset_dir,usage,batch_size=32):
    data = ds.ImageFolderDataset(dataset_dir)
    data.shuffle(buffer_size=1000)
    # 定义算子
    trans = [
    vision.Decode(), 
    vision.Resize(256),
    vision.RandomHorizontalFlip(prob=0.5),
    # 使用训练backbone网络时用的mean和std
    vision.Normalize(mean=(100.03388269705046, 94.57511259248079, 72.14921665851293), 
                     std=(23.35913427414271, 20.336537235643164, 21.376613547858327)),
    vision.HWC2CHW()]

    #数据映射操作
    data=data.map(operations=trans,input_columns='image')

    # 批处理
    data = data.batch(32, drop_remainder=True)

    # 重复
    data = data.repeat(1)

    return data

在一行行对着能运行的代码终于找到了问题所在:
将data.shuffle(buffer_size=1000) 改为 data=data.shuffle(buffer_size=1000)
问题解决
在这里插入图片描述

细节，实在细，果然还是我菜。。

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

更多推荐

鲲鹏+昇腾：开启 AI for Science 新范式——基于PINN的流体仿真加速实践

鲲鹏昇腾开发者社区

鲲鹏 DevKit 持续集成部署实践：从零搭建 CI/CD 流水线

随着项目规模不断扩大，构建一条简单、稳定、自动化的 CI/CD 流水线变得越来越重要。鲲鹏 DevKit 在这一方面提供了完整的工具链支持，从代码检查到构建、测试、部署都有覆盖，让我们能够在国产化环境中快速搭建可靠的持续交付体系。我将结合实际使用经验，介绍如何基于 DevKit 构建一条完整、高效的 CI/CD 流水线，并给出相关配置示例与最佳实践。本次实验是在华为云开发者空间上进行的，点击进入D