使用官方1600张数据集正常训练,自己500个数据集却loss:nan
文章摘要 在使用MindSpore2.0.0和MindYolo030框架训练YOLOv5x模型时,当数据集从官方1600张图片更换为自建500张图片后,出现从第2个epoch开始loss值为NaN的问题。可能原因包括:数据集样本量过少、图片质量不佳或标注文件格式错误。建议解决方案是:1)检查数据集标注XML文件格式是否符合VOC标准;2)确认图片像素大小是否合适,必要时缩小图像尺寸;3)增加数据增
·
问题描述:
用的是MindSpore2.0.0、MindYolo030,mindyolov5x.yaml,per_batch_size为8,使用官方的1600张图片数据集训练,数据正常,换为自己的500张图片的数据集,训练时从第2张开始就是nan。
是500张图片数据太少,还是我需要检查数据集是否有问题?是数据集图片像素太低,还是voc格式的xml文件有问题呢

解决方法:
图像像素太大,可以缩小一下
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐



所有评论(0)