机器学习之网络构建

当我们定义神经网络时，可以继承nn.Cell类，在__init__方法中进行子Cell的实例化和状态管理，在construct方法中实现Tensor操作。我们可以通过输入数据直接调用模型，得到一个包含每个类别原始预测值的十维Tensor输出。这节主要使用MindSpore框架构建简单的神经网络模型。首先介绍了继承nn.Cell类定义模型类的方法,在__init__和construct方法中实现网络

StevenChen

657人浏览 · 2024-06-24 19:17:41

StevenChen · 2024-06-24 19:17:41 发布

网络构建

神经网络模型是由神经网络层和Tensor操作构成的，mindspore.nn提供了常见神经网络层的实现。在MindSpore中，使用Cell类构建所有网络，它是网络的基本单元。一个神经网络模型表示为一个Cell，由不同的子Cell构成。通过这样的嵌套结构，可以简单地使用面向对象编程的思维对神经网络结构进行构建和管理。

%%capture captured_output
# 实验环境已经预装了mindspore==2.2.14，如需更换mindspore版本，可更改下面mindspore的版本号
!pip uninstall mindspore -y
!pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindspore==2.2.14

import mindspore
from mindspore import nn, ops

定义模型类

当我们定义神经网络时，可以继承nn.Cell类，在__init__方法中进行子Cell的实例化和状态管理，在construct方法中实现Tensor操作。

我们可以通过输入数据直接调用模型，得到一个包含每个类别原始预测值的十维Tensor输出。

模型层

本节中我们分解上节构造的神经网络模型中的每一层。首先我们构造一个shape为(3, 28, 28)的随机数据（3个28x28的图像），依次通过每一个神经网络层来观察其效果。

input_image = ops.ones((3, 28, 28), mindspore.float32)
print(input_image.shape)

nn.Flatten

实例化nn.Flatten层，将28x28的2D张量转换为784大小的连续数组。

nn.Dense

nn.Dense为全连接层，其使用权重和偏差对输入进行线性变换。

nn.ReLU

nn.ReLU层给网络中加入非线性的激活函数，帮助神经网络学习各种复杂的特征。

nn.SequentialCell

nn.SequentialCell是一个有序的Cell容器。输入Tensor将按照定义的顺序通过所有Cell。我们可以使用SequentialCell来快速组合构造一个神经网络模型。

nn.Softmax

最后使用nn.Softmax将神经网络最后一个全连接层返回的logits的值缩放为[0, 1]，表示每个类别的预测概率。axis指定的维度数值和为1。

softmax = nn.Softmax(axis=1)
pred_probab = softmax(logits)

模型参数

网络内部神经网络层具有权重参数和偏置参数（如nn.Dense），这些参数会在训练过程中不断进行优化，可通过 model.parameters_and_names() 来获取参数名及对应的参数详情。

总结

这节主要使用MindSpore框架构建简单的神经网络模型。首先介绍了继承nn.Cell类定义模型类的方法,在__init__和construct方法中实现网络结构。然后详细介绍了使用nn.Flatten、nn.Dense、nn.ReLU等内置层组建网络,并演示了如何利用nn.SequentialCell快速组合模型。此外,文章还展示了如何使用nn.Softmax计算模型的预测概率输出,并讲解了如何查看和获取模型的参数信息。总的来说,这篇文章为读者提供了使用MindSpore构建神经网络模型的基本思路和方法。

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

更多推荐

Qwen3.5 四款小尺寸模型开源：昇腾适配已到位，AtomGit AI 开放体验

鲲鹏昇腾开发者社区

AReaL x 昇腾，加速大模型全异步RL训练创新

AReaL框架为需要在昇腾平台进行强化学习的开发者提供了新的可靠途径——开箱即用保障开发者轻松上手，优秀架构支撑模型性能。AReaL框架在昇腾平台上会持续演进，为开发者提供更强大、更便捷的强化学习体验，大家可以持续关注AReaL开源项目了解最新的技术动态。AReaL开源项目：https://github.com/inclusionAI/AReaL。

鲲鹏昇腾开发者社区

Ascend 硬件下书生大模型部署微调评测复现文档

未申请过书生API key的，在下面链接申请： https://internlm.intern-ai.org.cn/api/tokens?在opencompass/opencompass/configs文件夹下创建eval_tutorial_demo1.py。模型要求transformers>=4.55.2，但是5.2.0版本我是不能启动的，这里使用的是4.55.2版本。数据集的json 文件需