今天是参加昇思25天学习打卡营的第8天,今天打卡的课程是“保存与加载”,这里做一个简单的分享。

1.简介

今天学习的内容是如何将模型的训练结果进行保存?

今日的学习内容较为简单主要介绍了两种保存的方法:

1.在本地环境下讲模型保存成ckpt格式

2.云侧训练、端侧推理场景下,将模型保存为MindIR格式

2.保存与加载模型权重(ckpt)

保存模型使用save_checkpoint接口,要加载模型权重,需要先创建相同模型的实例,然后使用load_checkpointload_param_into_net方法加载参数。

model = network()
mindspore.save_checkpoint(model, "model.ckpt")

model = network()
param_dict = mindspore.load_checkpoint("model.ckpt")
param_not_load, _ = mindspore.load_param_into_net(model, param_dict)
print(param_not_load)

3.保存和加载MindIR

MindSpore提供了云侧(训练)和端侧(推理)统一的中间表示(Intermediate Representation,IR)。可使用export接口直接将模型保存为MindIR。MindIR同时保存了Checkpoint和模型结构,因此需要定义输入Tensor来获取输入shape。已有的MindIR模型可以方便地通过load接口加载,传入nn.GraphCell即可进行推理(仅支持图模式)。

model = network()
inputs = Tensor(np.ones([1, 1, 28, 28]).astype(np.float32))
mindspore.export(model, inputs, file_name="model", file_format="MINDIR")

mindspore.set_context(mode=mindspore.GRAPH_MODE)

graph = mindspore.load("model.mindir")
model = nn.GraphCell(graph)
outputs = model(inputs)
print(outputs.shape)

4.小结

本节学习的内容就是模型训练结果的保存与加载,整体内容较少。这里主要掌握两种保存的形式,一种是将模型训练后的权重参数保存为的ckpt格式,下次使用时可以创建一个相同的模型实例后直接加载即可进行推理等操作。二是同时保存模型和权重参数,这样可以实现在云端训练,在端侧进行推理,使用时不需要知道模型的结构定义。这里主要是用到了mindspore的的mindir格式。

以上是第8天的学习内容,附上今日打卡记录:
在这里插入图片描述

Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐