《昇思25天学习打卡营第20天|onereal》

本次实验使用的是nlpcc2017摘要数据，内容为新闻正文及其摘要，总计50000个样本。---------------------训练结果因为算力不足，暂未成功。数据处理，将向量数据变为中文数据。

陪你在童年

375人浏览 · 2024-07-13 23:30:03

陪你在童年 · 2024-07-13 23:30:03 发布

应用实践/LLM原理和实践/基于MindSpore的GPT2文本摘要

基于MindSpore的GPT2文本摘要¶

数据集加载与处理

数据集加载

本次实验使用的是nlpcc2017摘要数据，内容为新闻正文及其摘要，总计50000个样本。
数据预处理

原始数据格式：
```
article: [CLS] article_context [SEP]
summary: [CLS] summary_context [SEP]
```
预处理后的数据格式：

模型构建
构建GPT2ForSummarization模型，注意shift right的操作。
模型推理¶

数据处理，将向量数据变为中文数据
---------------------训练结果因为算力不足，暂未成功

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

更多推荐

鲲鹏+昇腾：开启 AI for Science 新范式——基于PINN的流体仿真加速实践

鲲鹏昇腾开发者社区

鲲鹏 DevKit 持续集成部署实践：从零搭建 CI/CD 流水线

随着项目规模不断扩大，构建一条简单、稳定、自动化的 CI/CD 流水线变得越来越重要。鲲鹏 DevKit 在这一方面提供了完整的工具链支持，从代码检查到构建、测试、部署都有覆盖，让我们能够在国产化环境中快速搭建可靠的持续交付体系。我将结合实际使用经验，介绍如何基于 DevKit 构建一条完整、高效的 CI/CD 流水线，并给出相关配置示例与最佳实践。本次实验是在华为云开发者空间上进行的，点击进入D