《昇思25天学习打卡营第20天|onereal》
本次实验使用的是nlpcc2017摘要数据,内容为新闻正文及其摘要,总计50000个样本。---------------------训练结果因为算力不足,暂未成功。数据处理,将向量数据变为中文数据。
·
应用实践/LLM原理和实践/基于MindSpore的GPT2文本摘要
基于MindSpore的GPT2文本摘要¶
数据集加载与处理
-
数据集加载
本次实验使用的是nlpcc2017摘要数据,内容为新闻正文及其摘要,总计50000个样本。
-
数据预处理
原始数据格式:
article: [CLS] article_context [SEP] summary: [CLS] summary_context [SEP]预处理后的数据格式:
模型构建
- 构建GPT2ForSummarization模型,注意shift right的操作。
模型推理¶
数据处理,将向量数据变为中文数据
-
---------------------训练结果因为算力不足,暂未成功
-

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐


所有评论(0)