昇思25天学习打卡营第12天|文本解码原理

distance130

247人浏览 · 2024-07-05 14:01:11

distance130 · 2024-07-05 14:01:11 发布

这次是使用MindNLP库和GPT-2模型,进行文本生成，涵盖了多种文本解码策略
贪心搜索（Greedy search）

在每个时间步𝑡都简单地选择概率最高的词作为当前输出词:,缺点是会省略低概率词后面的高概率词
束搜索（Beam search）
通过在每个时间步保留最可能的 num_beams 个词，并从中最终选择出概率最高的序列来降低丢失潜在的高概率序列的风险。一定程度保留最优路径缺点无法解决重复问题；开放域生成效果差
最后是采样（Sampling）

能根据当前条件概率分布随机选择输出词𝑤_𝑡,文本生成多样性高,但是不连续
最后课程结合通过TopK和TopP采样的优点，提供更平衡的文本生成结果

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

更多推荐

cover

【无标题】

鲲鹏昇腾开发者社区

cover

昇腾CANN cann-samples 第二轮深挖：多仓库协同开发模板——从 Ascend C 到 torch-npu 的完整算子开发链路

鲲鹏昇腾开发者社区

Qwen3.5-35B-VeRL-FSDP 功能适配实践

在大模型强化学习训练场景中，Qwen3.5-35B相比同类模型展现出更快的训练速度和更高的收敛效率，能够在更少的训练步数和更短的单步时间内达到优异的测试集准确率。为充分发挥其性能优势，我们基于昇腾硬件平台实现了VeRL强化学习训练框架的适配，以支持更大规模的分布式训练和多模态任务。

鲲鹏昇腾开发者社区

所有评论(0)

查看更多评论

distance130

已为社区贡献13条内容