这次课程使用LSTM+CRF(长短期记忆网络+条件随机场)进行序列标注
首先使用“BIOE”标注实体和非实体
实现CRF需要定义两个东西:发射概率和转移概率。发射概率就是模型认为一个词对应某个标签的概率,而转移概率则是从一个标签转移到另一个标签的概率。通过计算整个序列的得分,并比较所有可能的标签序列,CRF能够找出最可能的标签序列。
最后通过模型进行预编译和训练500个step,最后进行预测和后处理,能转换回正常可读的标签形式

Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐