状态
全部
未开始
进行中
已结束
日期
06.25
19:00:00
解密Compressor算子:从算子设计到极致性能优化
DeepSeek V4引入全新的Compressor算子,实现模型推理的关键性能突破,本课程深入解析Compressor算子的设计理念、核心算法与实现细节,探讨在低时延场景下的优化策略
2026-06-25 19:00:00
06.22
19:00:00
告别无从下手:拆解开源Cube算子,快速掌握开发要领
以开源仓样例代码为依托,详解Cube类算子开发的设计逻辑、代码架构及关键代码功能,帮助开发者扫清入门障碍,高效上手Cube算子开发
2026-06-22 19:00:00
06.15
19:00:00
AscendNPU IR中CV算子编译优化解析
介绍AscendNPU IR中CV算子功能使能与性能调优Pass的实现原理,帮助开发者掌握针对CV算子的定制化编译优化技术。
2026-06-15 19:00:00
06.11
19:00:00
Triton-TLE面向昇腾的扩展与优化
面向昇腾AI处理器,聚焦高性能算子开发:基于AscendNPUIR进行编译接入与联创,融合编译器优化手段,并依托FlagOS社区拓展FlagTree TLE原语,最大化挖掘昇腾硬件潜力与编译能力,编写高性能算子。
2026-06-11 19:00:00
06.08
19:00:00
06.04
19:00:00
ATVOSS:极简开发概述
ATVOSS (Ascend C Templates forVector Operator Subroutines ) 是基于Ascend C开发的Vector算子模板库,致力于为昇腾硬件的Vector类融合算子,提供极简、高效、高性能、可拓展的编程方案。本课程带你从玩转ATVOSS,从架构入门到API详解,手把手教你用极简API开发高性能Vector算子。
2026-06-04 19:00:00
06.01
19:00:00
05.28
19:00:00
optimized_transducer算子任务开发性能调优
聚焦社区任务中optimized_transducer算子,分享其核心开发思路与性能调优技巧,深入分享如何提升算子并行度、突破性能瓶颈,拆解高任务值算子的开发逻辑与实操要点,助力学习者快速掌握算子开发核心能力。
2026-05-28 19:00:00
05.25
19:00:00
【码力全开特辑】Triton Ascend代码架构及功能扩展
本课程基于样例详解Triton算子的编译流程,以及Triton Ascend如何通过编译优化在昇腾硬件上高效运行。
2026-05-25 19:00:00
05.21
19:00:00