使用CANN TIK和TVM构建自定义AI算子培训

CANN TIK（张量指令内核）和Apache TVM能够对Huawei Ascend硬件的AI模型操作符进行高级优化和定制。

本次由讲师指导的培训（线上或线下）面向高级系统开发者，旨在帮助他们使用CANN的TIK编程模型和TVM编译器集成，构建、部署和调优AI模型的自定义操作符。

培训结束后，参与者将能够：

使用TIK DSL为Ascend处理器编写和测试自定义AI操作符。
将自定义操作符集成到CANN运行时和执行图中。
使用TVM进行操作符调度、自动调优和基准测试。
调试和优化自定义计算模式的指令级性能。

课程形式

互动讲座与演示。
使用TIK和TVM管道进行实际操作符编码。
在Ascend硬件或模拟器上进行测试和调优。

课程定制选项

如需为本课程定制培训，请联系我们安排。

感谢您发送咨询！我们的团队成员将很快与您联系。

感谢您发送预订！我们的团队成员将很快与您联系。

课程大纲

自定义算子开发简介

为什么要构建自定义算子？用例与限制
CANN 运行时结构与算子集成点
TBE、TIK 和 TVM 在华为 AI 生态系统中的概述

使用 TIK 进行低层算子开发 Programming

理解 TIK 编程模型及支持的 API
TIK 中的内存管理与分片策略
使用 CANN 创建、编译并注册自定义算子

测试与验证自定义算子

在图中进行算子的单元测试与集成测试
调试内核级性能问题
可视化算子执行与缓冲区行为

基于 TVM 的调度与优化

TVM 作为张量算子编译器的概述
在 TVM 中为自定义算子编写调度
TVM 的调优、基准测试及 Ascend 代码生成

与框架和模型的集成

为 MindSpore 和 ONNX 注册自定义算子
验证模型完整性与回退行为
支持混合精度的多算子图

案例研究与专项优化

案例研究：针对小输入形状的高效卷积
案例研究：内存感知的注意力算子优化
跨设备部署自定义算子的最佳实践

总结与下一步

要求

深入了解AI模型内部结构和算子级计算
具备Python和Linux开发环境的经验
熟悉神经网络编译器或图级优化器

受众

从事AI工具链的编译器工程师
专注于底层AI优化的系统开发者
构建自定义算子或针对新型AI工作负载的开发者

14 小时

需要帮助选择合适的课程吗？

即将举行的公开课程

相关课程

使用华为Ascend和CANN开发AI应用

21 小时

使用CANN和Ascend AI处理器部署AI模型

14 小时

CANN AI 框架开发者入门

7 小时

CANN 用于 Edge AI 部署

14 小时

理解华为AI计算堆叠：从CANN到MindSpore

14 小时

使用CANN SDK优化神经网络性能

14 小时

CANN SDK用于计算机视觉与自然语言处理管道

14 小时

课程分类

该网站在其他国家/地区

Europe

Österreich (Austria) Schweiz (Switzerland) Deutschland (Germany) Czech Republic Denmark Estonia Finland Greece Magyarország (Hungary) Ireland Luxembourg Latvia España (Spain) Italia (Italy) Lithuania Nederland (Netherlands) Norway Portugal România (Romania) Sverige (Sweden) Türkiye (Turkey) Malta Belgique (Belgium) France Polska (Poland) United Kingdom Bulgaria Moldova Slovakia Slovenia Croatia Serbia

North America

Canada USA Costa Rica Guatemala México (Mexico) Panama

South America

Brasil (Brazil) Argentina Chile Ecuador Colombia Peru Uruguay Venezuela Bolivia

Africa / Middle East

United Arab Emirates Qatar Egypt Saudi Arabia South Africa Morocco Tunisia Kuwait Oman Kenya Nigeria Botswana

Other sites

人力资源培训材料 NobleProg 特许经营 DaDesktop - 云桌面