课程大纲

中国AI GPU 生态系统概览

  • Huawei Ascend、Biren、Cambricon MLU的比较
  • CUDA vs CANN、Biren SDK 和 BANGPy 模型
  • 行业趋势与厂商生态系统

迁移准备

  • 评估您的CUDA代码库
  • 确定目标平台和SDK版本
  • 工具链安装与环境设置

代码转译技术

  • 移植CUDA内存访问与核心逻辑
  • 映射计算网格/线程模型
  • 自动化与手动转译选项

平台特定实现

  • 使用华为CANN运算符与自定义核心
  • Biren SDK转换流程
  • 使用BANGPy(Cambricon)重建模型

跨平台测试与优化

  • 在每个目标平台上进行性能分析
  • 内存调优与并行执行比较
  • 性能跟踪与迭代

管理混合GPU环境

  • 多架构混合部署
  • 备用策略与设备检测
  • 代码可维护性的抽象层

案例研究与最佳实践

  • 将视觉/NLP模型移植到Ascend或Cambricon
  • 在Biren集群上改造推理流程
  • 处理版本不匹配与API差距

总结与下一步

要求

  • 具备使用CUDA或基于GPU的应用程序编程经验
  • 理解GPU内存模型和计算内核
  • 熟悉AI模型部署或加速工作流

受众

  • GPU程序员
  • 系统架构师
  • 移植专家
 21 小时

即将举行的公开课程

课程分类