课程大纲

Biren GPU 架构简介

  • Biren 概述及应用场景
  • 硬件布局:核心、内存、计算集群
  • 与 NVIDIA 和 AMD GPU 的对比

搭建 Biren Programming 环境

  • 安装 Biren SDK 和运行时
  • 理解工具链和编译器模型
  • 基本项目结构与构建过程

使用 Biren 堆栈进行 GPU Programming

  • 线程和块模型
  • 内存管理与数据传输
  • 内核开发与启动模式

从 CUDA 迁移到 Biren

  • CUDA 代码的转换技术
  • 常见 API 映射与适配
  • 代码转换实验与实践

调试与性能分析

  • 使用 Biren 的调试器和性能分析器
  • 识别性能瓶颈
  • 内存访问模式与优化

优化技术

  • 线程调度与指令流水线
  • 循环展开与共享内存使用
  • 高级内核调优以提高吞吐量

案例研究与应用示例

  • 使用 Biren 加速器训练模型
  • 迁移与性能分析视觉或 NLP 模型
  • 与 CUDA/NVIDIA 的性能对比

总结与下一步

要求

  • 了解GPU架构与并行处理
  • 具备CUDA、OpenCL或类似GPU编程环境的经验
  • 熟悉深度学习框架,如PyTorch或TensorFlow

受众

  • HPC开发者
  • AI基础设施工程师
  • 性能优化专家
 21 小时

客户评论 (1)

即将举行的公开课程

课程分类