感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
Biren GPU 架构简介
- Biren 概述及应用场景
- 硬件布局:核心、内存、计算集群
- 与 NVIDIA 和 AMD GPU 的对比
搭建 Biren Programming 环境
- 安装 Biren SDK 和运行时
- 理解工具链和编译器模型
- 基本项目结构与构建过程
使用 Biren 堆栈进行 GPU Programming
- 线程和块模型
- 内存管理与数据传输
- 内核开发与启动模式
从 CUDA 迁移到 Biren
- CUDA 代码的转换技术
- 常见 API 映射与适配
- 代码转换实验与实践
调试与性能分析
- 使用 Biren 的调试器和性能分析器
- 识别性能瓶颈
- 内存访问模式与优化
优化技术
- 线程调度与指令流水线
- 循环展开与共享内存使用
- 高级内核调优以提高吞吐量
案例研究与应用示例
- 使用 Biren 加速器训练模型
- 迁移与性能分析视觉或 NLP 模型
- 与 CUDA/NVIDIA 的性能对比
总结与下一步
要求
- 了解GPU架构与并行处理
- 具备CUDA、OpenCL或类似GPU编程环境的经验
- 熟悉深度学习框架,如PyTorch或TensorFlow
受众
- HPC开发者
- AI基础设施工程师
- 性能优化专家
21 小时
客户评论 (1)
逐步进行的培训,包含大量练习。整个过程就像一场工作坊,对此我感到非常满意。
Ireneusz - Inter Cars S.A.
课程 - Intelligent Applications Fundamentals
机器翻译