感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
介绍
- 什么是GPU编程?
- 为什么使用CUDA与Python?
- 关键概念:线程、块、网格
CUDA功能和架构概述
- GPU与CPU架构
- 理解SIMT(单指令多线程)
- CUDA编程模型
设置开发环境
- 安装CUDA工具包和驱动程序
- 安装Python和Numba
- 设置和验证环境
并行编程基础
- 并行执行简介
- 理解线程和线程层次结构
- 处理线程束和同步
使用Numba编译器
- Numba简介
- 使用Numba编写CUDA内核
- 理解@cuda.jit装饰器
构建自定义CUDA内核
- 编写和启动基本内核
- 使用线程进行逐元素操作
- 管理网格和块维度
内存管理
- GPU内存类型(全局、共享、本地、常量)
- 主机和设备之间的内存传输
- 优化内存使用并避免瓶颈
GPU加速高级主题
- 共享内存和同步
- 使用流进行异步执行
- 多GPU编程基础
将基于CPU的应用程序转换为GPU
- 分析CPU代码
- 识别可并行化的部分
- 将逻辑移植到CUDA内核
故障排除
- 调试CUDA应用程序
- 常见错误及解决方法
- 测试和验证的工具与技术
总结与下一步
- 回顾关键概念
- GPU编程的最佳实践
- 持续学习的资源
要求
- 具备Python编程经验
- 熟悉NumPy(ndarrays、ufuncs等)
受众
- 开发者
14 小时
客户评论 (1)
互动性很强,提供了各种示例,培训从开始到结束的复杂性逐步提升。
Jenny - Andheo
课程 - GPU Programming with CUDA and Python
机器翻译