课程大纲

介绍

  • 什么是GPU编程?
  • 为什么使用CUDA与Python?
  • 关键概念:线程、块、网格

CUDA功能和架构概述

  • GPU与CPU架构
  • 理解SIMT(单指令多线程)
  • CUDA编程模型

设置开发环境

  • 安装CUDA工具包和驱动程序
  • 安装Python和Numba
  • 设置和验证环境

并行编程基础

  • 并行执行简介
  • 理解线程和线程层次结构
  • 处理线程束和同步

使用Numba编译器

  • Numba简介
  • 使用Numba编写CUDA内核
  • 理解@cuda.jit装饰器

构建自定义CUDA内核

  • 编写和启动基本内核
  • 使用线程进行逐元素操作
  • 管理网格和块维度

内存管理

  • GPU内存类型(全局、共享、本地、常量)
  • 主机和设备之间的内存传输
  • 优化内存使用并避免瓶颈

GPU加速高级主题

  • 共享内存和同步
  • 使用流进行异步执行
  • 多GPU编程基础

将基于CPU的应用程序转换为GPU

  • 分析CPU代码
  • 识别可并行化的部分
  • 将逻辑移植到CUDA内核

故障排除

  • 调试CUDA应用程序
  • 常见错误及解决方法
  • 测试和验证的工具与技术

总结与下一步

  • 回顾关键概念
  • GPU编程的最佳实践
  • 持续学习的资源

要求

  • 具备Python编程经验
  • 熟悉NumPy(ndarrays、ufuncs等)

受众

  • 开发者
 14 小时

客户评论 (1)

即将举行的公开课程

课程分类