联系我们

课程大纲

AlphaFold简介及其对生物学研究的影响

  • 蛋白质结构预测的演变:从同源建模到深度学习的突破
  • AlphaFold在加速结构生物学、药物发现和功能注释中的作用
  • 设定期望:能力、局限性和实验整合点
  • 实践练习:探索AlphaFold蛋白质结构数据库(AFDB)界面并进行初始序列搜索

AlphaFold的工作原理:架构与核心组件

  • 神经网络架构:Evoformer、结构模块和基于注意力的序列建模
  • 多序列比对(MSA)生成和模板匹配(PDB、UniRef、BFD)
  • 置信度指标:pLDDT(每个残基的置信度)和PAE(预测对齐误差)解释
  • 实践练习:使用样本蛋白质序列映射AlphaFold的工作流程阶段,并追踪MSA/模板输入

访问AlphaFold:平台、笔记本与部署

  • 官方部署选项:AlphaFold DB、公共API、Colab笔记本和本地/GPU环境
  • 设置可重复的Colab环境:依赖安装、GPU分配和输入格式化
  • 准备蛋白质序列:FASTA结构、链处理和多域考虑
  • 实践实验室:部署官方AlphaFold Colab笔记本,上传自定义FASTA并启动首次预测运行

AlphaFold蛋白质结构数据库与公共资源

  • 导航AFDB:生物覆盖范围、结构质量、下载格式(PDB/mmCIF、未松弛/pLDDt文件)
  • 将AFDB与UniProt、PDB和功能数据库(GO、KEGG、CATH)进行交叉引用
  • 管理大规模数据集:批量预测限制、引用指南和数据许可
  • 实践练习:为目标路径提取高置信度的AFDB模型,并为下游分析准备文件

解读AlphaFold预测与置信度指标

  • 阅读pLDDT热图:识别结构化核心、无序区域和低置信度域
  • 解码PAE矩阵:检测域边界、链内/链间相互作用和潜在错误折叠区域
  • 预测的可靠性:序列覆盖范围、进化深度和已知结构同源物
  • 实践练习:评估多域蛋白的pLDDT/PAE输出,标记低置信度区域并规划突变/验证目标

AlphaFold开源代码与定制路径

  • 仓库结构:核心模块、数据管道和配置文件
  • 修改输入:自定义MSA、模板覆盖和置信度阈值调整
  • 性能优化:减少运行时间、内存管理和检查点保存
  • 实践实验室:在Colab中运行修改后的AlphaFold管道,使用自定义模板约束并导出精炼的PDB文件

AlphaFold在生物学研究与实验整合中的应用

  • 使用预测模型指导突变、结晶和冷冻电镜网格规划
  • 功能注释:活性位点映射、配体对接准备和界面预测
  • 局限性与验证:何时信任预测、何时进行实验验证以及常见陷阱
  • 研讨会:为预测结构设计实验验证工作流程,并将AI输出映射到湿实验室实验

总结、顶点应用与下一步

  • 巩固关键概念:架构、解读和实际部署
  • 顶点项目:学员选择一个感兴趣的蛋白质,运行/提取预测,解读置信度指标,并制定研究应用计划
  • 开放式问答,常见错误排查和资源分发
  • 下一步:高级AlphaFold3集成、RoseTTAFold、trRosetta和持续发展的社区工具

要求

  • 具备蛋白质结构的背景知识
  • 建议熟悉基本的分子生物学概念(氨基酸序列、折叠原理、PDB/mmCIF格式)
  • 能够熟练使用基于Web的笔记本并在浏览器中执行代码单元

受众

  • 生物学家、分子研究人员和结构生物学研究者
  • 希望通过计算结构预测指导湿实验室工作流程的实验科学家
  • 将AI驱动建模整合到假设生成和实验设计中的生命科学专业人士
 7 小时

即将举行的公开课程

课程分类