课程大纲

介绍

  • 统计学习(统计分析)与机器学习的区别
  • 金融和银行公司采用机器学习技术和人才

不同类型的 Machine Learning

  • 监督学习与无监督学习
  • 迭代和评估
  • 偏差-方差权衡
  • 结合监督学习和无监督学习(半监督学习)

Machine Learning 语言和工具集

  • 开源与专有系统和软件
  • Python 与 R 与 Matlab
  • 库和框架

Machine Learning 案例研究

  • 消费者数据和大数据
  • 评估消费者和商业贷款的风险
  • 通过情绪分析改善客户服务
  • 检测身份欺诈、账单欺诈和洗钱

动手实践:Python 机器学习

  • 准备开发环境
  • 获取 Python 个机器学习库和包
  • 使用 scikit-learn 和 PyBrain

如何加载 Machine Learning 数据

  • 数据库、数据仓库和流数据
  • 使用 Hadoop 和 Spark 进行分布式存储和处理
  • 导出的数据和 Excel

建模 Business 监督学习决策

  • 对数据进行分类(分类)
  • 使用回归分析预测结果
  • 从可用的机器学习算法中进行选择
  • 了解决策树算法
  • 了解随机森林算法
  • 模型评估
  • 锻炼

回归分析

  • 线性回归
  • 泛化和非线性
  • 锻炼

分类

  • 贝叶斯复习
  • 朴素贝叶斯
  • 逻辑回归
  • K-最近邻
  • 锻炼

动手实践:构建估算模型

  • 根据客户类型和历史评估贷款风险

评估 Machine Learning 算法的性能

  • 交叉验证和重采样
  • Bootstrap 聚集(装袋)
  • 锻炼

建模 Business 无监督学习决策

  • 当样本数据集不可用时
  • K-means 聚类
  • 无监督学习的挑战
  • 超越 K 均值
  • 贝叶斯网络和马尔可夫隐模型
  • 锻炼

实践:构建推荐系统

  • 分析过去的客户行为以改进新的服务产品

扩展公司的能力

  • 在云中开发模型
  • 使用 GPU 加速机器学习
  • 将深度学习神经网络应用于计算机视觉、语音识别和文本分析

闭幕致辞

要求

  • 具有 Python 编程经验
  • 基本熟悉统计学和线性代数
 21 小时

人数



每位参与者的报价

相关课程

课程分类