课程大纲

介绍

  • 基于文本数据的价值

基于文本数据科学问题的工作流程

选择正确的机器学习库

NLP技术概述

准备一个数据集

可视化数据

使用scikit-learn处理文本数据

构建机器学习模型

分成训练和测试集(Train and Test Sets)

应用线性回归和非线性回归

应用NLP技术

使用正则表达式解析文本数据

探索其他机器语言方法

解决文本编码问题

结束语

要求

  • 使用Python的经验
  • 了解机器学习
  • 使用scikit-learn和pandas的经验
  21 小时
 

人数


开始

完结


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

相关课程

课程分类