课程大纲
介绍
- 在模式识别、分类和回归方面构建有效的算法。
设置开发环境
- Python 库
- 在线编辑器与离线编辑器
特征工程概述
- 输入和输出变量(特征)
- 特征工程的优缺点
原始数据中遇到的问题类型
- 不干净的数据、缺失的数据等。
预处理变量
- 处理缺失数据
处理数据中的缺失值
使用类别变量
将标签转换为数字
处理分类变量中的标签
转换变量以提高预测能力
- 数字、分类、日期等。
清理数据集
Machine Learning 建模
处理数据中的异常值
- 数值变量、分类变量等
总结和结论
要求
- Python 编程经验。
- 具有 Numpy、Pandas 和 scikit-learn 的经验。
- 熟悉机器学习算法。
观众
- 开发 人员
- 数据科学家
- 数据分析师
客户评论 (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
课程 - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.