Jupyter 数据科学团队 培训
Jupyter 是一个开源的、基于 Web 的交互式集成开发环境和计算环境。
本课程为讲师引导的培训(线上或线下),介绍了数据科学中的协作开发理念,并演示了如何使用 Jupyter 跟踪并作为团队参与“计算想法的生命周期”。课程将带领学员基于 Jupyter 生态系统创建一个示例数据科学项目。
在本课程结束时,学员将能够:
- 安装和配置 Jupyter,包括在 Git 上创建和集成团队仓库。
- 使用 Jupyter 的扩展、交互式小部件、多用户模式等功能,实现项目协作。
- 与团队成员创建、共享和组织 Jupyter Notebook。
- 通过 Jupyter 界面选择 Scala、Python、R 等语言,编写并执行针对 Apache Spark 等大数据系统的代码。
课程形式
- 互动式讲座和讨论。
- 大量练习和实践。
- 在实时实验环境中进行动手操作。
课程定制选项
- Jupyter Notebook 支持包括 R、Python、Scala、Julia 等在内的 40 多种语言。如需根据您选择的语言定制本课程,请联系我们安排。
课程大纲
Jupyter 简介
- Jupyter 及其生态系统概述
- 安装和设置
- 为团队协作配置 Jupyter
协作功能
- 使用 Git 进行版本控制
- 扩展和交互式小部件
- 多用户模式
创建和管理 Notebook
- Notebook 的结构和功能
- 共享和组织 Notebook
- 协作的最佳实践
使用 Jupyter 编程
- 选择和使用编程语言(Python、R、Scala)
- 编写和执行代码
- 与大数据系统(Apache Spark)集成
高级 Jupyter 功能
- 自定义 Jupyter 环境
- 使用 Jupyter 自动化工作流程
- 探索高级用例
实践环节
- 动手实验
- 真实世界的数据科学项目
- 小组练习和同行评审
总结与下一步
要求
- 具备 Python、R、Scala 等编程语言的经验。
- 具备数据科学背景。
目标受众
- 数据科学团队
需要帮助选择合适的课程吗?
Jupyter 数据科学团队 培训 - 询价
Jupyter 数据科学团队 - 问询
客户评论 (1)
很高兴课程能够根据我在课前问卷中强调的关键领域进行定制。这确实有助于解决我在该主题上的疑问,并与我的学习目标保持一致。
Winnie Chan - Statistics Canada
课程 - Jupyter for Data Science Teams
机器翻译
即将举行的公开课程
相关课程
Apache Airflow 用于 Data Science:自动化 Machine Learning 管道
21 小时本次由讲师指导的培训(线上或线下)面向中级参与者,旨在帮助他们使用Apache Airflow自动化和管理机器学习工作流,包括模型训练、验证和部署。
培训结束后,参与者将能够:
- 设置Apache Airflow以进行机器学习工作流编排。
- 自动化数据预处理、模型训练和验证任务。
- 将Airflow与机器学习框架和工具集成。
- 使用自动化管道部署机器学习模型。
- 监控和优化生产中的机器学习工作流。
Anaconda 数据科学家生态系统
14 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望使用 Anaconda 生态系统在单一平台中捕获、管理和部署软体包和数据分析工作流 的数据科学家。
在本次培训结束时,参与者将能够:
- 安装和配置 Anaconda 个元件和库。
- 了解 Anaconda 的核心概念、功能和优势。
- 使用 Anaconda Navigator 管理包、环境和频道。
- 将 Conda、R 和 Python 包用于数据科学和机器学习。
- 了解管理多个数据环境的一些实际使用案例和技术。
AWS Cloud9 数据科学应用
28 小时本课程为讲师指导的培训,在 中国(线上或线下)进行,面向希望使用 AWS Cloud9 简化数据科学工作流程的中级数据科学家和分析师。
培训结束后,参与者将能够:
- 在 AWS Cloud9 中设置数据科学环境。
- 在 Cloud9 中使用 Python、R 和 Jupyter Notebook 进行数据分析。
- 将 AWS Cloud9 与 AWS 数据服务(如 S3、RDS 和 Redshift)集成。
- 使用 AWS Cloud9 进行机器学习模型的开发和部署。
- 优化基于云的数据分析和处理工作流程。
Google Colab 数据科学入门
14 小时本次由讲师主导的培训在中国(线上或线下)进行,面向初学者级别的数据科学家和 IT 专业人士,旨在帮助他们学习使用 Google Colab 进行数据科学的基础知识。
在培训结束后,参与者将能够:
- 设置和导航 Google Colab。
- 编写和执行基本的 Python 代码。
- 导入和处理数据集。
- 使用 Python 库创建可视化。
数据科学实践入门
35 小时完成本培训的学员将获得对数据科学及其相关技术、方法和工具的实践性、现实世界的理解。
学员将有机会通过动手练习将所学知识付诸实践。小组互动和讲师反馈是课程的重要组成部分。
课程从数据科学的基本概念介绍开始,然后逐步深入数据科学中使用的工具和方法。
受众
- 开发者
- 技术分析师
- IT顾问
课程形式
- 部分讲座,部分讨论,练习和大量动手实践
注意
- 如需为此课程定制培训,请联系我们安排。
大数据分析中的数据科学
35 小时大数据是如此庞大和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新和信息隐私。
数据科学对市场营销/销售专业人员的基础课程
21 小时本课程面向市场营销和销售专业人士,旨在深入探讨数据科学在市场营销和销售中的应用。课程详细介绍了用于“向上销售”、“交叉销售”、市场细分、品牌建设和客户终身价值(CLV)的各种数据科学技术。
市场营销与销售的区别 - 销售和市场营销有何不同?
简单来说,销售可以被视为一个专注于个人或小群体的过程。而市场营销则针对更大的群体或公众。市场营销包括研究(识别客户需求)、产品开发(生产创新产品)和产品推广(通过广告)以及在消费者中建立产品意识。因此,市场营销意味着生成潜在客户或线索。一旦产品进入市场,销售人员的工作就是说服客户购买产品。销售意味着将潜在客户或线索转化为购买和订单,而市场营销则着眼于长期目标,销售则与短期目标相关。
数据科学导论
35 小时本次由讲师主导的培训(线上或线下)面向希望开启数据科学职业生涯的专业人士。
培训结束后,参与者将能够:
- 安装和配置Python和MySql。
- 理解数据科学是什么,以及它如何为几乎任何业务增加价值。
- 学习Python编程的基础知识
- 学习监督和非监督的机器学习技术,如何实现它们并解释结果。
课程形式
- 互动讲座和讨论。
- 大量练习和实践。
- 在实时实验环境中进行实践操作。
课程定制选项
- 如需为本课程定制培训,请联系我们安排。
Kaggle
14 小时这个由 讲师指导的 中国 现场培训(在线或现场)面向希望在 Data Science 中使用 Kaggle 学习和建立职业生涯的数据科学家和开发人员。
在本次培训结束时,参与者将能够:
- 了解数据科学和机器学习。
- 探索数据分析。
- 了解 Kaggle 及其工作原理。
使用KNIME分析平台进行数据科学
21 小时KNIME分析平台是数据驱动创新的领先开源选择,帮助您发现数据中隐藏的潜力,挖掘新的见解,或预测未来。拥有超过1000个模块、数百个即用示例、全面的集成工具集以及最广泛的高级算法选择,KNIME分析平台是任何数据科学家和业务分析师的完美工具箱。
本课程为KNIME分析平台提供了理想的机会,适合初学者、高级用户和KNIME专家,介绍KNIME,学习如何更有效地使用它,并基于KNIME工作流创建清晰、全面的报告。
本次由讲师主导的培训(线上或线下)面向希望使用KNIME解决复杂业务需求的数据专业人士。
目标受众是不懂编程,但希望使用前沿工具实现分析场景的人员。
培训结束后,学员将能够:
- 安装和配置KNIME。
- 构建数据科学场景。
- 训练、测试和验证模型。
- 实现数据科学模型的端到端价值链。
课程形式
- 互动讲座和讨论。
- 大量练习和实践。
- 在实时实验室环境中进行实操。
课程定制选项
- 如需为本课程定制培训或了解更多信息,请联系我们安排。
MATLAB基础、数据科学和报告生成
35 小时在本培训的第一部分,我们将介绍 MATLAB 的基础知识及其作为语言和平台的功能。 本次讨论包括对 MATLAB 语法、数组和矩阵、数据可视化、脚本开发和面向对象原则的介绍。
在第二部分中,我们将演示如何使用 MATLAB 进行数据挖掘、机器学习和预测分析。为了向参与者提供一个清晰而实用的视角来了解 MATLAB 的方法和能力,我们将使用 MATLAB 与使用其他工具(如电子表格、C、C++ 和 Visual Basic)进行比较。
在培训的第三部分,参与者学习如何通过自动化数据处理和报告生成来简化他们的工作。
在整个课程中,参与者将通过实验室环境中的实践练习将学到的想法付诸实践。在培训结束时,参与者将全面掌握 MATLAB 的能力,并能够利用它来解决现实世界的数据科学问题,以及通过自动化来简化他们的工作。
将在整个课程中进行评估,以衡量进展情况。
课程形式
- 课程包括理论和实践练习,包括案例讨论、示例代码检查和动手实施。
注意
- 实践课程将基于预先安排的样本数据报告模板。如果您有具体要求,请联系我们安排。
Machine Learning for Data Science with Python
21 小时这项由讲师指导的中国(线上或线下)培训,针对中级数据分析师、开发人员或有志成为数据科学家的人士,旨在应用机器学习技术于Python中,以提取洞察、进行预测并自动化数据驱动的决策。
在本课程结束时,参与者将能够:
- 理解并区分关键的机器学习范式。
- 探索数据预处理技术和模型评估指标。
- 应用机器学习算法解决实际数据问题。
- 使用Python库和Jupyter笔记本进行实作开发。
- 构建用于预测、分类、推荐和聚类的模型。
使用Modin加速Python Pandas工作流
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向希望使用 Modin 构建和实施并行计算的数据科学家和开发人员 Pandas 以加快数据分析速度。
在本次培训结束时,参与者将能够:
- 设置必要的环境,开始使用 Modin 大规模开发 Pandas 工作流。
- 了解 Modin 的功能、架构和优势。
- 了解 Modin、Dask 和 Ray 之间的区别。
- 使用 Modin 更快地执行 Pandas 操作。
- 实现整个 Pandas API 和函数。
GPU数据科学之NVIDIA RAPIDS
14 小时本次由讲师指导的线下或线上培训,面向希望使用RAPIDS构建GPU加速的数据管道、工作流和可视化的数据科学家和开发者,应用如XGBoost、cuML等机器学习算法。
培训结束后,参与者将能够:
- 设置必要的开发环境,使用NVIDIA RAPIDS构建数据模型。
- 了解RAPIDS的特性、组件和优势。
- 利用GPU加速端到端的数据和分析管道。
- 使用cuDF和Apache Arrow实现GPU加速的数据准备和ETL。
- 学习如何使用XGBoost和cuML算法执行机器学习任务。
- 使用cuXfilter和cuGraph构建数据可视化并执行图分析。