Jupyter 数据科学团队 培训
Jupyter 是一个开源的、基于 Web 的交互式集成开发环境和计算环境。
本课程为讲师引导的培训(线上或线下),介绍了数据科学中的协作开发理念,并演示了如何使用 Jupyter 跟踪并作为团队参与“计算想法的生命周期”。课程将带领学员基于 Jupyter 生态系统创建一个示例数据科学项目。
在本课程结束时,学员将能够:
- 安装和配置 Jupyter,包括在 Git 上创建和集成团队仓库。
- 使用 Jupyter 的扩展、交互式小部件、多用户模式等功能,实现项目协作。
- 与团队成员创建、共享和组织 Jupyter Notebook。
- 通过 Jupyter 界面选择 Scala、Python、R 等语言,编写并执行针对 Apache Spark 等大数据系统的代码。
课程形式
- 互动式讲座和讨论。
- 大量练习和实践。
- 在实时实验环境中进行动手操作。
课程定制选项
- Jupyter Notebook 支持包括 R、Python、Scala、Julia 等在内的 40 多种语言。如需根据您选择的语言定制本课程,请联系我们安排。
课程大纲
Jupyter 简介
- Jupyter 及其生态系统概述
- 安装和设置
- 为团队协作配置 Jupyter
协作功能
- 使用 Git 进行版本控制
- 扩展和交互式小部件
- 多用户模式
创建和管理 Notebook
- Notebook 的结构和功能
- 共享和组织 Notebook
- 协作的最佳实践
使用 Jupyter 编程
- 选择和使用编程语言(Python、R、Scala)
- 编写和执行代码
- 与大数据系统(Apache Spark)集成
高级 Jupyter 功能
- 自定义 Jupyter 环境
- 使用 Jupyter 自动化工作流程
- 探索高级用例
实践环节
- 动手实验
- 真实世界的数据科学项目
- 小组练习和同行评审
总结与下一步
要求
- 具备 Python、R、Scala 等编程语言的经验。
- 具备数据科学背景。
目标受众
- 数据科学团队
需要帮助选择合适的课程吗?
Jupyter 数据科学团队 培训 - 询价
Jupyter 数据科学团队 - 问询
问询
客户评论 (1)
很高兴课程能够根据我在课前问卷中强调的关键领域进行定制。这确实有助于解决我在该主题上的疑问,并与我的学习目标保持一致。
Winnie Chan - Statistics Canada
课程 - Jupyter for Data Science Teams
机器翻译
即将举行的公开课程
相关课程
Anaconda 数据科学家生态系统
14 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望使用 Anaconda 生态系统在单一平台中捕获、管理和部署软体包和数据分析工作流 的数据科学家。
在本次培训结束时,参与者将能够:
- 安装和配置 Anaconda 个元件和库。
- 了解 Anaconda 的核心概念、功能和优势。
- 使用 Anaconda Navigator 管理包、环境和频道。
- 将 Conda、R 和 Python 包用于数据科学和机器学习。
- 了解管理多个数据环境的一些实际使用案例和技术。
数据科学实践入门
35 小时完成本培训的学员将获得对数据科学及其相关技术、方法和工具的实践性、现实世界的理解。
学员将有机会通过动手练习将所学知识付诸实践。小组互动和讲师反馈是课程的重要组成部分。
课程从数据科学的基本概念介绍开始,然后逐步深入数据科学中使用的工具和方法。
受众
- 开发者
- 技术分析师
- IT顾问
课程形式
- 部分讲座,部分讨论,练习和大量动手实践
注意
- 如需为此课程定制培训,请联系我们安排。
大数据分析中的数据科学
35 小时大数据是如此庞大和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新和信息隐私。
数据科学对市场营销/销售专业人员的基础课程
21 小时本课程面向市场营销和销售专业人士,旨在深入探讨数据科学在市场营销和销售中的应用。课程详细介绍了用于“向上销售”、“交叉销售”、市场细分、品牌建设和客户终身价值(CLV)的各种数据科学技术。
市场营销与销售的区别 - 销售和市场营销有何不同?
简单来说,销售可以被视为一个专注于个人或小群体的过程。而市场营销则针对更大的群体或公众。市场营销包括研究(识别客户需求)、产品开发(生产创新产品)和产品推广(通过广告)以及在消费者中建立产品意识。因此,市场营销意味着生成潜在客户或线索。一旦产品进入市场,销售人员的工作就是说服客户购买产品。销售意味着将潜在客户或线索转化为购买和订单,而市场营销则着眼于长期目标,销售则与短期目标相关。
数据科学导论
35 小时本次由讲师主导的培训(线上或线下)面向希望开启数据科学职业生涯的专业人士。
培训结束后,参与者将能够:
- 安装和配置Python和MySql。
- 理解数据科学是什么,以及它如何为几乎任何业务增加价值。
- 学习Python编程的基础知识
- 学习监督和非监督的机器学习技术,如何实现它们并解释结果。
课程形式
- 互动讲座和讨论。
- 大量练习和实践。
- 在实时实验环境中进行实践操作。
课程定制选项
- 如需为本课程定制培训,请联系我们安排。
Kaggle
14 小时这个由 讲师指导的 中国 现场培训(在线或现场)面向希望在 Data Science 中使用 Kaggle 学习和建立职业生涯的数据科学家和开发人员。
在本次培训结束时,参与者将能够:
- 了解数据科学和机器学习。
- 探索数据分析。
- 了解 Kaggle 及其工作原理。
MATLAB基础、数据科学和报告生成
35 小时在本培训的第一部分,我们将介绍 MATLAB 的基础知识及其作为语言和平台的功能。 本次讨论包括对 MATLAB 语法、数组和矩阵、数据可视化、脚本开发和面向对象原则的介绍。
在第二部分中,我们将演示如何使用 MATLAB 进行数据挖掘、机器学习和预测分析。为了向参与者提供一个清晰而实用的视角来了解 MATLAB 的方法和能力,我们将使用 MATLAB 与使用其他工具(如电子表格、C、C++ 和 Visual Basic)进行比较。
在培训的第三部分,参与者学习如何通过自动化数据处理和报告生成来简化他们的工作。
在整个课程中,参与者将通过实验室环境中的实践练习将学到的想法付诸实践。在培训结束时,参与者将全面掌握 MATLAB 的能力,并能够利用它来解决现实世界的数据科学问题,以及通过自动化来简化他们的工作。
将在整个课程中进行评估,以衡量进展情况。
课程形式
- 课程包括理论和实践练习,包括案例讨论、示例代码检查和动手实施。
注意
- 实践课程将基于预先安排的样本数据报告模板。如果您有具体要求,请联系我们安排。
Machine Learning for Data Science with Python
21 小时这项由讲师指导的中国(线上或线下)培训,针对中级数据分析师、开发人员或有志成为数据科学家的人士,旨在应用机器学习技术于Python中,以提取洞察、进行预测并自动化数据驱动的决策。
在本课程结束时,参与者将能够:
- 理解并区分关键的机器学习范式。
- 探索数据预处理技术和模型评估指标。
- 应用机器学习算法解决实际数据问题。
- 使用Python库和Jupyter笔记本进行实作开发。
- 构建用于预测、分类、推荐和聚类的模型。
使用Modin加速Python Pandas工作流
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向希望使用 Modin 构建和实施并行计算的数据科学家和开发人员 Pandas 以加快数据分析速度。
在本次培训结束时,参与者将能够:
- 设置必要的环境,开始使用 Modin 大规模开发 Pandas 工作流。
- 了解 Modin 的功能、架构和优势。
- 了解 Modin、Dask 和 Ray 之间的区别。
- 使用 Modin 更快地执行 Pandas 操作。
- 实现整个 Pandas API 和函数。
Python用于财务工作
35 小时Python 是一种在金融行业中广受欢迎的程式语言。它被大型投资银行和对冲基金采用,用于构建各种金融应用程式,从核心交易程式到风险管理系统。
在这场由讲师指导的现场培训中,学员将学习如何使用 Python 开发实际应用程式,以解决一系列特定的金融相关问题。
培训结束时,学员将能够:
- 理解 Python 程式语言的基本原理
- 下载、安装并维护用于在 Python 中创建金融应用程式的最佳开发工具
- 选择并利用最合适的 Python 套件和程式技术来组织、可视化和分析来自各种来源(CSV、Excel、数据库、网络等)的金融数据
- 构建解决资产配置、风险分析、投资绩效等问题的应用程式
- 对 Python 应用程式进行故障排除、集成、部署和优化
目标受众
- 开发人员
- 分析师
- 量化分析师
课程形式
- 部分讲授、部分讨论、练习和大量实践操作
注意事项
- 本培训旨在为金融专业人员面临的一些主要问题提供解决方案。如果您有特定的主题、工具或技术希望补充或进一步详细说明,请联系我们进行安排。
Qlik Sense 数据科学应用
14 小时本次由讲师主导的培训在 中国(线上或线下)面向希望使用 Qlik Sense 开发关联模型的数据分析师和 Web 开发人员。
培训结束后,学员将能够:
- 在数据科学中应用 Qlik Sense。
- 使用和导航 Qlik Sense 界面。
- 通过 AI 互动构建数据素养团队。
- 使用 Qlik Sense 创建数据驱动型企业。
GPU数据科学之NVIDIA RAPIDS
14 小时本次由讲师指导的线下或线上培训,面向希望使用RAPIDS构建GPU加速的数据管道、工作流和可视化的数据科学家和开发者,应用如XGBoost、cuML等机器学习算法。
培训结束后,参与者将能够:
- 设置必要的开发环境,使用NVIDIA RAPIDS构建数据模型。
- 了解RAPIDS的特性、组件和优势。
- 利用GPU加速端到端的数据和分析管道。
- 使用cuDF和Apache Arrow实现GPU加速的数据准备和ETL。
- 学习如何使用XGBoost和cuML算法执行机器学习任务。
- 使用cuXfilter和cuGraph构建数据可视化并执行图分析。
SMACK Stack 数据科学
14 小时本次讲师指导的培训在 中国(线上或线下)面向希望使用 SMACK 技术栈构建大数据解决方案的数据科学家。
培训结束后,参与者将能够:
- 实现用于处理大数据的数据管道架构。
- 使用 Apache Mesos 和 Docker 开发集群基础设施。
- 使用 Spark 和 Scala 分析数据。
- 使用 Apache Cassandra 管理非结构化数据。