Jupyter for Data Science Teams 培训
Jupyter 是一个开源的、基于 Web 的交互式 IDE 和计算环境。
这种由讲师指导的现场培训(在线或现场)介绍了数据科学中协作开发的理念,并演示了如何使用 Jupyter 作为团队跟踪和参与“计算思想的生命周期”。 它引导参与者完成基于 Jupyter 生态系统的示例数据科学项目的创建。
在培训结束时,参与者将能够:
- 安装和配置 Jupyter,包括在 Git 上创建和集成团队存储库。
- 使用 Jupyter 功能(如扩展、交互式小部件、多用户模式等)实现项目协作。
- 与团队成员一起创建、共享和组织 Jupyter Notebook。
- 从 Scala、Python、R 中进行选择,以针对 Apache Spark 等大数据系统编写和执行代码,所有这些都通过 Jupyter 接口完成。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- Jupyter Notebook 支持 40 多种语言,包括 R、Python、Scala、Julia 等。要根据您选择的语言定制本课程,请联系我们进行安排。
课程大纲
Jupyter 简介
- Jupyter 及其生态系统概述
- 安装和设置
- 配置 Jupyter 以实现团队协作
协作功能
- 使用 Git 进行版本控制
- 扩展和互动式小组件
- 多使用者模式
创建和管理笔记本
- 笔记本结构和功能
- 共用和组织笔记本
- 协作的最佳实践
Programming 与 Jupyter
- 选择与使用程式设计语言 (Python, R, Scala)
- 编写和执行代码
- 与大数据系统集成 (Apache Spark)
高级 Jupyter 功能
- 自定义 Jupyter 环境
- 使用 Jupyter 自动化工作流
- 探索高级使用案例
实践环节
- 动手实验
- 真实世界的数据科学专案
- 小组练习和同行评审
总结和后续步骤
要求
- Programming 在Python、R、Scala等语言方面的经验。
- 数据科学背景
观众
- 数据科学团队
需要帮助选择合适的课程吗?
Jupyter for Data Science Teams 培训 - Enquiry
Jupyter for Data Science Teams - 问询
问询
客户评论 (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
课程 - Jupyter for Data Science Teams
即将举行的公开课程
相关课程
Introduction to Data Science and AI using Python
35 小时这是为期5天的Data Science和AI入门。
本课程随附使用Python示例和练习
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 小时这种由讲师指导的 中国 现场培训(在线或现场)面向希望自动化和管理机器学习工作流程的中级参与者,包括使用 Apache Airflow 进行模型训练、验证和部署。
在本次培训结束时,参与者将能够:
- 设置 Apache Airflow 用于机器学习工作流编排。
- 自动执行数据预处理、模型训练和验证任务。
- 将 Airflow 与机器学习框架和工具整合。
- 使用自动化管道部署机器学习模型。
- 监控和优化生产中的机器学习工作流程。
Anaconda Ecosystem for Data Scientists
14 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望使用 Anaconda 生态系统在单一平台中捕获、管理和部署软体包和数据分析工作流 的数据科学家。
在本次培训结束时,参与者将能够:
- 安装和配置 Anaconda 个元件和库。
- 了解 Anaconda 的核心概念、功能和优势。
- 使用 Anaconda Navigator 管理包、环境和频道。
- 将 Conda、R 和 Python 包用于数据科学和机器学习。
- 了解管理多个数据环境的一些实际使用案例和技术。
AWS Cloud9 for Data Science
28 小时这种以讲师指导的现场培训<本地>(在线或现场)面向希望使用 AWS Cloud9 简化数据科学工作流程的中级数据科学家和分析师。
在本次培训结束时,参与者将能够:
- 在 AWS Cloud9 中设置数据科学环境。
- 在 Cloud9 中使用 Python、R 和 Jupyter Notebook 执行数据分析。
- 将 AWS Cloud9 与 S3、RDS 和 Redshift 等 AWS 数据服务整合。
- 利用 AWS Cloud9 进行机器学习模型的开发和部署。
- 优化基于云的工作流程以进行数据分析和处理。
为电信服务供应商的智能大数据信息业务
35 小时概述
服务提供商(CSP)面临压力,以降低成本,最大限度地提高用户平均收入(ARPU),同时确保优秀的客户体验,但数据量仍在增长。 到2016年,全球移动数据流量将以78%的合并年增长率(CAGR)增长,每月达到10.8 exabytes。
与此同时,CSP正在产生大量的数据,包括呼叫细节记录(CDR),网络数据和客户数据。 充分利用这些数据的公司获得了竞争优势。 根据The Economist Intelligence Unit最近的一项调查,使用数据导向决策的公司享有5至6%的生产力增长。 然而,53%的公司只利用其有价值的数据的一半,其中四分之一的受访者指出,大量有用的数据正在失去。 数据量如此高,以至于手动分析是不可能的,而大多数遗产软件系统无法保持,导致有价值的数据被忽略或忽略。
使用高速可扩展的大数据软件,CSP 可以在更短的时间内挖掘所有数据,以便在更短的时间内做出更好的决策。 不同 Big Data 产品和技术提供一个终端软件平台,以收集,准备,分析和展示来自大数据的洞察力。 应用领域包括网络性能监测、欺诈检测、客户端检测和信用风险分析。 Big Data 分析产品规模处理数据的特拉比特,但这些工具的实施需要新的类型的基于云的数据库系统,如(3)或大规模平行计算处理器(KPU等)。
该课程工作在 Big Data BI for Telco 覆盖了所有新兴的领域,在这些领域,CSP 正在投资,以提高生产力,并打开新的业务收入流。 该课程将提供一个完整的360学位的视图 Big Data BI在Telco,以便决策者和管理人员可以有一个非常广泛和全面的概述的可能性 Big Data BI在Telco的生产力和收入收益。
课程目标
该课程的主要目标是引入4个领域的新(0)商业智能技术(9)(Marketing/销售、网络运营、金融运营和客户关系(4))。 学生将被介绍为如下:
- 引入 Big Data - 什么是 4Vs (容量,速度,多样性和可靠性) 在 Big Data - 从 Telco 视角的发行,提取和管理
- 如何分析与遗产数据分析不同
- 内部正当化 Big Data -Telco 视角
- 引入 Hadoop 生态系统 - 熟悉所有 Hadoop 工具,如 Hive, 猪, SPARC –什么时候和如何使用它们来解决 Big Data 问题
- 如何 Big Data 被提取到分析分析工具 - 如何 Business Analysis’s 可以通过集成 Hadoop 板块方法来减少数据收集和分析的疼痛点
- 基础介绍 Insight 分析、视觉分析和预测分析为 Telco
- 客户评估分析和如何评估分析可以在Telco案例研究中减少客户评估和客户不满
- 网络故障和服务故障分析来自网络 meta 数据和 IPDR
- 财务分析 - 欺诈、欺诈和从销售和运营数据中获得的ROI估计
- 客户收购问题 - 目标营销,客户分区和从销售数据中交叉销售
- 介绍和概述所有 Big Data 分析产品以及它们适合在 Telco 分析空间的位置
- 结论 - 如何采取一步一步的方法来引入 Big Data Business Intelligence 在您的组织
目标观众
- 网络运营,财务经理,CRM经理和Telco CIO办公室的顶级IT经理。
- Business 分析师在 Telco
- CFO办公室经理/分析师
- 运营经理
- QA管理员
Introduction to Google Colab for Data Science
14 小时这种以讲师为主导的中国现场培训(现场或远程)面向希望使用[0 * ogle Colab学习数据科学基础知识的初级数据科学家和IT专业人员。
在培训结束时,参与者将能够:
- 设置和导航 Google Colab.
- 编写并执行基本 Python 代码。
- 导入和处理数据集。
- 使用 Python 个库创建可视化效果。
A Practical Introduction to Data Science
35 小时完成此培训的参与者将获得对 Data Science 及其相关技术、方法和工具的实际、真实理解。
参与者将有机会通过动手练习将这些知识付诸实践。小组互动和教师反馈构成了课程的重要组成部分。
本课程首先介绍了 Data Science 的基本概念,然后进入了 Data Science 中使用的工具和方法。
观众
- 开发人员
- 技术分析师
- IT 顾问
课程形式
- 部分讲座、部分讨论、练习和大量动手实践
注意
- 要申请本课程的定制培训,请联系我们进行安排。
Data Science for Big Data Analytics
35 小时大数据是如此庞大和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新和信息隐私。
Data Science essential for Marketing/Sales professionals
21 小时本课程面向有意在Marketing /销售中深入应用数据科学的Marketing销售专业人员。课程提供
详细介绍了用于“升级”,“交叉销售”,市场细分,品牌推广和CLV的不同数据科学技术。
Marketing和销售的差异 - 销售和营销如何不同?
简而言之,销售可以被称为集中或针对个人或小团体的过程。另一方面, Marketing针对的是更大的群体或普通大众。 Marketing包括研究(确定客户需求),开发产品(生产创新产品)和推广产品(通过广告),并在消费者中创造产品意识。因此,营销意味着产生潜在客户或潜在客一旦产品进入市场,销售人员的任务就是说服顾客购买产品。销售意味着将潜在客户或潜在客户转化为购买和订单,而营销的目标是更长期,销售则涉及更短的目标。
Introduction to Data Science
35 小时这种由讲师指导的实时培训(现场或远程)针对希望从事Data Science职业的专业人士。
在培训结束时,参与者将能够:
- 安装和配置Python和MySql。
- 了解什么是Data Science ,以及它如何为几乎任何业务增加价值。
- 了解Python编码的基础
- 学习有监督和无监督的Machine Learning技术,以及如何实现它们并解释结果。
课程形式
- 互动式讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- 要请求此课程的定制培训,请与我们联系以安排。
Kaggle
14 小时这个由 讲师指导的 中国 现场培训(在线或现场)面向希望在 Data Science 中使用 Kaggle 学习和建立职业生涯的数据科学家和开发人员。
在本次培训结束时,参与者将能够:
- 了解数据科学和机器学习。
- 探索数据分析。
- 了解 Kaggle 及其工作原理。
Data Science with KNIME Analytics Platform
21 小时分析平台是基于数据的创新领先的开源选项,帮助您探索数据中隐藏的潜力,寻找新的洞察力,或预测新的未来。 拥有超过1000个模块、数百个准备好运行的例子、综合工具的广泛范围以及最广泛的先进算法选项,分析平台是任何数据科学家和商业分析师的完美工具箱。
这个课程为 KNIME 分析平台是一个理想的机会,初学者,先进的用户和 KNIME 专家被介绍到 KNIME,学习如何更有效地使用它,以及如何创建基于 KNIME 工作流的清晰,全面的报告。
由教练领导的现场培训(在线或在线)旨在针对想要使用的数据专业人士,以解决复杂的业务需求。
它针对那些不知道编程的观众,并打算使用先进的工具来实施分析场景。
在本研讨会结束后,参与者将能够:
- 安置和配置 KNIME。
- 创建 Data Science 场景
- 列车、测试和验证模型
- 实施终止数据科学模型的最终价值链
课程格式
- 互动讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中进行手动实施。
课程定制选项
- 要申请本课程的定制培训或了解更多关于本课程的信息,请联系我们安排。
MATLAB基础、数据科学和报告生成
35 小时在本培训的第一部分,我们将介绍 MATLAB 的基础知识及其作为语言和平台的功能。 本次讨论包括对 MATLAB 语法、数组和矩阵、数据可视化、脚本开发和面向对象原则的介绍。
在第二部分中,我们将演示如何使用 MATLAB 进行数据挖掘、机器学习和预测分析。为了向参与者提供一个清晰而实用的视角来了解 MATLAB 的方法和能力,我们将使用 MATLAB 与使用其他工具(如电子表格、C、C++ 和 Visual Basic)进行比较。
在培训的第三部分,参与者学习如何通过自动化数据处理和报告生成来简化他们的工作。
在整个课程中,参与者将通过实验室环境中的实践练习将学到的想法付诸实践。在培训结束时,参与者将全面掌握 MATLAB 的能力,并能够利用它来解决现实世界的数据科学问题,以及通过自动化来简化他们的工作。
将在整个课程中进行评估,以衡量进展情况。
课程形式
- 课程包括理论和实践练习,包括案例讨论、示例代码检查和动手实施。
注意
- 实践课程将基于预先安排的样本数据报告模板。如果您有具体要求,请联系我们安排。
Accelerating Python Pandas Workflows with Modin
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向希望使用 Modin 构建和实施并行计算的数据科学家和开发人员 Pandas 以加快数据分析速度。
在本次培训结束时,参与者将能够:
- 设置必要的环境,开始使用 Modin 大规模开发 Pandas 工作流。
- 了解 Modin 的功能、架构和优势。
- 了解 Modin、Dask 和 Ray 之间的区别。
- 使用 Modin 更快地执行 Pandas 操作。
- 实现整个 Pandas API 和函数。
GPU Data Science with NVIDIA RAPIDS
14 小时这种以讲师为主导的中国现场培训(现场或远程)针对希望使用RAPIDS构建GPU加速数据管道,工作流和可视化的数据科学家和开发人员,应用机器学习算法,如XGBoost,cuML等。
在培训结束时,参与者将能够:
- 设置必要的开发环境以使用 NVIDIA RAPIDS 构建数据模型。
- 了解 RAPIDS 的特性、组件和优势。
- 利用 GPU 加速端到端数据和分析管道。
- 使用 cuDF 和 Apache Arrow 实现 GPU 加速的数据准备和 ETL。
- 了解如何使用 XGBoost 和 cuML 算法执行机器学习任务。
- 使用 cuXfilter 和 cuGraph 构建数据可视化并执行图形分析。