Jupyter for Data Science Teams 培训
Jupyter 是一个开源的、基于 Web 的交互式 IDE 和计算环境。
这种由讲师指导的现场培训(在线或现场)介绍了数据科学中协作开发的理念,并演示了如何使用 Jupyter 作为团队跟踪和参与“计算思想的生命周期”。 它引导参与者完成基于 Jupyter 生态系统的示例数据科学项目的创建。
在培训结束时,参与者将能够:
- 安装和配置 Jupyter,包括在 Git 上创建和集成团队存储库。
- 使用 Jupyter 功能(如扩展、交互式小部件、多用户模式等)实现项目协作。
- 与团队成员一起创建、共享和组织 Jupyter Notebook。
- 从 Scala、Python、R 中进行选择,以针对 Apache Spark 等大数据系统编写和执行代码,所有这些都通过 Jupyter 接口完成。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- Jupyter Notebook 支持 40 多种语言,包括 R、Python、Scala、Julia 等。要根据您选择的语言定制本课程,请联系我们进行安排。
课程大纲
Jupyter 简介
- Jupyter 及其生态系统概述
- 安装和设置
- 配置 Jupyter 以实现团队协作
协作功能
- 使用 Git 进行版本控制
- 扩展和互动式小组件
- 多使用者模式
创建和管理笔记本
- 笔记本结构和功能
- 共用和组织笔记本
- 协作的最佳实践
Programming 与 Jupyter
- 选择与使用程式设计语言 (Python, R, Scala)
- 编写和执行代码
- 与大数据系统集成 (Apache Spark)
高级 Jupyter 功能
- 自定义 Jupyter 环境
- 使用 Jupyter 自动化工作流
- 探索高级使用案例
实践环节
- 动手实验
- 真实世界的数据科学专案
- 小组练习和同行评审
总结和后续步骤
要求
- Programming 在Python、R、Scala等语言方面的经验。
- 数据科学背景
观众
- 数据科学团队
需要帮助选择合适的课程吗?
Jupyter for Data Science Teams 培训 - Enquiry
Jupyter for Data Science Teams - 问询
问询
客户评论 (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
课程 - Jupyter for Data Science Teams
即将举行的公开课程
相关课程
Introduction to Data Science and AI using Python
35 小时这是为期5天的Data Science和AI入门。
本课程随附使用Python示例和练习
Anaconda Ecosystem for Data Scientists
14 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望使用 Anaconda 生态系统在单一平台中捕获、管理和部署软体包和数据分析工作流 的数据科学家。
在本次培训结束时,参与者将能够:
- 安装和配置 Anaconda 个元件和库。
- 了解 Anaconda 的核心概念、功能和优势。
- 使用 Anaconda Navigator 管理包、环境和频道。
- 将 Conda、R 和 Python 包用于数据科学和机器学习。
- 了解管理多个数据环境的一些实际使用案例和技术。
为电信服务供应商的智能大数据信息业务
35 小时概述
服务提供商(CSP)面临压力,以降低成本,最大限度地提高用户平均收入(ARPU),同时确保优秀的客户体验,但数据量仍在增长。 到2016年,全球移动数据流量将以78%的合并年增长率(CAGR)增长,每月达到10.8 exabytes。
与此同时,CSP正在产生大量的数据,包括呼叫细节记录(CDR),网络数据和客户数据。 充分利用这些数据的公司获得了竞争优势。 根据The Economist Intelligence Unit最近的一项调查,使用数据导向决策的公司享有5至6%的生产力增长。 然而,53%的公司只利用其有价值的数据的一半,其中四分之一的受访者指出,大量有用的数据正在失去。 数据量如此高,以至于手动分析是不可能的,而大多数遗产软件系统无法保持,导致有价值的数据被忽略或忽略。
使用高速可扩展的大数据软件,CSP 可以在更短的时间内挖掘所有数据,以便在更短的时间内做出更好的决策。 不同 Big Data 产品和技术提供一个终端软件平台,以收集,准备,分析和展示来自大数据的洞察力。 应用领域包括网络性能监测、欺诈检测、客户端检测和信用风险分析。 Big Data 分析产品规模处理数据的特拉比特,但这些工具的实施需要新的类型的基于云的数据库系统,如(3)或大规模平行计算处理器(KPU等)。
该课程工作在 Big Data BI for Telco 覆盖了所有新兴的领域,在这些领域,CSP 正在投资,以提高生产力,并打开新的业务收入流。 该课程将提供一个完整的360学位的视图 Big Data BI在Telco,以便决策者和管理人员可以有一个非常广泛和全面的概述的可能性 Big Data BI在Telco的生产力和收入收益。
课程目标
该课程的主要目标是引入4个领域的新(0)商业智能技术(9)(Marketing/销售、网络运营、金融运营和客户关系(4))。 学生将被介绍为如下:
- 引入 Big Data - 什么是 4Vs (容量,速度,多样性和可靠性) 在 Big Data - 从 Telco 视角的发行,提取和管理
- 如何分析与遗产数据分析不同
- 内部正当化 Big Data -Telco 视角
- 引入 Hadoop 生态系统 - 熟悉所有 Hadoop 工具,如 Hive, 猪, SPARC –什么时候和如何使用它们来解决 Big Data 问题
- 如何 Big Data 被提取到分析分析工具 - 如何 Business Analysis’s 可以通过集成 Hadoop 板块方法来减少数据收集和分析的疼痛点
- 基础介绍 Insight 分析、视觉分析和预测分析为 Telco
- 客户评估分析和如何评估分析可以在Telco案例研究中减少客户评估和客户不满
- 网络故障和服务故障分析来自网络 meta 数据和 IPDR
- 财务分析 - 欺诈、欺诈和从销售和运营数据中获得的ROI估计
- 客户收购问题 - 目标营销,客户分区和从销售数据中交叉销售
- 介绍和概述所有 Big Data 分析产品以及它们适合在 Telco 分析空间的位置
- 结论 - 如何采取一步一步的方法来引入 Big Data Business Intelligence 在您的组织
目标观众
- 网络运营,财务经理,CRM经理和Telco CIO办公室的顶级IT经理。
- Business 分析师在 Telco
- CFO办公室经理/分析师
- 运营经理
- QA管理员
A Practical Introduction to Data Science
35 小时完成此培训的参与者将获得对 Data Science 及其相关技术、方法和工具的实际、真实理解。
参与者将有机会通过动手练习将这些知识付诸实践。小组互动和教师反馈构成了课程的重要组成部分。
本课程首先介绍了 Data Science 的基本概念,然后进入了 Data Science 中使用的工具和方法。
观众
- 开发人员
- 技术分析师
- IT 顾问
课程形式
- 部分讲座、部分讨论、练习和大量动手实践
注意
- 要申请本课程的定制培训,请联系我们进行安排。
Data Science for Big Data Analytics
35 小时大数据是如此庞大和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新和信息隐私。
Data Science essential for Marketing/Sales professionals
21 小时本课程面向有意在Marketing /销售中深入应用数据科学的Marketing销售专业人员。课程提供
详细介绍了用于“升级”,“交叉销售”,市场细分,品牌推广和CLV的不同数据科学技术。
Marketing和销售的差异 - 销售和营销如何不同?
简而言之,销售可以被称为集中或针对个人或小团体的过程。另一方面, Marketing针对的是更大的群体或普通大众。 Marketing包括研究(确定客户需求),开发产品(生产创新产品)和推广产品(通过广告),并在消费者中创造产品意识。因此,营销意味着产生潜在客户或潜在客一旦产品进入市场,销售人员的任务就是说服顾客购买产品。销售意味着将潜在客户或潜在客户转化为购买和订单,而营销的目标是更长期,销售则涉及更短的目标。
Introduction to Data Science
35 小时这种由讲师指导的实时培训(现场或远程)针对希望从事Data Science职业的专业人士。
在培训结束时,参与者将能够:
- 安装和配置Python和MySql。
- 了解什么是Data Science ,以及它如何为几乎任何业务增加价值。
- 了解Python编码的基础
- 学习有监督和无监督的Machine Learning技术,以及如何实现它们并解释结果。
课程形式
- 互动式讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- 要请求此课程的定制培训,请与我们联系以安排。
Kaggle
14 小时这个由 讲师指导的 中国 现场培训(在线或现场)面向希望在 Data Science 中使用 Kaggle 学习和建立职业生涯的数据科学家和开发人员。
在本次培训结束时,参与者将能够:
- 了解数据科学和机器学习。
- 探索数据分析。
- 了解 Kaggle 及其工作原理。
MATLAB基础、数据科学和报告生成
35 小时在本培训的第一部分,我们将介绍 MATLAB 的基础知识及其作为语言和平台的功能。 本次讨论包括对 MATLAB 语法、数组和矩阵、数据可视化、脚本开发和面向对象原则的介绍。
在第二部分中,我们将演示如何使用 MATLAB 进行数据挖掘、机器学习和预测分析。为了向参与者提供一个清晰而实用的视角来了解 MATLAB 的方法和能力,我们将使用 MATLAB 与使用其他工具(如电子表格、C、C++ 和 Visual Basic)进行比较。
在培训的第三部分,参与者学习如何通过自动化数据处理和报告生成来简化他们的工作。
在整个课程中,参与者将通过实验室环境中的实践练习将学到的想法付诸实践。在培训结束时,参与者将全面掌握 MATLAB 的能力,并能够利用它来解决现实世界的数据科学问题,以及通过自动化来简化他们的工作。
将在整个课程中进行评估,以衡量进展情况。
课程形式
- 课程包括理论和实践练习,包括案例讨论、示例代码检查和动手实施。
注意
- 实践课程将基于预先安排的样本数据报告模板。如果您有具体要求,请联系我们安排。
Machine Learning for Data Science with Python
21 小时这项由讲师指导的中国(线上或线下)培训,针对中级数据分析师、开发人员或有志成为数据科学家的人士,旨在应用机器学习技术于Python中,以提取洞察、进行预测并自动化数据驱动的决策。
在本课程结束时,参与者将能够:
- 理解并区分关键的机器学习范式。
- 探索数据预处理技术和模型评估指标。
- 应用机器学习算法解决实际数据问题。
- 使用Python库和Jupyter笔记本进行实作开发。
- 构建用于预测、分类、推荐和聚类的模型。
Accelerating Python Pandas Workflows with Modin
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向希望使用 Modin 构建和实施并行计算的数据科学家和开发人员 Pandas 以加快数据分析速度。
在本次培训结束时,参与者将能够:
- 设置必要的环境,开始使用 Modin 大规模开发 Pandas 工作流。
- 了解 Modin 的功能、架构和优势。
- 了解 Modin、Dask 和 Ray 之间的区别。
- 使用 Modin 更快地执行 Pandas 操作。
- 实现整个 Pandas API 和函数。
Python用于财务工作
35 小时Python 是一种在金融行业中广受欢迎的程式语言。它被大型投资银行和对冲基金采用,用于构建各种金融应用程式,从核心交易程式到风险管理系统。
在这场由讲师指导的现场培训中,学员将学习如何使用 Python 开发实际应用程式,以解决一系列特定的金融相关问题。
培训结束时,学员将能够:
- 理解 Python 程式语言的基本原理
- 下载、安装并维护用于在 Python 中创建金融应用程式的最佳开发工具
- 选择并利用最合适的 Python 套件和程式技术来组织、可视化和分析来自各种来源(CSV、Excel、数据库、网络等)的金融数据
- 构建解决资产配置、风险分析、投资绩效等问题的应用程式
- 对 Python 应用程式进行故障排除、集成、部署和优化
目标受众
- 开发人员
- 分析师
- 量化分析师
课程形式
- 部分讲授、部分讨论、练习和大量实践操作
注意事项
- 本培训旨在为金融专业人员面临的一些主要问题提供解决方案。如果您有特定的主题、工具或技术希望补充或进一步详细说明,请联系我们进行安排。
Python in Data Science
35 小时培训课程将帮助参与者准备 Web 应用开发使用 Python Programming 与数据分析。 这种数据视觉是一个很好的工具,在决策中为Top Management。
Qlik Sense for Data Science
14 小时这种以讲师为主导的中国现场培训(现场或远端)面向希望在Qlik Sense中开发关联模型的数据分析师和Web开发人员。
在培训结束时,参与者将能够:
- 在数据科学中应用 Qlik Sense。
- 使用和导航 Qlik Sense 介面。
- 利用 AI 交互构建具有数据素养的员工队伍。
- 使用Qlik Sense 创建资料驱动型企业。
GPU Data Science with NVIDIA RAPIDS
14 小时这种以讲师为主导的中国现场培训(现场或远程)针对希望使用RAPIDS构建GPU加速数据管道,工作流和可视化的数据科学家和开发人员,应用机器学习算法,如XGBoost,cuML等。
在培训结束时,参与者将能够:
- 设置必要的开发环境以使用 NVIDIA RAPIDS 构建数据模型。
- 了解 RAPIDS 的特性、组件和优势。
- 利用 GPU 加速端到端数据和分析管道。
- 使用 cuDF 和 Apache Arrow 实现 GPU 加速的数据准备和 ETL。
- 了解如何使用 XGBoost 和 cuML 算法执行机器学习任务。
- 使用 cuXfilter 和 cuGraph 构建数据可视化并执行图形分析。