Data Science with KNIME Analytics Platform 培训
分析平台是基于数据的创新领先的开源选项,帮助您探索数据中隐藏的潜力,寻找新的洞察力,或预测新的未来。 拥有超过1000个模块、数百个准备好运行的例子、综合工具的广泛范围以及最广泛的先进算法选项,分析平台是任何数据科学家和商业分析师的完美工具箱。
这个课程为 KNIME 分析平台是一个理想的机会,初学者,先进的用户和 KNIME 专家被介绍到 KNIME,学习如何更有效地使用它,以及如何创建基于 KNIME 工作流的清晰,全面的报告。
由教练领导的现场培训(在线或在线)旨在针对想要使用的数据专业人士,以解决复杂的业务需求。
它针对那些不知道编程的观众,并打算使用先进的工具来实施分析场景。
在本研讨会结束后,参与者将能够:
- 安置和配置 KNIME。
- 创建 Data Science 场景
- 列车、测试和验证模型
- 实施终止数据科学模型的最终价值链
课程格式
- 互动讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中进行手动实施。
课程定制选项
- 要申请本课程的定制培训或了解更多关于本课程的信息,请联系我们安排。
课程大纲
第一天:
模块 1:KNIME 分析平台:概述
- 安装
- 启动和自定义 KNIME Analytics Platform
- 节点、数据和工作流
- 数据科学周期
模块 2:数据 Access
- 从文件中读取数据
- AccessREST 服务
模块 3: ETL 和数据操作
- 行和列过滤
- 聚合器
- 连接和串联
- 转型:转换、替换、标准化和新功能生成
- 时间序列分析的数据准备
第2天:
模块 4: 导出数据
- 写入文件
- 生成报告
模块 5:Data Visualization
- 交互式单变量视觉探索
- 交互式多变量视觉探索
- 高级可视化功能
模块 6:Predictive Analytics 使用 KNIME
- Data Mining 基本概念
- 回归
- 决策树系列
- 模型评估
第三天:
模块 7: 控制流量
- 工作流参数化:流变量
- 重新执行工作流部件:循环
- 清理工作流
模块 8:动手实践 KNIME 基于分析平台的案例研究
要求
推荐
- 对理解数据的基本理解。
- 具有基础数据处理经验。
观众
- 数据分析师
- 数据科学家
- 业务分析师
需要帮助选择合适的课程吗?
Data Science with KNIME Analytics Platform 培训 - Enquiry
Data Science with KNIME Analytics Platform - 问询
问询
客户评论 (4)
Understanding big data beter
Shaune Dennis - Vodacom
课程 - Big Data Business Intelligence for Telecom and Communication Service Providers
Subject presentation knowledge timing
Aly Saleh - FAB banak Egypt
课程 - Introduction to Data Science and AI (using Python)
Very useful in because it helps me understand what we can do with the data in our context. It will also help me
Nicolas NEMORIN - Adecco Groupe France
课程 - KNIME Analytics Platform for BI
The example and training material were sufficient and made it easy to understand what you are doing.
Teboho Makenete
课程 - Data Science for Big Data Analytics
即将举行的公开课程
相关课程
Introduction to Data Science and AI using Python
35 小时这是为期5天的Data Science和AI入门。
本课程随附使用Python示例和练习
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 小时这种由讲师指导的 中国 现场培训(在线或现场)面向希望自动化和管理机器学习工作流程的中级参与者,包括使用 Apache Airflow 进行模型训练、验证和部署。
在本次培训结束时,参与者将能够:
- 设置 Apache Airflow 用于机器学习工作流编排。
- 自动执行数据预处理、模型训练和验证任务。
- 将 Airflow 与机器学习框架和工具整合。
- 使用自动化管道部署机器学习模型。
- 监控和优化生产中的机器学习工作流程。
Anaconda Ecosystem for Data Scientists
14 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望使用 Anaconda 生态系统在单一平台中捕获、管理和部署软体包和数据分析工作流 的数据科学家。
在本次培训结束时,参与者将能够:
- 安装和配置 Anaconda 个元件和库。
- 了解 Anaconda 的核心概念、功能和优势。
- 使用 Anaconda Navigator 管理包、环境和频道。
- 将 Conda、R 和 Python 包用于数据科学和机器学习。
- 了解管理多个数据环境的一些实际使用案例和技术。
AWS Cloud9 for Data Science
28 小时这种以讲师指导的现场培训<本地>(在线或现场)面向希望使用 AWS Cloud9 简化数据科学工作流程的中级数据科学家和分析师。
在本次培训结束时,参与者将能够:
- 在 AWS Cloud9 中设置数据科学环境。
- 在 Cloud9 中使用 Python、R 和 Jupyter Notebook 执行数据分析。
- 将 AWS Cloud9 与 S3、RDS 和 Redshift 等 AWS 数据服务整合。
- 利用 AWS Cloud9 进行机器学习模型的开发和部署。
- 优化基于云的工作流程以进行数据分析和处理。
为电信服务供应商的智能大数据信息业务
35 小时概述
服务提供商(CSP)面临压力,以降低成本,最大限度地提高用户平均收入(ARPU),同时确保优秀的客户体验,但数据量仍在增长。 到2016年,全球移动数据流量将以78%的合并年增长率(CAGR)增长,每月达到10.8 exabytes。
与此同时,CSP正在产生大量的数据,包括呼叫细节记录(CDR),网络数据和客户数据。 充分利用这些数据的公司获得了竞争优势。 根据The Economist Intelligence Unit最近的一项调查,使用数据导向决策的公司享有5至6%的生产力增长。 然而,53%的公司只利用其有价值的数据的一半,其中四分之一的受访者指出,大量有用的数据正在失去。 数据量如此高,以至于手动分析是不可能的,而大多数遗产软件系统无法保持,导致有价值的数据被忽略或忽略。
使用高速可扩展的大数据软件,CSP 可以在更短的时间内挖掘所有数据,以便在更短的时间内做出更好的决策。 不同 Big Data 产品和技术提供一个终端软件平台,以收集,准备,分析和展示来自大数据的洞察力。 应用领域包括网络性能监测、欺诈检测、客户端检测和信用风险分析。 Big Data 分析产品规模处理数据的特拉比特,但这些工具的实施需要新的类型的基于云的数据库系统,如(3)或大规模平行计算处理器(KPU等)。
该课程工作在 Big Data BI for Telco 覆盖了所有新兴的领域,在这些领域,CSP 正在投资,以提高生产力,并打开新的业务收入流。 该课程将提供一个完整的360学位的视图 Big Data BI在Telco,以便决策者和管理人员可以有一个非常广泛和全面的概述的可能性 Big Data BI在Telco的生产力和收入收益。
课程目标
该课程的主要目标是引入4个领域的新(0)商业智能技术(9)(Marketing/销售、网络运营、金融运营和客户关系(4))。 学生将被介绍为如下:
- 引入 Big Data - 什么是 4Vs (容量,速度,多样性和可靠性) 在 Big Data - 从 Telco 视角的发行,提取和管理
- 如何分析与遗产数据分析不同
- 内部正当化 Big Data -Telco 视角
- 引入 Hadoop 生态系统 - 熟悉所有 Hadoop 工具,如 Hive, 猪, SPARC –什么时候和如何使用它们来解决 Big Data 问题
- 如何 Big Data 被提取到分析分析工具 - 如何 Business Analysis’s 可以通过集成 Hadoop 板块方法来减少数据收集和分析的疼痛点
- 基础介绍 Insight 分析、视觉分析和预测分析为 Telco
- 客户评估分析和如何评估分析可以在Telco案例研究中减少客户评估和客户不满
- 网络故障和服务故障分析来自网络 meta 数据和 IPDR
- 财务分析 - 欺诈、欺诈和从销售和运营数据中获得的ROI估计
- 客户收购问题 - 目标营销,客户分区和从销售数据中交叉销售
- 介绍和概述所有 Big Data 分析产品以及它们适合在 Telco 分析空间的位置
- 结论 - 如何采取一步一步的方法来引入 Big Data Business Intelligence 在您的组织
目标观众
- 网络运营,财务经理,CRM经理和Telco CIO办公室的顶级IT经理。
- Business 分析师在 Telco
- CFO办公室经理/分析师
- 运营经理
- QA管理员
Introduction to Google Colab for Data Science
14 小时这种以讲师为主导的中国现场培训(现场或远程)面向希望使用[0 * ogle Colab学习数据科学基础知识的初级数据科学家和IT专业人员。
在培训结束时,参与者将能够:
- 设置和导航 Google Colab.
- 编写并执行基本 Python 代码。
- 导入和处理数据集。
- 使用 Python 个库创建可视化效果。
A Practical Introduction to Data Science
35 小时完成此培训的参与者将获得对 Data Science 及其相关技术、方法和工具的实际、真实理解。
参与者将有机会通过动手练习将这些知识付诸实践。小组互动和教师反馈构成了课程的重要组成部分。
本课程首先介绍了 Data Science 的基本概念,然后进入了 Data Science 中使用的工具和方法。
观众
- 开发人员
- 技术分析师
- IT 顾问
课程形式
- 部分讲座、部分讨论、练习和大量动手实践
注意
- 要申请本课程的定制培训,请联系我们进行安排。
Data Science for Big Data Analytics
35 小时大数据是如此庞大和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新和信息隐私。
Data Science essential for Marketing/Sales professionals
21 小时本课程面向有意在Marketing /销售中深入应用数据科学的Marketing销售专业人员。课程提供
详细介绍了用于“升级”,“交叉销售”,市场细分,品牌推广和CLV的不同数据科学技术。
Marketing和销售的差异 - 销售和营销如何不同?
简而言之,销售可以被称为集中或针对个人或小团体的过程。另一方面, Marketing针对的是更大的群体或普通大众。 Marketing包括研究(确定客户需求),开发产品(生产创新产品)和推广产品(通过广告),并在消费者中创造产品意识。因此,营销意味着产生潜在客户或潜在客一旦产品进入市场,销售人员的任务就是说服顾客购买产品。销售意味着将潜在客户或潜在客户转化为购买和订单,而营销的目标是更长期,销售则涉及更短的目标。
Kaggle
14 小时这个由 讲师指导的 中国 现场培训(在线或现场)面向希望在 Data Science 中使用 Kaggle 学习和建立职业生涯的数据科学家和开发人员。
在本次培训结束时,参与者将能够:
- 了解数据科学和机器学习。
- 探索数据分析。
- 了解 Kaggle 及其工作原理。
KNIME Analytics Platform for BI
21 小时KNIME Analytics Platform是数据驱动创新的领先开源选项,可帮助您发现隐藏在数据中的潜力,挖掘新的见解或预测新的未来。 KNIME Analytics Platform拥有1000多个模块,数百个可立即运行的示例,全面的集成工具以及最广泛的高级算法选择,是任何数据科学家和业务分析师的理想工具箱。
KNIME分析平台的这门课程是向KNIME介绍初学者,高级用户和KNIME专家的理想机会,学习如何更有效地使用它,以及如何基于KNIME工作流程创建清晰,全面的报告
Platforma analityczna KNIME - szkolenie kompleksowe
35 小时“分析平台 KNIME”培训课程全面概述了这个免费的数据分析平台。该计划包括数据处理和分析、安装和配置 KNIME、工作流构建、创建业务模型和数据建模的方法的介绍。该课程还讨论了高级数据分析工具、工作流导入和导出、工具集成、ETL 流程、数据挖掘、可视化、扩展以及与 R、Java、Python、Gephi、Neo4j 等工具的集成。结论包括报告、与 BIRT 和 KNIME WebPortal 的集成概述。
KNIME with Python and R for Machine Learning
14 小时这种以讲师为主导的中国现场培训(现场或远程)针对希望以Python和R为KNIME编程的数据科学家。
在培训结束时,参与者将能够:
- 在 KNIME 中规划、构建和部署机器学习模型。
- 为运营做出数据驱动的决策。
- 实施端到端数据科学项目。
Accelerating Python Pandas Workflows with Modin
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向希望使用 Modin 构建和实施并行计算的数据科学家和开发人员 Pandas 以加快数据分析速度。
在本次培训结束时,参与者将能够:
- 设置必要的环境,开始使用 Modin 大规模开发 Pandas 工作流。
- 了解 Modin 的功能、架构和优势。
- 了解 Modin、Dask 和 Ray 之间的区别。
- 使用 Modin 更快地执行 Pandas 操作。
- 实现整个 Pandas API 和函数。
GPU Data Science with NVIDIA RAPIDS
14 小时这种以讲师为主导的中国现场培训(现场或远程)针对希望使用RAPIDS构建GPU加速数据管道,工作流和可视化的数据科学家和开发人员,应用机器学习算法,如XGBoost,cuML等。
在培训结束时,参与者将能够:
- 设置必要的开发环境以使用 NVIDIA RAPIDS 构建数据模型。
- 了解 RAPIDS 的特性、组件和优势。
- 利用 GPU 加速端到端数据和分析管道。
- 使用 cuDF 和 Apache Arrow 实现 GPU 加速的数据准备和 ETL。
- 了解如何使用 XGBoost 和 cuML 算法执行机器学习任务。
- 使用 cuXfilter 和 cuGraph 构建数据可视化并执行图形分析。