Dataprep Fundamentals 培训
Dataprep 是一种智能数据服务,可促进结构化和非结构化数据的可视化探索、清理和组织,为机器学习应用程序中的分析、报告和利用做好准备。
这种以讲师为主导的现场培训(现场或远程)面向初级到中级IT专业人员,他们希望获得有效准备分析数据所需的知识和实践技能,确保不同数据集的准确性,一致性和可靠性。
在培训结束时,参与者将能够:
- 全面了解数据准备在确保高质量、可靠的数据用于分析和建模方面的重要性。
- 熟练掌握使用真实世界数据集的数据收集、清理、转换和集成技术。
- 培养有效识别和解决与数据相关的挑战、差异和不一致的能力。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- 如需申请本课程的定制培训,请联系我们进行安排。
课程大纲
介绍
- 了解数据准备在分析和机器学习中的重要性
- 数据准备管道及其在数据生命周期中的作用
- 探索原始数据中的常见挑战及其对分析的影响
数据收集和获取
- 数据源:数据库、API、电子表格、文本文件等
- 收集数据和确保收集过程中数据质量的技术
- 从各种来源收集数据
Data Cleaning 技术
- 识别和处理缺失值、异常值和不一致
- 处理数据集中的重复项和错误
- 清理真实世界的数据集
数据转换和标准化
- 数据规范化和标准化技术
- 分类数据处理:编码、分箱和特征工程
- 将原始数据转换为可用格式
Data Integration 和聚合
- 合并和组合来自不同来源的数据集
- 解决数据冲突并调整数据类型
- 数据聚合和整合技术
Data Quality 保险
- 在整个过程中确保数据质量和完整性的方法
- 实施质量检查和验证程序
- 数据质量保证的案例研究和实际应用
降维和特征选择
- 了解降维的必要性
- PCA、特征选择和约简策略等技术
- 实施降维技术
摘要和后续步骤
要求
-
基本了解数据概念
观众
-
数据分析师
Database 管理员
IT 专业人员
需要帮助选择合适的课程吗?
Dataprep Fundamentals 培训 - Enquiry
Dataprep Fundamentals - 问询
问询
客户评论 (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
课程 - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
课程 - GDPR Workshop
即将举行的公开课程
相关课程
NetApp DATAPROT9 – ONTAP Data Protection Administration
21 小时这是一个由讲师指导的中国(线上或线下)培训课程,针对希望使用NetApp ONTAP技术配置和管理数据保护机制的中级IT专业人员。
在本培训结束时,学员将能够:
- 理解ONTAP数据保护架构和概念。
- 配置和管理Snapshot副本以实现快速数据恢复。
- 实施和监控SnapMirror以进行数据复制。
- 使用SnapVault和其他ONTAP功能进行备份和归档策略。
EBX5 for Developers
21 小时这种以讲师为主导的中国现场现场培训面向希望使用EBX5(TIBCO EBX)在其组织内启用主数据管理解决方案的开发人员。
在培训结束时,参与者将能够:
- 解释需求并构建 MDM 解决方案。
- 实现主数据的管理和集成。
- 跨多个系统集成和传输数据。
- 使用匹配和合并逻辑将数据导入 EBX5。
- 设计、创建和记录满足其组织业务需求的数据模型。
- 将 EBX5 与第三方服务集成。
GDPR Workshop
7 小时本课程旨在为那些希望简要概述GDPR - 2018年5月25日发布的通用数据保护条例的人员提供帮助。对于需要了解GDPR基本知识的经理,部门负责人和员工而言,这是理想选择。
How to Audit GDPR Compliance
14 小时该课程主要以审计师和其他行政角色为重点开发。 其任务是确保其控制系统和IT环境符合执政法律的遵守。 规则。 课程将通过提供关键概念(0)的理解,以及它是如何 会影响会计师所做的工作。 参与者还将探讨数据主体的权利, 数据控制者 和处理者 义务,以及执行和遵守的概念在 条例的背景。 培训还将涵盖ISACA提供的审计计划。 允许审计人员审查(0)管理和响应机制以及支持 可以帮助管理与不遵守相关的风险的过程。
GDPR Advanced
21 小时这对于那些与GDPR有很大关系并且可以被任命为GDPR团队的人来说更为深刻。这对于IT,人力资源和市场营销人员来说是理想的,他们将广泛处理GDPR。
NetApp ONTAP9ADM – ONTAP Cluster Administration
21 小时这门由讲师指导的中国(线上或线下)培训课程,针对希望配置、管理和排除NetApp ONTAP集群故障的中级IT专业人员。
在培训结束时,学员将能够:
- 安装和配置NetApp ONTAP集群。
- 管理存储资源和网络设置。
- 实施安全和访问控制策略。
- 监控和排除ONTAP集群环境的故障。
Oracle GoldenGate
14 小时这种以讲师为主导的中国现场培训(现场或远程)针对的是希望设置,部署和管理Oracle GoldenGate以进行数据转换的系统管理员和开发人员。
在培训结束时,参与者将能够:
- 安装和配置 Oracle GoldenGate。
- 使用 Oracle GoldenGate 工具了解 Oracle 数据库复制。
- 了解 Oracle GoldenGate 体系结构。
- 配置并执行数据库复制和迁移。
- 优化 Oracle GoldenGate 性能并解决问题。
Personal Data Protection Officer - Basic Level
21 小时培训目的
- 让观众了解基于波兰和欧洲法律的个人数据保护运作的系统化、全面的问题
- 提供有关个人数据处理新规则的实用知识
- 介绍与《公约》生效有关的最大法律风险领域 GDPR
- 独立履行个人 Data Protection 官员职责的实际准备
Personal Data Protection Officer - Advanced Level
14 小时培训目的
- 获得有关如何执行检查员任务的实用知识
- 获得有关如何审计和评估风险的实用知识
- 提供有关个人数据处理新规则的实用知识
Sensor Fusion Algorithms
14 小时Sensor Fusion 是来自多个感测器的数据的组合和集成,以提供更准确、更可靠和更上下文的数据视图。
Sensor Fusion 实现需要演演算法来过滤和整合不同的数据源。
观众
本课程面向处理多感测器实现的工程师、程式师和架构师。
Talend Administration Center (TAC)
14 小时这种由讲师指导的中国现场现场培训针对希望设置Talend管理中心以部署和管理组织角色和任务的系统管理员,数据科学家和业务分析师。
在培训结束时,参与者将能够:
- 安装和配置 Talend 管理中心。
- 了解并实施 Talend 管理基础知识。
- 在 Talend 中构建、部署和运行业务项目或任务。
- 监控数据集的安全性,并基于TAC框架开发业务程序。
- 更广泛地了解大数据应用。
Talend Big Data Integration
28 小时这种以讲师为主导的中国现场培训(现场或远程)针对的是希望部署Talend Open Studio for Big Data以简化大数据读取和处理过程的技术人员。
在培训结束时,参与者将能够:
- 安装和配置 Talend Open Studio for Big Data。
- 与 Cloudera、HortonWorks、MapR、Amazon EMR 和 Apache 等大数据系统连接。
- 了解并设置 Open Studio 的大数据组件和连接器。
- 配置参数,自动生成MapReduce代码。
- 使用 Open Studio 的拖放界面运行 Hadoop 作业。
- 对大数据管道进行原型设计。
- 自动执行大数据集成项目。
Talend Cloud
7 小时这种以讲师为主导的中国现场现场培训面向希望使用Talend Cloud服务管理,监视和操作数据集成过程的数据管理员和开发人员。
在培训结束时,参与者将能够:
- 导航 Talend 管理控制台以管理平台中的用户和角色。
- 评估数据以查找和理解相关数据集。
- 创建一个管道来处理和监视静态或操作中的数据。
- 准备用于分析的数据,以生成与业务相关的见解。
Talend Data Stewardship
14 小时这种以讲师为主导的中国现场(现场或远程)现场培训针对的是初级到中级数据分析师,他们希望加深对使用Talend Data Stewardship管理和提高数据质量的理解和技能。
在培训结束时,参与者将能够:
-
全面了解数据管理在维护数据质量方面的作用。
使用 Talend Data Stewardship 管理数据质量任务。
在 Talend Data Stewardship 中创建、分配和管理任务,包括工作流自定义。
使用该工具的报告和监控功能来跟踪数据质量和管理工作。
Talend Open Studio for ESB
21 小时在这个由讲师指导的中国现场培训中,参与者将学习如何使用Talend Open Studio for ESB来创建,连接,调解和管理服务及其交互。
在培训结束时,参与者将能够
-
在
- 各种部署环境中以单个软件包的形式集成、增强和交付 ESB 技术。
- 了解并利用 Talend Open Studio 最常用的组件。
- 集成任何应用程序、数据库、API 或 Web 服务。
- 无缝集成异构系统和应用程序。
- 嵌入现有的 Java 代码库以扩展项目。
- 利用社区组件和代码来扩展项目。
- 在拖放式 Eclipse 环境中快速集成系统、应用程序和数据源。
- 通过生成优化的、可重用的代码来减少开发时间和维护成本。