
由讲师进行实时指导的大数据本地培训课程将首先介绍大数据的元素概念,然后介绍用于执行数据分析的编程语言和方法。在课程的演示练习环节,我们会讨论、比较并使用用于实现大数据存储、分布式处理、可伸缩性的工具和基础架构。
大数据培训形式包括“现场实时培训”和“远程实时培训”。现场实时培训可在客户位于中国的所在场所或NobleProg位于中国的企业培训中心进行,远程实时培训可通过交互式远程桌面进行。
NobleProg -- 您的本地培训提供商
客户评论
可以应用的场景及案例
zhaopeng liu - Fmr
课程: Spark for Developers
案例分析
国栋 张
课程: Spark for Developers
本届会议的所有部分
Eric Han - Fmr
课程: Spark for Developers
实例演习; 实际工作经验分享
澳新银行
课程: Data Vault: Building a Scalable Data Warehouse
老师对数据仓库的知识很全面,赞!
澳新银行
课程: Data Vault: Building a Scalable Data Warehouse
老师讲解细致, 讨论气氛融洽
澳新银行
课程: Data Vault: Building a Scalable Data Warehouse
事实上,所有数据和软件都已准备好在已准备好的VM上使用,由外部磁盘中的培训师提供。
vyzVoice
课程: Hadoop for Developers and Administrators
Machine Translated
材料范围
Maciej Jonczyk
课程: From Data to Decision with Big Data and Predictive Analytics
Machine Translated
系统化ML领域的知识
Orange Polska
课程: From Data to Decision with Big Data and Predictive Analytics
Machine Translated
培训后可以探索很多问题。
Klaudia Kłębek
课程: Data Mining z wykorzystaniem R
Machine Translated
培训师知识渊博,包括我感兴趣的领域。
Mohamed Salama
课程: Data Mining & Machine Learning with R
Machine Translated
非常适合需求。
Yashan Wang
课程: Data Mining with R
Machine Translated
理查德非常冷静和有条不紊,具有分析洞察力 - 正是提出这种课程所需的品质。
Kieran Mac Kenna
课程: Spark for Developers
Machine Translated
我喜欢做的练习。
Nour Assaf
课程: Data Mining and Analysis
Machine Translated
动手练习和培训师能够用简单的术语解释复杂的主题。
youssef chamoun
课程: Data Mining and Analysis
Machine Translated
所提供的信息很有意思,最好的部分是在我们从Durex获得数据并且处理我们熟悉的数据并执行操作以获得结果时。
Jessica Chaar
课程: Data Mining and Analysis
Machine Translated
我最喜欢教练提供真实的实例。
Simon Hahn
课程: Administrator Training for Apache Hadoop
Machine Translated
我真的很享受培训师的巨大能力。
Grzegorz Gorski
课程: Administrator Training for Apache Hadoop
Machine Translated
我真的很喜欢这些实践课程。
Jacek Pieczątka
课程: Administrator Training for Apache Hadoop
Machine Translated
我认为这些信息很有趣。
Allison May
课程: Data Visualization
Machine Translated
我非常感谢Jeff使用了适用于教育数据的数据和示例。他使它变得有趣和互动。
Carol Wells Bazzichi
课程: Data Visualization
Machine Translated
了解所有图表类型及其用途。学习混乱的价值。了解显示时间数据的方法。
Susan Williams
课程: Data Visualization
Machine Translated
培训师很热情。
Diane Lucas
课程: Data Visualization
Machine Translated
我真的很喜欢内容/讲师。
Craig Roberson
课程: Data Visualization
Machine Translated
我是一名实践学习者,这是他做了很多的事情。
Lisa Comfort
课程: Data Visualization
Machine Translated
我喜欢这些例子。
Peter Coleman
课程: Data Visualization
Machine Translated
我通常从这些例子中受益。
Peter Coleman
课程: Data Visualization
Machine Translated
我喜欢现实世界的好例子,对现有报道的评论。
Ronald Parrish
课程: Data Visualization
Machine Translated
我真的受益于培训师愿意分享更多。
Balaram Chandra Paul
课程: A practical introduction to Data Analysis and Big Data
Machine Translated
我们对整个环境了解得更多。
John Kidd
课程: Spark for Developers
Machine Translated
培训师让课堂变得有趣和有趣,这对全天培训有很大帮助。
Ryan Speelman
课程: Spark for Developers
Machine Translated
我认为培训师具有将幽默和现实生活故事相结合的优秀风格,使手头的主题非常平易近人。我强烈推荐这位教授。
课程: Spark for Developers
Machine Translated
非常喜欢互动的学习方式。
Luigi Loiacono
课程: Data Analysis with Hive/HiveQL
Machine Translated
这是一次非常实用的训练,我喜欢动手练习。
Proximus
课程: Data Analysis with Hive/HiveQL
Machine Translated
我受益于良好的概述,理论与练习之间的良好平衡。
Proximus
课程: Data Analysis with Hive/HiveQL
Machine Translated
由于虚拟机,我非常喜欢动态交互和“动手”主题,非常刺激!
Philippe Job
课程: Data Analysis with Hive/HiveQL
Machine Translated
Ernesto在解释使用Spark及其各种模块的高级概念方面做得很好。
Michael Nemerouf
课程: Spark for Developers
Machine Translated
我受益于培训师的能力和知识。
Jonathan Puvilland
课程: Data Analysis with Hive/HiveQL
Machine Translated
我通常从技术的介绍中受益。
Continental AG / Abteilung: CF IT Finance
课程: A practical introduction to Data Analysis and Big Data
Machine Translated
整体而言,内容很好。
Sameer Rohadia
课程: A practical introduction to Data Analysis and Big Data
Machine Translated
迈克尔培训师对大数据和R的主题非常了解和熟练。他非常灵活,能够快速定制满足客户需求的培训。他也非常有能力在旅途中解决技术和主题问题。神奇而专业的训练!
Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
课程: Programming with Big Data in R
Machine Translated
我非常喜欢推出新包装。
Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
课程: Programming with Big Data in R
Machine Translated
导师Michael Yan先生很好地与观众互动,指导很明确。导师还可以根据培训期间学生的要求添加更多信息。
Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
课程: Programming with Big Data in R
Machine Translated
主题和节奏是完美的。
Tim - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
课程: Programming with Big Data in R
Machine Translated
我认为培训师具有将幽默和现实生活故事相结合的优秀风格,使手头的主题非常平易近人。我强烈推荐这位教授。
课程: Spark for Developers
Machine Translated
大数据课程大纲
由教练引导,现场培训(在线或在线)旨在开发人员想要使用和整合Spark,(0)和(1)来处理,分析和转型大型和复杂的数据集。
在本研讨会结束后,参与者将能够:
设置必要的环境,以便在 Spark, Hadoop, 和 Python 开始处理大数据。 了解Spark和0的特性、核心组件和建筑。 了解如何集成 Spark, Hadoop, 和 Python 大数据处理。 探索Spark生态系统中的工具(Spark MlLib, Spark Streaming,Kafka,Sqoop,Kafka,和Flume)。 建立协作过滤推荐系统类似于(3)、YouTube、Amazon、Spotify和(2)ogle。 使用 Apache Mahout 来扩展机器学习算法。
课程格式
互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
要申请此课程的定制培训,请联系我们安排。
由教练领导的现场培训(在线或在线)针对数据分析师和数据科学家,他们希望使用 Weka 进行数据采矿任务。
在本研讨会结束后,参与者将能够:
安置和配置(0)。 了解 Weka 环境和工作组。 使用数据挖掘任务(0)进行数据挖掘任务。
课程格式
互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
要申请此课程的定制培训,请联系我们安排。
由教练领导的现场培训(在线或在线)是针对数据分析师或任何想要使用 SPSS Modeler 进行数据采矿活动的人。
在本研讨会结束后,参与者将能够:
了解数据采矿的基础。 了解如何在模型器中导入和评估数据质量。 有效地开发、部署和评估数据模型。
课程格式
互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
要申请此课程的定制培训,请联系我们安排。
参与者将有机会通过动手练习将这些知识付诸实践。小组互动和讲师反馈是课堂的重要组成部分。
本课程首先介绍大数据的基本概念,然后讲解用于执行数据分析的编程语言和方法,最后我们会讨论可启用大数据存储、分布式处理及可扩展性的工具和基础架构。
受众
- 开发人员/程序员
- IT顾问
课程形式
- 部分讲座、部分讨论、实操、偶尔测评进度
By the end of this training, participants will be able to:
- Learn how to use Spark with Python to analyze Big Data.
- Work on exercises that mimic real world cases.
- Use different tools and techniques for big data analysis using PySpark.
在本导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导
观众
数据分析师或任何有兴趣学习如何解释数据以解决问题的人
课程格式
经过对KDD的理论讨论后,教练将介绍现实生活的案例,要求KDD的应用解决问题。 参与者将准备、选择和清理样品数据集,并使用他们对数据的先前知识,以根据他们的观察结果提出解决方案。
在这项由导师领导的现场培训中,参与者将学习如何使用 Apache Kylin 设置实时数据库。
在本研讨会结束后,参与者将能够:
使用Kylin使用实时流媒体数据 使用 Apache Kylin's 强大的功能, 丰富的 SQL 界面, spark cubing 和 subsecond 查询 latency
笔记
我们使用Kylin的最新版本(根据这篇文章, Apache Kylin v2.0)
观众
大数据工程师 [ ] 分析师
课程格式
部分讲座,部分讨论,练习和重实习
这种由讲师指导的实时培训(现场或远程)针对希望使用Excel进行数据挖掘的数据科学家。
在培训结束时,参与者将能够:
- 使用Excel探索数据以执行数据挖掘和分析。
- 使用Microsoft算法进行数据挖掘。
- 了解Excel数据挖掘中的概念。
课程形式
- 互动式讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- 要请求此课程的定制培训,请与我们联系以安排。
在本由导师领导的现场培训中,参与者将学习如何安装、配置和使用(7)作为数据分析工具和基础数据库的统一层。
在本研讨会结束后,参与者将能够:
安装和配置(7) 对多个数据来源进行查询,无论位置、大小或结构如何 集成 Dremio 与 BI 和数据来源,如 Tableau 和 Elasticsearch
观众
数据科学家 (四)分析师 数据工程师
课程格式
部分讲座,部分讨论,练习和重实习
笔记
要申请此课程的定制培训,请联系我们安排。
在这一由讲师引导的现场培训中,学员将学习Apache Drill的基础知识,然后利用SQL的强大功能和便利性在无需编写代码的情况下交互式查询大数据。学员还将学习如何优化分布式SQL执行的Drill查询。
在本次培训结束后,学员将能够:
- 对Hadoop上的结构化和半结构化数据进行“自助式”探索
- 使用SQL查询来查询已知以及未知数据
- 了解Apache Drills如何接收和执行查询
- 编写SQL查询来分析不同类型的数据,包括Hive中的结构化数据,HBase或MapR-DB表中的半结构化数据,以及Parquet和JSON文件中保存的数据。
- 使用Apache Drill执行即时模式发现,绕过对复杂ETL和模式操作的需求
- 将Apache Drill与BI(商业智能)工具(如Tableau、Qlikview、MicroStrategy、Excel)集成在一起
受众
- 数据分析师
- 数据科学家
- SQL程序员
课程形式
- 部分讲座、部分讨论、练习和大量实操
在这个现场讲师指导的现场培训中,参与者将学习如何将Apache Arrow与各种Data Science框架集成,以访问来自不同数据源的数据。
在培训结束时,参与者将能够:
- 在分布式群集环境中安装和配置Apache Arrow
- 使用Apache Arrow访问来自不同数据源的数据
- 使用Apache Arrow可以避免构建和维护复杂ETL管道的需要
- 分析不同数据源中的数据,而无需将其整合到集中式存储库中
听众
- 数据科学家
- 数据工程师
课程 格式
- 部分讲座,部分讨论,练习和繁重的实践练习
注意
- 要申请本课程的定制培训,请联系我们安排。
High-value government solutions will be created from a mashup of the most disruptive technologies:
- Mobile devices and applications
- Cloud services
- Social business technologies and networking
- Big Data and analytics
IDC predicts that by 2020, the IT industry will reach $5 trillion, approximately $1.7 trillion larger than today, and that 80% of the industry's growth will be driven by these 3rd Platform technologies. In the long term, these technologies will be key tools for dealing with the complexity of increased digital information. Big Data is one of the intelligent industry solutions and allows government to make better decisions by taking action based on patterns revealed by analyzing large volumes of data — related and unrelated, structured and unstructured.
But accomplishing these feats takes far more than simply accumulating massive quantities of data.“Making sense of thesevolumes of Big Datarequires cutting-edge tools and technologies that can analyze and extract useful knowledge from vast and diverse streams of information,” Tom Kalil and Fen Zhao of the White House Office of Science and Technology Policy wrote in a post on the OSTP Blog.
The White House took a step toward helping agencies find these technologies when it established the National Big Data Research and Development Initiative in 2012. The initiative included more than $200 million to make the most of the explosion of Big Data and the tools needed to analyze it.
The challenges that Big Data poses are nearly as daunting as its promise is encouraging. Storing data efficiently is one of these challenges. As always, budgets are tight, so agencies must minimize the per-megabyte price of storage and keep the data within easy access so that users can get it when they want it and how they need it. Backing up massive quantities of data heightens the challenge.
Analyzing the data effectively is another major challenge. Many agencies employ commercial tools that enable them to sift through the mountains of data, spotting trends that can help them operate more efficiently. (A recent study by MeriTalk found that federal IT executives think Big Data could help agencies save more than $500 billion while also fulfilling mission objectives.).
Custom-developed Big Data tools also are allowing agencies to address the need to analyze their data. For example, the Oak Ridge National Laboratory’s Computational Data Analytics Group has made its Piranha data analytics system available to other agencies. The system has helped medical researchers find a link that can alert doctors to aortic aneurysms before they strike. It’s also used for more mundane tasks, such as sifting through résumés to connect job candidates with hiring managers.
如果您试图理解您可以访问或想要分析网络上可用的非结构化数据(如Twitter,链接等等),那么本课程适合您。
它主要针对需要选择哪些数据值得收集以及值得分析的决策者和人员。
它不是针对人们配置解决方案,但这些人将从大局中受益。
交货方式
在课程期间,代表们将获得大多数开源技术的工作示例。
讲座后将进行简短的讲座,参加者将进行简单的练习
使用的内容和软件
每次运行课程时都会更新所有使用的软件,因此我们会检查最新版本。
它涵盖了从获取,格式化,处理和分析数据的过程,以解释如何使用机器学习自动化决策制定过程。
第2天 - 探讨一系列与Big Data环境相关的分析实践和工具的主题。它没有涉及实现或编程细节,而是将概念保持在概念层面,重点放在使参与者能够全面了解Big Data解决方案提供的常见分析功能和特性的主题上。
第3天 - 概述与Big Data解决方案平台架构相关的基本和必要主题领域。它涵盖了开发Big Data解决方案平台所需的Big Data机制以及用于组装数据处理平台的架构选项。还提供了常见方案,以便基本了解Big Data解决方案平台的使用方式。
第4天 - 通过探索与Big Data解决方案平台架构相关的高级主题,在第3天构建。特别是,介绍和讨论了构成Big Data解决方案平台的不同架构层,包括数据源,数据入口,数据存储,数据处理和安全性。
第5天 - 涵盖了一系列练习和问题,旨在测试代表们应用第3天和第4天所涵盖主题知识的能力。
本课程主要侧重于解决方案的讨论和介绍,但可根据需要提供动手练习。
该课程包括8个模块(第1天4个,第2天4个)
在以讲师为主导的现场培训中,参与者将学习处理Big Data技术的思维方式,评估其对现有流程和政策的影响,并实施这些技术,以识别犯罪活动和预防犯罪。将审查世界各地执法组织的案例研究,以深入了解其采用方法,挑战和结果。
在培训结束时,参与者将能够:
- 将Big Data技术与传统的数据收集流程相结合,在调查过程中拼凑出一个故事
- 实施工业大数据存储和处理数据分析解决方案
- 准备一份提案,以采用最适当的工具和程序,使数据驱动的方法能够进行刑事调查
听众
- 具有技术背景的执法专家
课程形式
- 部分讲座,部分讨论,练习和繁重的实践练习
与会者将在本课程中学习如何使用数据集成,数据治理和数据安全三大支柱管理大数据,以便将大数据转化为实际业务价值。对客户管理案例研究进行的不同练习将有助于与会者更好地理解基础流程。
在本次培训结束后,学员将能够:
- 了解机器学习的发展和趋势。
- 了解机器学习如何在不同行业中使用。
- 熟悉在组织内实现机器学习的工具、技能、服务。
- 了解机器学习如何用于增强数据挖掘和分析。
- 了解数据中台是什么,以及企业如何使用它。
- 了解大数据和智能应用程序在各个行业中的作用。
课程形式
- 互动讲座和讨论。
- 大量练习和实操。
- 在现场实验室环境中动手实现。
课程自定义选项
- 如需本课程的定制培训,请联系我们以作安排。
此讲师指导的现场培训(现场或远程)针对的软件工程师,他们希望使用 Sqoop 和 Flume 在系统之间传输数据。
培训结束时,学员将能够:
- 使用 Sqoop 和 Flume 引入大数据。
- 从多个数据源中引入数据。
- 将数据从关系数据库移动到 HDFS 和Hive。
- 将数据从 HDFS 导出到关系数据库。
课程格式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中实际实现。
课程自定义选项
- 如需申请本课程的定制培训,请联系我们安排。
由教练领导,现场培训(在线或在线)旨在技术人员谁希望部署 Talend Open Studio for Big Data 以简化阅读和阅读过程通过 Big Data 。
在本研讨会结束后,参与者将能够:
安装和设置 Talend Open Studio for Big Data. 连接到(0)系统,如Cloudera、HortonWorks、MapR、Amazon EMR 和 Apache。 了解并设置 Open Studio 的大数据组件和连接器。 设置参数以自动生成 MapReduce 代码。 使用 Open Studio's drag-and-drop 界面运行 Hadoop 工作。 原型大数据管道 自动化大数据集成项目。
课程格式
互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
要申请此课程的定制培训,请联系我们安排。
Course goal:
Getting knowledge regarding Hadoop cluster administration
Last Updated: