大数据培训课程 | Big Data培训课程

大数据培训课程

由讲师进行实时指导的大数据本地培训课程将首先介绍大数据的元素概念,然后介绍用于执行数据分析的编程语言和方法。在课程的演示练习环节,我们会讨论、比较并使用用于实现大数据存储、分布式处理、可伸缩性的工具和基础架构。

大数据培训形式包括“现场实时培训”和“远程实时培训”。现场实时培训可在客户位于中国的所在场所或NobleProg位于中国的企业培训中心进行,远程实时培训可通过交互式远程桌面进行。

NobleProg -- 您的本地培训提供商

客户评论

★★★★★
★★★★★

大数据课程大纲

课程名称
课程时长
课程概览
课程名称
课程时长
课程概览
21小时
课程概览
Apache Accumulo是一个有序的分布式键/值存储,可提供强大,可扩展的数据存储和检索。它基于Go ogle的BigTable设计,由Apache Hadoop ,Apache Zookeeper和Apache Thrift 。

这个由讲师主导的实时课程涵盖了Accumulo背后的工作原理,并引导参与者在Apache Accumulo上开发示例应用程序。

课程格式

- 部分讲座,部分讨论,实践开发和实施,偶尔测试以评估理解
7小时
课程概览
Kafka Streams是一个客户端库,用于构建应用程序和微服务,其数据传入和传出Kafka消息传递系统。传统上, Apache Kafka依靠Apache Spark或Apache Storm来处理消息生成者和消费者之间的数据。通过在应用程序内调用Kafka Streams API,可以直接在Kafka中处理数据,从而无需将数据发送到单独的集群进行处理。

在这个由讲师指导的实时培训中,参与者将学习如何将Kafka Streams集成到一组示例Java应用程序中,这些应用程序将数据传入和传出Apache Kafka以进行流处理。

在培训结束时,参与者将能够:

- 了解Kafka Streams的功能和优势,而不是其他流处理框架
- 直接在Kafka集群中处理流数据
- 编写与Kafka和Kafka Streams集成的Java或Scala应用程序或微服务
- 编写简洁的代码,将输入的Kafka主题转换为输出Kafka主题
- 构建,打包和部署应用程序

听众

- 开发商

课程 格式

- 部分讲座,部分讨论,练习和繁重的实践练习

笔记

- 要申请本课程的定制培训,请联系我们安排
28小时
课程概览
Mem SQL是一个用于云和内部部署的内存中分布式SQL数据库管理系统。它是一个实时数据仓库,可立即提供实时和历史数据的洞察力。

在这个由讲师指导的实时培训中,参与者将学习Mem SQL的基本知识,以便进行开发和管理。

在培训结束时,参与者将能够:

- 了解Mem SQL的关键概念和特征
- 安装,设计,维护和操作Mem SQL
- 优化Mem SQL模式
- 改进Mem SQL查询
- Mem SQL基准性能
- 使用Mem SQL构建实时数据应用程序

听众

- 开发商
- 管理员
- 运营工程师

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
21小时
课程概览
预测性分析是使用数据分析来预测未来的过程。此过程使用数据以及数据挖掘、统计和机器学习技术创建可用来预测未来事件的预测模型。

在这一由讲师引导的现场培训中,参与者将学习如何使用Matlab建立预测模型,并将其应用于大样本数据集,以根据数据预测未来事件。

在培训结束后,参与者将能够:

- 创建预测模型来分析历史和交易数据中的规律
- 使用预测建模来识别风险和机会
- 建立捕捉重要趋势的数学模型
- 使用来自设备和业务系统的数据来减少浪费、节省时间或降低成本

受众

- 开发人员
- 工程师
- 领域专家

课程形式

- 部分讲座、部分讨论、练习和大量实操
7小时
课程概览
在这个以讲师为主导的现场培训中,参与者将学习MapR Stream Architecture背后的核心概念,因为他们开发了实时流应用程序。

在本次培训结束时,参与者将能够构建生产者和消费者应用程序,以进行实时流数据处理。

听众

- 开发商
- 管理员

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习

注意

- 要申请本课程的定制培训,请联系我们安排。
14小时
课程概览
Magellan是一个开源分布式执行引擎,用于处理大数据的地理空间分析。它在Apache Spark之上实现,它扩展了Spark SQL并为地理空间分析提供了关系抽象。 这种有指导意义的实时培训介绍了实施地理空间分析的概念和方法,并通过在Spark上使用Magellan创建预测分析应用程序来引导参与者。 在培训结束后,参与者将能够: 按比例高效地查询,解析和加入地理空间数据集在商业智能和预测分析应用程序中实施地理空间数据使用空间上下文来扩展移动设备,传感器,日志和可穿戴设备的功能 听众 应用开发者 课程的格式 部分讲座,部分讨论,练习和沉重的练习
14小时
课程概览
Apache Kylin是一种用于大数据的极端分布式分析引擎。

在这个由讲师指导的现场培训中,参与者将学习如何使用Apache Kylin建立实时数据仓库。

在培训结束时,参与者将能够:

- 使用Kylin消耗实时流数据
- 利用Apache Kylin的强大功能,丰富的SQL界面,火花立方体和亚秒查询延迟

注意

- 我们使用最新版本的Kylin(截至本文撰写时, Apache Kylin v2.0)

听众

- 大数据工程师
- Big Data分析师

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
7小时
课程概览
Confluent K SQL是一个基于Apache Kafka构建的流处理框架。它支持使用SQL操作进行实时数据处理。

这种由讲师指导的实时培训(现场或远程)面向希望在不编写代码的情况下实施Apache Kafka流处理的开发人员。

在培训结束时,参与者将能够:

- 安装和配置Confluent K SQL 。
- 仅使用SQL命令(无Java或Python编码)设置流处理管道。
- 完全在SQL执行数据过滤,转换,聚合,连接,窗口和会话。
- 为流式ETL和实时分析设计和部署交互式连续查询。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
35小时
课程概览
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21小时
课程概览
KNIME Analytics Platform是数据驱动创新的领先开源选项,可帮助您发现隐藏在数据中的潜力,挖掘新的见解或预测新的未来。 KNIME Analytics Platform拥有1000多个模块,数百个可立即运行的示例,全面的集成工具以及最广泛的高级算法选择,是任何数据科学家和业务分析师的理想工具箱。

KNIME分析平台的这门课程是向KNIME介绍初学者,高级用户和KNIME专家的理想机会,学习如何更有效地使用它,以及如何基于KNIME工作流程创建清晰,全面的报告
21小时
课程概览
数据库中的知识发现 (KDD) 是从数据集合中发现有用知识的过程。这种数据挖掘技术的实际应用包括营销、欺诈检测、电信和制造



在这个教师指导的现场课程中, 我们介绍了 KDD 所涉及的过程, 并进行了一系列练习, 以实践这些过程的实施

受众

- 数据分析人员或任何有兴趣学习如何解释数据以解决问题的人
课程 的

格式

- 在对 KDD 进行理论讨论后, 教师将介绍需要应用 KDD 来解决问题的实际案例。参与者将准备、选择和清理样本数据集, 并利用他们以前对数据的了解, 根据他们的观察结果提出解决方案
21小时
课程概览
与其他技术不同,物联网更为复杂,几乎涵盖了核心工程的每个分支 - 机械, Electron ,固件,中间件,云,分析和移动。对于其每个工程层,都有经济学,标准,法规和不断发展的现有技术等方面。这是第一次,提供适度的课程,涵盖物联网工程的所有这些关键方面。

摘要

-

一个高级培训计划,涵盖物联网的当前最新技术

-

跨越多个技术领域,以提高对物联网系统及其组件的认识,以及它如何帮助企业和组织。

-

模拟物联网应用程序的现场演示,展示跨不同行业领域的实际物联网部署,例如工业物联网,智能城市,零售,旅行和运输以及连接设备和事物的使用案例

目标观众

-

负责各自组织内业务和运营流程的经理,并希望了解如何利用物联网使其系统和流程更高效。

-

正在寻求建立新企业并希望更好地了解物联网技术格局的企业家和投资者,以了解他们如何以有效的方式利用它。

对物联网或物联网市场价值的估计是巨大的,因为根据定义,物联网是一个集成和扩散的设备,传感器和计算能力层,覆盖整个消费者,企业对企业和政府行业。物联网将占据越来越多的连接:今天的设备数量达到19亿台,到2018年达到90亿次。那一年,它将大致相当于智能手机,智能电视,平板电脑,可穿戴计算机和个人电脑的数量。

在消费领域,许多产品和服务已经跨越物联网,包括厨房和家用电器,停车场,RFID,照明和加热产品,以及工业互联网中的许多应用。

然而,物联网的基础技术并不是什么新事物,因为自互联网诞生以来就存在着M2M通信。然而,在过去几年中发生了变化的是,在每个家庭中通过压倒性地改编智能手机和平板电脑而增加的廉价无线技术的出现。移动设备的爆炸式增长导致了物联网的当前需求。

由于物联网业务的无限机会,大量的中小型企业家纷纷加入物联网淘金热潮。此外,由于开源电子和物联网平台的出现,物联网系统的开发成本和进一步管理其大规模生产的成本越来越低。现有的电子产品所有者正面临将其设备与互联网或移动应用集成的压力。

此培训旨在对新兴行业进行技术和业务审核,以便物联网爱好者/企业家能够掌握物联网技术和业务的基础知识。

当然客观的

该课程的主要目标是介绍在家庭和城市自动化(智能家居和城市),工业互联网,医疗保健, Go vt。,Mobile Cellular和其他领域的物联网实施的新兴技术选项,平台和案例研究。

-

IoT-Mechanical, Electron /传感器平台,无线和有线协议,移动到Electron集成,移动到企业集成,数据分析和总控制平面的所有元素的基本介绍

-

用于IoT-WiFi,Zigbee / Zwave,蓝牙,ANT +的M2M无线协议:何时何地使用哪一个?

-

移动/桌面/网络应用程序 - 用于注册,数据采集和控制 - 可用于物联网的M2M数据采集平台 - Xively,Omega和NovoTech等

-

物联网的安全问题和安全解决方案

-

IoT- Raspberry Pi , Arduino ,ArmMbedLPC等的开源/商业电子平台

-

适用于AWS-IoT应用程序的开源/商业企业云平台, Azure -IOT,Watson-IOT云以及其他次要IoT云

-

研究一些常见物联网设备的业务和技术,如家庭自动化,烟雾报警器,车辆,军事,家庭健康等。
28小时
课程概览
MonetDB是一个开源数据库,是列存储技术方法的先驱。

在这个由讲师指导的实时培训中,参与者将学习如何使用MonetDB以及如何从中获取最大价值。

在培训结束时,参与者将能够:

- 了解MonetDB及其功能
- 安装并开始使用MonetDB
- 在MonetDB中探索并执行不同的功能和任务
- 通过最大化MonetDB功能来加速项目的交付

听众

- 开发商
- 技术专家

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
21小时
课程概览
Stream Processing指的是“运动中的数据”的实时处理,即,在接收数据时对数据执行计算。这些数据被读取为来自数据源的连续流,例如传感器事件,网站用户活动,金融交易,信用卡刷卡,点击流等。 Stream Processing框架能够读取大量传入数据并几乎立即提供有价值的见解。

在这个以讲师为主导的现场培训(现场或远程)中,参与者将学习如何使用现有的大数据存储系统和相关的软件应用程序和微服务来设置和集成不同的Stream Processing框架。

在培训结束时,参与者将能够:

- 安装和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
- 理解并选择最合适的工作框架。
- 数据处理连续,同时,并以逐个记录的方式进行。
- 将Stream Processing解决方案与现有数据库,数据仓库,数据湖等集成。
- 将最合适的流处理库与企业应用程序和微服务集成在一起。

听众

- 开发商
- 软件架构师

课程 格式

- 部分讲座,部分讨论,练习和繁重的实践练习

笔记

- 要申请本课程的定制培训,请联系我们安排。
14小时
课程概览
受众

- 开发人员
课程 的

格式

- 讲座, 动手实践, 小测试的过程中, 以衡量理解
21小时
课程概览
Cloudera Impala是Apache Hadoop集群的开源大规模并行处理(MPP) SQL查询引擎。

Impala使用户能够向存储在Hadoop分布式文件系统和Apache Hbase中的数据发出低延迟SQL查询,而无需数据移动或转换。

听众

本课程面向分析师和数据科学家,通过Business Intelligence或SQL工具对存储在Hadoop数据进行分析。

在此课程结束后,代表们将能够

- 使用Impala从Hadoop集群中提取有意义的信息。
- 编写特定程序以便在Impala SQL Dialect中实现Business Intelligence 。
- 对Impala故障排除。
7小时
课程概览
本课程介绍如何从Hive提取数据的人员使用Hive SQL语言(AKA: Hive HQL, Hive SQL , Hive QL)
21小时
课程概览
Hortonworks Data Platform (HDP)是一个开源的Apache Hadoop支持平台,为在Apache Hadoop生态系统上开发大数据解决方案提供了稳定的基础。

这个由讲师指导的现场培训(现场或远程)介绍了Hortonworks Data Platform (HDP)并引导参与者完成Spark + Hadoop解决方案的部署。

在培训结束时,参与者将能够:

- 使用Hortonworks可以大规模可靠地运行Hadoop 。
- 使用Spark的敏捷分析工作流统一Hadoop的安全性,治理和运营功能。
- 使用Hortonworks调查,验证,认证和支持Spark项目中的每个组件。
- 处理不同类型的数据,包括结构化,非结构化,动态和静止。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
21小时
课程概览
本课程介绍HBase - 一个基于Hadoop的无SQL存储。本课程面向将使用HBase开发应用程序的开发人员以及将管理HBase集群的管理员。

我们将通过HBase的HBase架构和数据建模以及应用程序开发向开发人员展示。它还将讨论将MapReduce与HBase一起使用,以及与性能优化相关的一些管理主题。该课程非常实用,包含大量实验练习。

持续时间 :3天

受众 :开发人员和管理员
28小时
课程概览
Hadoop是一种流行的Big Data处理框架。 Python是一种高级编程语言,以其清晰的语法和代码可读性而闻名。

在这个以讲师为主导的现场培训中,参与者将学习如何使用Python来处理Hadoop ,MapReduce,Pig和Spark,因为他们会逐步完成多个示例和用例。

在培训结束时,参与者将能够:

- 了解Hadoop ,MapReduce,Pig和Spark背后的基本概念
- 将Python与Hadoop分布式文件系统(HDFS),MapReduce,Pig和Spark结合使用
- 使用Snakebite以编程方式访问Python HDFS
- 使用mrjob在Python编写MapReduce作业
- 用Python编写Spark程序
- 使用Python UDF扩展pig的功能
- 使用Luigi管理MapReduce作业和Pig脚本

听众

- 开发商
- IT专业人士

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
28小时
课程概览
听众:

本课程旨在揭开大数据/ hadoop技术的神秘面纱,并表明它不难理解。
14小时
课程概览
随着越来越多的软件和IT项目从本地处理和数据管理转向分布式处理和大数据存储,项目经理们正在意识到需要升级他们的知识和技能,以掌握与大数据项目和机会相关的概念和实践。

本课程将向项目经理介绍当下最流行的大数据处理框架:Hadoop。

在这一由讲师引导的培训中,学员将学习Hadoop生态系统的核心组件,以及这些技术如何用于解决大规模问题。在学习这些基础的过程中,学员还将提高他们与这些系统的开发人员和实施人员以及许多IT项目涉及的数据科学家和分析师沟通的能力。

受众

- 希望将Hadoop应用到其现有开发或IT基础架构中的项目经理
- 需要与包括大数据工程师、数据科学家和业务分析师在内的跨职能团队进行沟通的项目经理

课程形式

- 部分讲座、部分讨论、练习和大量实操
7小时
课程概览
这一由讲师指导的实时培训(现场或远程)面向的是希望学习如何实施机器学习策略同时最大限度地利用大数据的技术人员。

在本次培训结束后,学员将能够:

- 了解机器学习的发展和趋势。
- 了解机器学习如何在不同行业中使用。
- 熟悉在组织内实现机器学习的工具、技能、服务。
- 了解机器学习如何用于增强数据挖掘和分析。
- 了解数据中台是什么,以及企业如何使用它。
- 了解大数据和智能应用程序在各个行业中的作用。

课程形式

- 互动讲座和讨论。
- 大量练习和实操。
- 在现场实验室环境中动手实现。

课程自定义选项

- 如需本课程的定制培训,请联系我们以作安排。
21小时
课程概览
Apache NiFi (Hortonworks DataFlow)是一个实时集成的数据物流和简单的事件处理平台,可以在系统之间移动,跟踪和自动化数据。它使用基于流的编程编写,并提供基于Web的用户界面,以实时管理数据流。

在这个由讲师指导的现场培训(现场或远程)中,参与者将学习如何在实验室环境中部署和管理Apache NiFi 。

在培训结束时,参与者将能够:

- 安装和配置Apachi NiFi。
- 从不同的分布式数据源(包括数据库和大数据湖)获取,转换和管理数据。
- 自动化数据流。
- 启用流式分析。
- 应用各种方法进行数据摄取。
- 将Big Data转化为业务洞察力。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
21小时
课程概览
Apache Hadoop是用于处理服务器群集上的Big Data的最流行的框架之一。本课程深入研究HDFS,高级Pig, Hive和HBase中的数据管理。这些高级编程技术将有益于经验丰富的Hadoop开发人员。

观众 :开发者

持续时间:三天

格式:讲座(50%)和动手实验室(50%)。
7小时
课程概览
Spark SQL是Apache Spark用于处理结构化和非结构化数据的模块。 Spark SQL提供有关数据结构以及正在执行的计算的信息。此信息可用于执行优化。 Spark SQL两个常见用途是:
- 执行SQL查询。
- 从现有Hive安装中读取数据。

在这个由讲师指导的实时培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。

在培训结束时,参与者将能够:

- 安装和配置Spark SQL 。
- 使用Spark SQL执行数据分析。
- 以不同格式查询数据集。
- 可视化数据和查询结果。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
14小时
课程概览
Apache Zeppelin是一款基于Web的笔记本,用于捕获,探索,可视化和共享基于Hadoop和Spark的数据。 这种有指导性的实时培训引入了交互式数据分析背后的概念,并让参与者通过在单用户或多用户环境中部署和使用Zeppelin。 在培训结束后,参与者将能够: 安装并配置Zeppelin 在基于浏览器的界面中开发,组织,执行和共享数据在不参考命令行或群集细节的情况下可视化结果在长时间的工作流程上执行并协作可以使用许多插件语言/数据处理后端,例如Scala(使用Apache Spark),Python(使用Apache Spark),Spark SQL,JDBC,Markdown和Shell。 将Zeppelin与Spark,Flink和Map Reduce集成用Apache Shiro保护Zeppelin的多用户实例 听众 数据工程师数据分析师数据科学家软件开发商 课程的格式 部分讲座,部分讨论,练习和沉重的练习
14小时
课程概览
Vespa是由雅虎创建的开源大数据处理和服务引擎。它用于响应用户查询,提出建议,并实时提供个性化内容和广告。 这种有指导意义的实时培训引入了服务大型数据的挑战,并通过创建可实时计算大型数据集中的用户请求响应的应用程序来引导参与者。 在培训结束后,参与者将能够: 使用Vespa可以在用户等待时在服务时间快速计算数据(存储,搜索,排名,组织) 将Vespa实施到涉及功能搜索,建议和个性化的现有应用程序中将Vespa与现有的大数据系统(如Hadoop和Storm)集成并部署。 听众 开发商 课程的格式 部分讲座,部分讨论,练习和沉重的练习
14小时
课程概览
Tigon是一款开源,实时,低延迟,高吞吐量,本地YARN,位于HDFS和HBase之上的流处理框架,用于实现持久性。 Tigon应用程序可以解决网络入侵检测和分析,社交媒体市场分析,位置分析以及用户实时推荐等使用案例。 这个有指导意义的现场培训介绍了Tigon的混合实时和批处理的方法,因为它会让参与者通过创建示例应用程序。 在培训结束后,参与者将能够: 创建强大的流处理应用程序来处理大量数据流程流源,例如Twitter和Web服务器日志使用Tigon快速连接,过滤和聚合流 听众 开发商 课程的格式 部分讲座,部分讨论,练习和沉重的练习
21小时
课程概览
Teradata是流行的关系Database Management系统之一。它主要适用于构建大规模数据仓库应用程序。 Teradata通过并行概念实现了这一目标。

本课程向Teradata的代表介绍。
大数据,培训,课程,培训课程, 企业大数据培训, 短期大数据培训, 大数据课程, 大数据周末培训, 大数据晚上培训, 大数据训练, 学习大数据, 大数据老师, 学大数据班, 大数据远程教育, 一对一大数据课程, 小组大数据课程, 大数据培训师, 大数据辅导班, 大数据教程, 大数据私教, 大数据辅导, 大数据讲师Big Data,培训,课程,培训课程, 企业Big Data培训, 短期Big Data培训, Big Data课程, Big Data周末培训, Big Data晚上培训, Big Data训练, 学习Big Data, Big Data老师, 学Big Data班, Big Data远程教育, 一对一Big Data课程, 小组Big Data课程, Big Data培训师, Big Data辅导班, Big Data教程, Big Data私教, Big Data辅导, Big Data讲师

促销课程

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!