大数据培训课程 | Big Data培训课程

大数据培训课程

由讲师进行实时指导的大数据本地培训课程将首先介绍大数据的元素概念,然后介绍用于执行数据分析的编程语言和方法。在课程的演示练习环节,我们会讨论、比较并使用用于实现大数据存储、分布式处理、可伸缩性的工具和基础架构。

大数据培训形式包括“现场实时培训”和“远程实时培训”。现场实时培训可在客户位于中国的所在场所或NobleProg位于中国的企业培训中心进行,远程实时培训可通过交互式远程桌面进行。

NobleProg -- 您的本地培训提供商

客户评论

★★★★★
★★★★★

大数据课程大纲

课程名称
课程时长
课程概览
课程名称
课程时长
课程概览
21小时
Python是数据科学和机械学习的可扩展、灵活和广泛使用的编程语言。 Spark 是一款用于查询、分析和转换大数据的数据处理引擎,而 Hadoop 是用于大规模数据存储和处理的软件图书馆框架。 由教练引导,现场培训(在线或在线)旨在开发人员想要使用和整合Spark,(0)和(1)来处理,分析和转型大型和复杂的数据集。 在本研讨会结束后,参与者将能够:
    设置必要的环境,以便在 Spark, Hadoop, 和 Python 开始处理大数据。 了解Spark和0的特性、核心组件和建筑。 了解如何集成 Spark, Hadoop, 和 Python 大数据处理。 探索Spark生态系统中的工具(Spark MlLib, Spark Streaming,Kafka,Sqoop,Kafka,和Flume)。 建立协作过滤推荐系统类似于(3)、YouTube、Amazon、Spotify和(2)ogle。 使用 Apache Mahout 来扩展机器学习算法。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
14小时
Waikato Environment for Knowledge Analysis(0)是一款开源数据挖掘视觉软件。 它为数据编制、分类、分类和其他数据采矿活动提供了机器学习算法的集合。 由教练领导的现场培训(在线或在线)针对数据分析师和数据科学家,他们希望使用 Weka 进行数据采矿任务。 在本研讨会结束后,参与者将能够:
    安置和配置(0)。 了解 Weka 环境和工作组。 使用数据挖掘任务(0)进行数据挖掘任务。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
14小时
IBM SPSS Modeler 是用于数据采矿和文本分析的软件。 它提供了一系列数据采矿工具,可以构建预测模型,并执行数据分析任务。 由教练领导的现场培训(在线或在线)是针对数据分析师或任何想要使用 SPSS Modeler 进行数据采矿活动的人。 在本研讨会结束后,参与者将能够:
    了解数据采矿的基础。 了解如何在模型器中导入和评估数据质量。 有效地开发、部署和评估数据模型。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
35小时
参与者完成此次培训后,将会对大数据及其相关技术、方法、工具有一个实际和真实的理解。 参与者将有机会通过动手练习将这些知识付诸实践。小组互动和讲师反馈是课堂的重要组成部分。 本课程首先介绍大数据的基本概念,然后讲解用于执行数据分析的编程语言和方法,最后我们会讨论可启用大数据存储、分布式处理及可扩展性的工具和基础架构。 受众
  • 开发人员/程序员
  • IT顾问
课程形式
  • 部分讲座、部分讨论、实操、偶尔测评进度
21小时
In this instructor-led, live training in 中国, participants will learn how to use Python and Spark together to analyze big data as they work on hands-on exercises. By the end of this training, participants will be able to:
  • Learn how to use Spark with Python to analyze Big Data.
  • Work on exercises that mimic real world cases.
  • Use different tools and techniques for big data analysis using PySpark.
7小时
This course covers how to use Hive SQL language (AKA: Hive HQL, SQL on Hive, HiveQL) for people who extract data from Hive
21小时
数据库中的知识发现(KDD)是从数据收集中发现有用的知识的过程。 这些数据采矿技术的实用应用包括营销、欺诈检测、电信和制造。 在本导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导 观众
    数据分析师或任何有兴趣学习如何解释数据以解决问题的人
课程格式
    经过对KDD的理论讨论后,教练将介绍现实生活的案例,要求KDD的应用解决问题。 参与者将准备、选择和清理样品数据集,并使用他们对数据的先前知识,以根据他们的观察结果提出解决方案。
14小时
Apache Kylin是大数据的极端分布分析引擎。 在这项由导师领导的现场培训中,参与者将学习如何使用 Apache Kylin 设置实时数据库。 在本研讨会结束后,参与者将能够:
    使用Kylin使用实时流媒体数据 使用 Apache Kylin's 强大的功能, 丰富的 SQL 界面, spark cubing 和 subsecond 查询 latency
笔记
    我们使用Kylin的最新版本(根据这篇文章, Apache Kylin v2.0)
观众
    大数据工程师 [ ] 分析师
课程格式
    部分讲座,部分讨论,练习和重实习
14小时
Datameer是基于Hadoop构建的商业智能和分析平台。它允许最终用户以易用的方式访问,探索和关联大规模,结构化,半结构化和非结构化数据。 在这个有指导意义的实时培训中,参与者将学习如何使用Datameer来克服Hadoop陡峭的学习曲线,因为他们将逐步完成对一系列大数据源的设置和分析。 在培训结束后,参与者将能够: 创建,策划和交互式地探索企业数据湖访问商业智能数据仓库,交易数据库和其他分析商店使用电子表格用户界面设计端对端数据处理管道访问预建功能来探索复杂的数据关系使用拖放式向导来可视化数据并创建仪表板使用表格,图表,图形和地图来分析查询结果 听众 数据分析师 课程的格式 部分讲座,部分讨论,练习和沉重的练习
14小时
数据挖掘是使用诸如机器学习之类的数据科学方法识别大数据中的模式的过程。使用Excel作为数据分析套件,用户可以执行数据挖掘和分析。 这种由讲师指导的实时培训(现场或远程)针对希望使用Excel进行数据挖掘的数据科学家。 在培训结束时,参与者将能够:
  • 使用Excel探索数据以执行数据挖掘和分析。
  • 使用Microsoft算法进行数据挖掘。
  • 了解Excel数据挖掘中的概念。
课程形式
  • 互动式讲座和讨论。
  • 很多练习和练习。
  • 在现场实验室环境中动手实施。
课程自定义选项
  • 要请求此课程的定制培训,请与我们联系以安排。
21小时
Dremio 是一个开源的数据平台,加速各种类型的数据来源的查询。 Dremio集成与相对数据库,Apache Hadoop, MongoDB,Amazon S3,ElasticSearch,以及其他数据来源。 它支持 SQL 并为构建查询提供 Web UI。 在本由导师领导的现场培训中,参与者将学习如何安装、配置和使用(7)作为数据分析工具和基础数据库的统一层。 在本研讨会结束后,参与者将能够:
    安装和配置(7) 对多个数据来源进行查询,无论位置、大小或结构如何 集成 Dremio 与 BI 和数据来源,如 Tableau 和 Elasticsearch
观众
    数据科学家 (四)分析师 数据工程师
课程格式
    部分讲座,部分讨论,练习和重实习
笔记
    要申请此课程的定制培训,请联系我们安排。
14小时
The objective of the course is to enable participants to gain a mastery of how to work with the SQL language in Oracle database for data extraction at intermediate level.
21小时
Apache Drill是一种无模式、分布式、内存列式SQL查询引擎,用于Hadoop、NoSQL及其他云和文件存储系统。Apache Drill的强大之处在于它能够使用单个查询连接来自多个数据存储的数据。Apache Drill支持许多NoSQL数据库和文件系统,包括HBase、MongoDB、MapR-DB、HDFS、MapR-FS、Amazon S3、Azure Blob Storage、Google Cloud Storage、Swift、NAS和本地文件。 在这一由讲师引导的现场培训中,学员将学习Apache Drill的基础知识,然后利用SQL的强大功能和便利性在无需编写代码的情况下交互式查询大数据。学员还将学习如何优化分布式SQL执行的Drill查询。 在本次培训结束后,学员将能够:
  • 对Hadoop上的结构化和半结构化数据进行“自助式”探索
  • 使用SQL查询来查询已知以及未知数据
  • 了解Apache Drills如何接收和执行查询
  • 编写SQL查询来分析不同类型的数据,包括Hive中的结构化数据,HBase或MapR-DB表中的半结构化数据,以及Parquet和JSON文件中保存的数据。
  • 使用Apache Drill执行即时模式发现,绕过对复杂ETL和模式操作的需求
  • 将Apache Drill与BI(商业智能)工具(如Tableau、Qlikview、MicroStrategy、Excel)集成在一起
受众
  • 数据分析师
  • 数据科学家
  • SQL程序员
课程形式
  • 部分讲座、部分讨论、练习和大量实操
14小时
Apache Arrow is an open-source in-memory data processing framework. It is often used together with other data science tools for accessing disparate data stores for analysis. It integrates well with other technologies such as GPU databases, machine learning libraries and tools, execution engines, and data visualization frameworks. In this onsite instructor-led, live training, participants will learn how to integrate Apache Arrow with various Data Science frameworks to access data from disparate data sources. By the end of this training, participants will be able to:
  • Install and configure Apache Arrow in a distributed clustered environment
  • Use Apache Arrow to access data from disparate data sources
  • Use Apache Arrow to bypass the need for constructing and maintaining complex ETL pipelines
  • Analyze data across disparate data sources without having to consolidate it into a centralized repository
Audience
  • Data scientists
  • Data engineers
Format of the Course
  • Part lecture, part discussion, exercises and heavy hands-on practice
Note
  • To request a customized training for this course, please contact us to arrange.
35小时
Advances in technologies and the increasing amount of information are transforming how business is conducted in many industries, including government. Government data generation and digital archiving rates are on the rise due to the rapid growth of mobile devices and applications, smart sensors and devices, cloud computing solutions, and citizen-facing portals. As digital information expands and becomes more complex, information management, processing, storage, security, and disposition become more complex as well. New capture, search, discovery, and analysis tools are helping organizations gain insights from their unstructured data. The government market is at a tipping point, realizing that information is a strategic asset, and government needs to protect, leverage, and analyze both structured and unstructured information to better serve and meet mission requirements. As government leaders strive to evolve data-driven organizations to successfully accomplish mission, they are laying the groundwork to correlate dependencies across events, people, processes, and information. High-value government solutions will be created from a mashup of the most disruptive technologies:
  • Mobile devices and applications
  • Cloud services
  • Social business technologies and networking
  • Big Data and analytics
IDC predicts that by 2020, the IT industry will reach $5 trillion, approximately $1.7 trillion larger than today, and that 80% of the industry's growth will be driven by these 3rd Platform technologies. In the long term, these technologies will be key tools for dealing with the complexity of increased digital information. Big Data is one of the intelligent industry solutions and allows government to make better decisions by taking action based on patterns revealed by analyzing large volumes of data — related and unrelated, structured and unstructured. But accomplishing these feats takes far more than simply accumulating massive quantities of data.“Making sense of thesevolumes of Big Datarequires cutting-edge tools and technologies that can analyze and extract useful knowledge from vast and diverse streams of information,” Tom Kalil and Fen Zhao of the White House Office of Science and Technology Policy wrote in a post on the OSTP Blog. The White House took a step toward helping agencies find these technologies when it established the National Big Data Research and Development Initiative in 2012. The initiative included more than $200 million to make the most of the explosion of Big Data and the tools needed to analyze it. The challenges that Big Data poses are nearly as daunting as its promise is encouraging. Storing data efficiently is one of these challenges. As always, budgets are tight, so agencies must minimize the per-megabyte price of storage and keep the data within easy access so that users can get it when they want it and how they need it. Backing up massive quantities of data heightens the challenge. Analyzing the data effectively is another major challenge. Many agencies employ commercial tools that enable them to sift through the mountains of data, spotting trends that can help them operate more efficiently. (A recent study by MeriTalk found that federal IT executives think Big Data could help agencies save more than $500 billion while also fulfilling mission objectives.). Custom-developed Big Data tools also are allowing agencies to address the need to analyze their data. For example, the Oak Ridge National Laboratory’s Computational Data Analytics Group has made its Piranha data analytics system available to other agencies. The system has helped medical researchers find a link that can alert doctors to aortic aneurysms before they strike. It’s also used for more mundane tasks, such as sifting through résumés to connect job candidates with hiring managers.
21小时
听众如果您试图理解您可以访问或想要分析网络上可用的非结构化数据(如Twitter,链接等等),那么本课程适合您。 它主要针对需要选择哪些数据值得收集以及值得分析的决策者和人员。 它不是针对人们配置解决方案,但这些人将从大局中受益。 交货方式在课程期间,代表们将获得大多数开源技术的工作示例。 讲座后将进行简短的讲座,参加者将进行简单的练习使用的内容和软件每次运行课程时都会更新所有使用的软件,因此我们会检查最新版本。 它涵盖了从获取,格式化,处理和分析数据的过程,以解释如何使用机器学习自动化决策制定过程。
35小时
第1天 - 提供重要的Big Data主题领域的高级概述。该模块分为一系列部分,每个部分都附有实践练习。 第2天 - 探讨一系列与Big Data环境相关的分析实践和工具的主题。它没有涉及实现或编程细节,而是将概念保持在概念层面,重点放在使参与者能够全面了解Big Data解决方案提供的常见分析功能和特性的主题上。 第3天 - 概述与Big Data解决方案平台架构相关的基本和必要主题领域。它涵盖了开发Big Data解决方案平台所需的Big Data机制以及用于组装数据处理平台的架构选项。还提供了常见方案,以便基本了解Big Data解决方案平台的使用方式。 第4天 - 通过探索与Big Data解决方案平台架构相关的高级主题,在第3天构建。特别是,介绍和讨论了构成Big Data解决方案平台的不同架构层,包括数据源,数据入口,数据存储,数据处理和安全性。 第5天 - 涵盖了一系列练习和问题,旨在测试代表们应用第3天和第4天所涵盖主题知识的能力。
21小时
Big Data是指用于存储和处理大型数据集的解决方案。最初由Go ogle开发,这些Big Data解决方案已经发展并激发了其他类似的项目,其中许多项目都是开源的。 R是金融行业中流行的编程语言。
14小时
当传统存储技术无法处理您需要存储的数据量时,就会有大量的替代方案。本课程试图引导参与者存储和分析Big Data替代方案以及他们的优缺点。 本课程主要侧重于解决方案的讨论和介绍,但可根据需要提供动手练习。
14小时
该课程是数据科学家技能集(领域:数据和技术)的一部分。
35小时
大数据是如此庞大和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新和信息隐私。
14小时
Vespa是由雅虎创建的开源大数据处理和服务引擎。它用于响应用户查询,提出建议,并实时提供个性化内容和广告。 这种有指导意义的实时培训引入了服务大型数据的挑战,并通过创建可实时计算大型数据集中的用户请求响应的应用程序来引导参与者。 在培训结束后,参与者将能够: 使用Vespa可以在用户等待时在服务时间快速计算数据(存储,搜索,排名,组织) 将Vespa实施到涉及功能搜索,建议和个性化的现有应用程序中将Vespa与现有的大数据系统(如Hadoop和Storm)集成并部署。 听众 开发商 课程的格式 部分讲座,部分讨论,练习和沉重的练习
14小时
为了满足监管机构的合规要求,CSP( Communication服务提供商)可以利用大数据分析,这不仅可以帮助他们满足合规性,而且在同一项目的范围内,他们可以提高客户满意度,从而减少客户流失。事实上,由于合规性与合同相关的服务质量有关,因此任何实现合规性的举措都将提高CSP的“竞争优势”。因此,监管机构应该能够为监管机构和CSP之间互利的CSP建议/指导一套Big Data分析实践,这一点非常重要。 该课程包括8个模块(第1天4个,第2天4个)
35小时
技术的进步和越来越多的信息正在改变执法的方式。 Big Data带来的挑战几乎与Big Data的承诺一样令人生畏。有效存储数据是这些挑战之一;有效地分析它是另一回事。 在以讲师为主导的现场培训中,参与者将学习处理Big Data技术的思维方式,评估其对现有流程和政策的影响,并实施这些技术,以识别犯罪活动和预防犯罪。将审查世界各地执法组织的案例研究,以深入了解其采用方法,挑战和结果。 在培训结束时,参与者将能够:
  • 将Big Data技术与传统的数据收集流程相结合,在调查过程中拼凑出一个故事
  • 实施工业大数据存储和处理数据分析解决方案
  • 准备一份提案,以采用最适当的工具和程序,使数据驱动的方法能够进行刑事调查
听众
  • 具有技术背景的执法专家
课程形式
  • 部分讲座,部分讨论,练习和繁重的实践练习
14小时
这个基于课堂的培训课程将探索Big Data 。代表们将使用基于计算机的示例和案例研究练习来使用相关的大数据工具
14小时
目标 :该培训课程旨在帮助与会者了解为什么Big Data正在改变我们的生活,以及它如何改变企业将我们视为消费者的方式。实际上,企业中的大数据用户发现大数据释放出大量信息和见解,从而转化为更高的利润,更低的成本和更低的风险。然而,缺点是有时候在过分强调个别技术并且没有足够关注大数据管理的支柱时会感到沮丧。 与会者将在本课程中学习如何使用数据集成,数据治理和数据安全三大支柱管理大数据,以便将大数据转化为实际业务价值。对客户管理案例研究进行的不同练习将有助于与会者更好地理解基础流程。
7小时
这一由讲师指导的实时培训(现场或远程)面向的是希望学习如何实施机器学习策略同时最大限度地利用大数据的技术人员。 在本次培训结束后,学员将能够:
  • 了解机器学习的发展和趋势。
  • 了解机器学习如何在不同行业中使用。
  • 熟悉在组织内实现机器学习的工具、技能、服务。
  • 了解机器学习如何用于增强数据挖掘和分析。
  • 了解数据中台是什么,以及企业如何使用它。
  • 了解大数据和智能应用程序在各个行业中的作用。
课程形式
  • 互动讲座和讨论。
  • 大量练习和实操。
  • 在现场实验室环境中动手实现。
课程自定义选项
  • 如需本课程的定制培训,请联系我们以作安排。
7小时
Apache Sqoop是一个命令行接口,用于从关系数据库和Hadoop移动数据。Apache Flume是一种用于管理大数据的分布式软件。使用 Sqoop 和 Flume,用户可以在系统之间传输数据,并将大数据导入存储体系结构,如Hadoop。 此讲师指导的现场培训(现场或远程)针对的软件工程师,他们希望使用 Sqoop 和 Flume 在系统之间传输数据。 培训结束时,学员将能够:
  • 使用 Sqoop 和 Flume 引入大数据。
  • 从多个数据源中引入数据。
  • 将数据从关系数据库移动到 HDFS 和Hive。
  • 将数据从 HDFS 导出到关系数据库。
课程格式
  • 互动讲座和讨论。
  • 大量的练习和练习。
  • 在实时实验室环境中实际实现。
课程自定义选项
  • 如需申请本课程的定制培训,请联系我们安排。
28小时
Talend Open Studio for Big Data 是用于大数据处理的开源 ETL 工具。 它包括一个发展环境与 Big Data 来源和目标互动,并运行工作,而无需编写代码。 由教练领导,现场培训(在线或在线)旨在技术人员谁希望部署 Talend Open Studio for Big Data 以简化阅读和阅读过程通过 Big Data 。 在本研讨会结束后,参与者将能够:
    安装和设置 Talend Open Studio for Big Data. 连接到(0)系统,如Cloudera、HortonWorks、MapR、Amazon EMR 和 Apache。 了解并设置 Open Studio 的大数据组件和连接器。 设置参数以自动生成 MapReduce 代码。 使用 Open Studio's drag-and-drop 界面运行 Hadoop 工作。 原型大数据管道 自动化大数据集成项目。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
21小时
The course is dedicated to IT specialists that are looking for a solution to store and process large data sets in distributed system environment Course goal: Getting knowledge regarding Hadoop cluster administration

Last Updated:

大数据,培训,课程,培训课程, 企业大数据培训, 短期大数据培训, 大数据课程, 大数据周末培训, 大数据晚上培训, 大数据训练, 学习大数据, 大数据老师, 学大数据班, 大数据远程教育, 一对一大数据课程, 小组大数据课程, 大数据培训师, 大数据辅导班, 大数据教程, 大数据私教, 大数据辅导, 大数据讲师Big Data,培训,课程,培训课程, 企业Big Data培训, 短期Big Data培训, Big Data课程, Big Data周末培训, Big Data晚上培训, Big Data训练, 学习Big Data, Big Data老师, 学Big Data班, Big Data远程教育, 一对一Big Data课程, 小组Big Data课程, Big Data培训师, Big Data辅导班, Big Data教程, Big Data私教, Big Data辅导, Big Data讲师

促销课程

目前没有课程折扣

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

该网站在其他国家/地区