面向政府机构的大数据商业智能培训

技术进步和信息量的增加正在改变许多行业的业务模式，包括政府机构。由于移动设备和应用、智能传感器和设备、云计算解决方案以及面向公民的门户的快速增长，政府数据生成和数字存档率正在上升。随着数字信息的扩展和复杂化，信息管理、处理、存储、安全和处置也变得更加复杂。新的捕获、搜索、发现和分析工具正在帮助组织从其非结构化数据中获得洞察。政府市场正处于一个转折点，意识到信息是一种战略资产，政府需要保护、利用和分析结构化和非结构化信息，以更好地服务和满足任务需求。随着政府领导者努力发展数据驱动的组织以成功完成任务，他们正在为跨事件、人员、流程和信息的依赖关系奠定基础。

高价值的政府解决方案将由最具颠覆性的技术组合而成：

移动设备和应用
云服务
社交商业技术和网络
大数据和分析

大数据是智能行业解决方案之一，它使政府能够通过分析大量数据（相关和不相关、结构化和非结构化）揭示的模式来做出更好的决策。

但实现这些成就远不止简单地积累大量数据。白宫科技政策办公室的Tom Kalil和Fen Zhao在OSTP博客的一篇文章中写道：“理解这些大数据量需要尖端工具和技术，能够从大量和多样化的信息流中分析和提取有用的知识。”

白宫在2012年设立了国家大数据研究与开发计划，朝着帮助机构找到这些技术迈出了一步。该计划包括超过2亿美元，以充分利用大数据的爆炸式增长及其分析工具。

大数据带来的挑战几乎与其承诺一样令人望而生畏。高效存储数据是这些挑战之一。预算总是紧张的，因此机构必须最大限度地降低每兆字节的存储成本，并确保数据易于访问，以便用户能够在需要时获取数据。备份大量数据进一步加剧了这一挑战。

有效分析数据是另一个主要挑战。许多机构采用商业工具，使他们能够筛选大量数据，发现有助于提高运营效率的趋势。（MeriTalk最近的一项研究发现，联邦IT高管认为大数据可以帮助机构节省超过5000亿美元，同时还能实现任务目标。）

定制开发的大数据工具也允许机构满足分析数据的需求。例如，橡树岭国家实验室的计算数据分析组已将其Piranha数据分析系统提供给其他机构。该系统帮助医学研究人员找到了一种可以在主动脉瘤发作前提醒医生的链接。它还用于更平凡的任务，例如筛选简历以将求职者与招聘经理联系起来。

感谢您发送咨询！我们的团队成员将很快与您联系。

感谢您发送预订！我们的团队成员将很快与您联系。

课程大纲

每节课2小时

第1天：第1节：政府机构为何需要大数据商业智能的业务概述

来自NIH、DoE的案例研究
政府机构的大数据采用率及如何围绕大数据预测分析调整未来运营
在DoD、NSA、IRS、USDA等领域的广泛应用
大数据与遗留数据的接口
预测分析中使能技术的基本理解
数据集成与仪表板可视化
欺诈管理
业务规则/欺诈检测生成
威胁检测与画像
大数据实施的成本效益分析

第1天：第2节：大数据介绍-1

大数据的主要特征——量、多样性、速度和真实性。用于处理大容量的MPP架构。
数据仓库——静态模式，缓慢演进的数据集
MPP数据库如Greenplum、Exadata、Teradata、Netezza、Vertica等
基于Hadoop的解决方案——对数据集结构无要求
典型模式：HDFS、MapReduce（处理）、从HDFS检索
批处理——适合分析/非交互式任务
流数据：CEP流数据
典型选择——CEP产品（如Infostreams、Apama、MarkLogic等）
不太成熟的产品——Storm/S4
NoSQL数据库——（列式和键值）：最适合作为数据仓库/数据库的分析辅助工具

第1天：第3节：大数据介绍-2

NoSQL解决方案

KV存储 - Keyspace、Flare、SchemaFree、RAMCloud、Oracle NoSQL Database（OnDB）
KV存储 - Dynamo、Voldemort、Dynomite、SubRecord、Mo8onDb、DovetailDB
KV存储（分层） - GT.m、Cache
KV存储（有序） - TokyoTyrant、Lightcloud、NMDB、Luxio、MemcacheDB、Actord
KV缓存 - Memcached、Repcached、Coherence、Infinispan、EXtremeScale、JBossCache、Velocity、Terracoqua
元组存储 - Gigaspaces、Coord、Apache River
对象数据库 - ZopeDB、DB40、Shoal
文档存储 - CouchDB、Cloudant、Couchbase、MongoDB、Jackrabbit、XML-Databases、ThruDB、CloudKit、Prsevere、Riak-Basho、Scalaris
宽列存储 - BigTable、HBase、Apache Cassandra、Hypertable、KAI、OpenNeptune、Qbase、KDI

数据多样性：大数据中的数据清理问题介绍

RDBMS——静态结构/模式，不支持敏捷、探索性环境。
NoSQL——半结构化，在存储数据之前有足够的结构来存储数据，而无需精确的模式
数据清理问题

第1天：第4节：大数据介绍-3：Hadoop

何时选择Hadoop？
结构化数据——企业数据仓库/数据库可以存储大量数据（但成本较高），并强加结构（不利于主动探索）
半结构化数据——传统解决方案（DW/DB）难以处理
数据仓库化=巨大的努力，即使在实施后也是静态的
对于数据多样性和大容量，在廉价硬件上进行处理——HADOOP
创建Hadoop集群所需的廉价硬件

Map Reduce /HDFS介绍

MapReduce——在多台服务器上分布式计算
HDFS——使数据在计算过程中本地可用（具有冗余）
数据——可以是非结构化/无模式的（与RDBMS不同）
开发人员负责理解数据
编程MapReduce=使用Java（优缺点），手动将数据加载到HDFS

第2天：第1节：大数据生态系统——构建大数据ETL：大数据工具的宇宙——何时使用哪种工具？

Hadoop与其他NoSQL解决方案的比较
对于交互式、随机访问数据
在Hadoop上使用Hbase（列式数据库）
随机访问数据，但有最大1 PB的限制
不适合临时分析，适合日志记录、计数、时间序列
Sqoop - 从数据库导入到Hive或HDFS（JDBC/ODBC访问）
Flume——将数据流（如日志数据）导入HDFS

第2天：第2节：大数据管理系统

移动部件，计算节点启动/失败：ZooKeeper——用于配置/协调/命名服务
复杂管道/工作流：Oozie——管理工作流、依赖关系、链式任务
部署、配置、集群管理、升级等（系统管理员）：Ambari
在云中：Whirr

第2天：第3节：商业智能中的预测分析-1：基本技术与基于机器学习的BI：

机器学习介绍
学习分类技术
贝叶斯预测——准备训练文件
支持向量机
KNN p-Tree代数与垂直挖掘
神经网络
大数据大变量问题——随机森林（RF）
大数据自动化问题——多模型集成RF
通过Soft10-M实现自动化
文本分析工具——Treeminer
敏捷学习
基于代理的学习
分布式学习
预测分析的开源工具介绍：R、Rapidminer、Mahut

第2天：第4节预测分析生态系统-2：政府中常见的预测分析问题

洞察分析
可视化分析
结构化预测分析
非结构化预测分析
威胁/欺诈/供应商画像
推荐引擎
模式检测
规则/场景发现——失败、欺诈、优化
根本原因发现
情感分析
CRM分析
网络分析
文本分析
技术辅助审查
欺诈分析
实时分析

第3天：第1节：实时和可扩展的Hadoop分析

为什么常见的分析算法在Hadoop/HDFS中失败
Apache Hama——用于批量同步分布式计算
Apache SPARK——用于实时分析的集群计算
CMU Graphics Lab2——基于图的异步分布式计算方法
KNN p-Tree代数方法，来自Treeminer，用于降低硬件操作成本

第3天：第2节：电子发现和取证工具

大数据与遗留数据的电子发现比较——成本与性能的比较
预测编码和技术辅助审查（TAR）
演示TAR产品（vMiner），了解TAR如何加快发现速度
通过HDFS加快索引速度——数据的速度
NLP或自然语言处理——各种技术和开源产品
外语电子发现——外语处理技术

第3天：第3节：大数据BI在网络安全中的应用——理解从快速数据收集到威胁识别的360度视图

理解安全分析的基础——攻击面、安全配置错误、主机防御
网络基础设施/大数据管道/实时分析响应ETL
规定性 vs 预测性——基于固定规则 vs 从元数据中自动发现威胁规则

第3天：第4节：大数据在USDA中的应用：农业中的应用

农业中的物联网（IoT）介绍——基于传感器的大数据和控制
卫星成像及其在农业中的应用介绍
整合传感器和图像数据，用于土壤肥力、种植建议和预测
农业保险与大数据
作物损失预测

第4天：第1节：政府中的大数据BI欺诈预防——欺诈分析：

欺诈分析的基本分类——基于规则 vs 预测分析
监督 vs 无监督机器学习用于欺诈模式检测
供应商欺诈/项目超额收费
医疗保险和医疗补助欺诈——索赔处理的欺诈检测技术
旅行报销欺诈
IRS退税欺诈
案例研究和实时演示将在数据可用时提供。

第4天：第2节：社交媒体分析——情报收集与分析

用于提取社交媒体数据的大数据ETL API
文本、图像、元数据和视频
从社交媒体中提取情感分析
社交媒体中的上下文和非上下文过滤
社交媒体仪表板，用于整合不同的社交媒体
社交媒体档案的自动画像
通过Treeminer工具演示每种分析。

第4天：第3节：大数据在图像处理和视频流中的应用

大数据中的图像存储技术——超过PB级数据的存储解决方案
LTFS和LTO
GPFS-LTFS（大数据图像的分层存储解决方案）
图像分析的基础
对象识别
图像分割
运动跟踪
3D图像重建

第4天：第4节：大数据在NIH中的应用：

生物信息学的新兴领域
元基因组学与大数据挖掘问题
大数据预测分析在药物基因组学、代谢组学和蛋白质组学中的应用
下游基因组学过程中的大数据
大数据预测分析在公共卫生中的应用

大数据仪表板，用于快速访问和显示多样化数据：

将现有应用平台与大数据仪表板集成
大数据管理
大数据仪表板案例研究：Tableau和Pentaho
使用大数据应用在政府中推送基于位置的服务
跟踪系统和管理

第5天：第1节：如何证明大数据BI在组织中的实施：

定义大数据实施的ROI
案例研究：节省分析师收集和准备数据的时间——提高生产力收益
案例研究：节省许可数据库成本带来的收益
基于位置的服务带来的收益
欺诈预防带来的节省
综合电子表格方法，计算大数据实施的近似费用与收益/节省。

第5天：第2节：逐步替换遗留数据系统为大数据系统的步骤：

理解实际的大数据迁移路线图
在架构大数据实施之前需要了解的重要信息
计算数据量、速度、多样性和真实性的不同方法
如何估算数据增长
案例研究

第5天：第4节：大数据供应商及其产品回顾。问答环节：

Accenture
APTEAN（原CDC Software）
Cisco Systems
Cloudera
Dell
EMC
GoodData Corporation
Guavus
Hitachi Data Systems
Hortonworks
HP
IBM
Informatica
Intel
Jaspersoft
Microsoft
MongoDB（原10Gen）
MU Sigma
Netapp
Opera Solutions
Oracle
Pentaho
Platfora
Qliktech
Quantum
Rackspace
Revolution Analytics
Salesforce
SAP
SAS Institute
Sisense
Software AG/Terracotta
Soft10 Automation
Splunk
Sqrrl
Supermicro
Tableau Software
Teradata
Think Big Analytics
Tidemark Systems
Treeminer
VMware（EMC的一部分）

要求

对政府领域的基本业务操作和数据系统有基本了解
对SQL/Oracle或关系数据库有基本理解
对统计学有基本理解（电子表格水平）

35 小时

需要帮助选择合适的课程吗？
china@nobleprog.com 或拨打 400 6116 540

客户评论 (1)

培训师能够根据组织的需求调整课程内容，而不仅仅是为了完成课程而提供培训。

面向政府机构的大数据商业智能 培训

课程大纲

第1天：第1节：政府机构为何需要大数据商业智能的业务概述

第1天：第2节：大数据介绍-1

第1天：第3节：大数据介绍-2

NoSQL解决方案

数据多样性：大数据中的数据清理问题介绍

第1天：第4节：大数据介绍-3：Hadoop

Map Reduce /HDFS介绍

第2天：第1节：大数据生态系统——构建大数据ETL：大数据工具的宇宙——何时使用哪种工具？

第2天：第2节：大数据管理系统

第2天：第3节：商业智能中的预测分析-1：基本技术与基于机器学习的BI：

第2天：第4节预测分析生态系统-2：政府中常见的预测分析问题

第3天：第1节：实时和可扩展的Hadoop分析

第3天：第2节：电子发现和取证工具

第3天：第3节：大数据BI在网络安全中的应用——理解从快速数据收集到威胁识别的360度视图

第3天：第4节：大数据在USDA中的应用：农业中的应用

第4天：第1节：政府中的大数据BI欺诈预防——欺诈分析：

第4天：第2节：社交媒体分析——情报收集与分析

第4天：第3节：大数据在图像处理和视频流中的应用

第4天：第4节：大数据在NIH中的应用：

大数据仪表板，用于快速访问和显示多样化数据：

第5天：第1节：如何证明大数据BI在组织中的实施：

第5天：第2节：逐步替换遗留数据系统为大数据系统的步骤：

第5天：第4节：大数据供应商及其产品回顾。问答环节：

要求

客户评论 (1)

Masilonyane - Revenue Services Lesotho

课程 - Big Data Business Intelligence for Govt. Agencies

即将举行的公开课程

面向政府机构的大数据商业智能

面向政府机构的大数据商业智能

面向政府机构的大数据商业智能

面向政府机构的大数据商业智能

面向政府机构的大数据商业智能

相关课程

Alteryx 高级

Alteryx：基础与中级 - 实用数据准备与自动化

Cognos 11

Cognos Analytics for Finance: 认证准备

物联网与边缘计算驱动的数字化转型

Edge AI 在物联网应用中的应用

Federated Learning在物联网和边缘计算中的应用

IBM Cognos Analytics

商业智能与数据分析：Metabase

Pentaho数据集成基础

Pentaho数据集成高级

Pentaho Data Integration 中级

Splunk基础

Splunk Fundamentals 2

全面掌握Splunk管理与高级应用

课程分类

大数据

商业智能

物联网（IoT）

该网站在其他国家/地区

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

面向政府机构的大数据商业智能培训