Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
课程大纲
每日主题细分:(每节课2小时)
第 1 天:第 1 节:电信业为何使用大数据的业务概述 Business Intelligence。
- 来自 T-Mobile、Verizon 等的案例研究。
- 北美电信公司的大数据适应率,以及他们如何围绕大数据BI调整未来的业务模式和运营
- 广泛的应用领域
- 网络和服务管理
- 客户流失 Management
- 数据集成和仪表板可视化
- 欺诈管理
- 业务规则生成
- 客户画像
- 本地化广告推送
第一天:第二节:Big Data-1介绍
- 大数据的主要特征——数量、种类、速度和准确性。卷的 MPP 体系结构。
- 数据仓库 – 静态模式,缓慢演变的数据集
- MPP 数据库,如 Greenplum、Exadata、Teradata、Netezza、Vertica 等。
- 基于Hadoop的解决方案 – 对数据集的结构没有条件。
- 典型模式:HDFS、MapReduce(crunch)、从 HDFS 检索
- 批处理 - 适用于分析/非交互式
- 卷 : CEP 流数据
- 典型选择 – CEP 产品(例如 Infostreams、Apama、MarkLogic 等)
- 生产准备不足 – Storm/S4
- NoSQL 数据库 – (列式和键值):最适合作为数据仓库/数据库的分析辅助工具
第 1 天:第 -3 节:Big Data-2 简介
否SQL解决方案
- KV Store - Keyspace、Flare、SchemaFree、RAMCloud、Oracle NoSQL 数据库 (OnDB)
- KV 商店 - Dynamo、Voldemort、Dynomite、SubRecord、Mo8onDb、DovetailDB
- KV 存储(分层)- GT.m、缓存
- KV Store(已订购)- TokyoTyrant、Lightcloud、NMDB、Luxio、MemcacheDB、Actord
- KV 缓存 - Memcached、Repcached、Coherence、Infinispan、EXtremeScale、JBossCache、Velocity、Terracoqua
- 元组存储 - Gigaspaces、Coord、Apache River
- 对象数据库 - ZopeDB、DB40、Shoal
- 文档存储 - CouchDB、Cloudant、Couchbase、MongoDB、Jackrabbit、XML-Databases、ThruDB、CloudKit、Prsevere、Riak-Basho、Scalaris
- 广泛的列式存储 - BigTable、HBase、Apache Cassandra、Hypertable、KAI、OpenNeptune、Qbase、KDI
数据的种类:大数据中的Data Cleaning问题简介
- RDBMS – 静态结构/模式,不提倡敏捷、探索性环境。
- NoSQL – 半结构化的,足够的结构来存储数据,在存储数据之前没有精确的模式
- 数据清理问题
第一天:第四节:大数据介绍-3:Hadoop
- 何时选择 Hadoop?
- 结构化 - 企业数据仓库/数据库可以存储大量数据(有成本),但会强加结构(不利于主动探索)
- SEMI 结构化数据 – 传统解决方案 (DW/DB) 难以实现
- 仓储数据 = 即使在实施后也付出了巨大的努力和静态
- 对于各种数据和数据量,在商用硬件上处理 – HADOOP
- 创建 Hadoop 集群所需的商品硬件
Map Reduce /HDFS 简介
- MapReduce – 将计算分布在多个服务器上
- HDFS – 使数据在本地可用于计算过程(具有冗余)
- 数据 – 可以是非结构化的/无模式的(与 RDBMS 不同)
- 开发人员有责任理解数据
- Programming MapReduce = 使用 Java(优点/缺点),手动将数据加载到 HDFS 中
第 2 天:会话 1.1:Spark:内存中分布式数据库
- 什么是“内存中”处理?
- 火花 SQL
- Spark SDK
- Spark API
- RDD型
- Spark 库
- 汉娜
- 如何将现有 Hadoop 系统迁移到 Spark
第 2 天会话 -1.2:Storm - Big Data 中的实时处理
- 流
- 豆芽
- 螺栓
- 拓扑
第2天:第二节:大数据Management系统
- 移动部件、计算节点启动/失败:ZooKeeper - 用于配置/协调/命名服务
- 复杂的流水线/工作流:Oozie – 管理工作流、依赖项、菊花链
- 部署、配置、群集管理、升级等(系统管理员):Ambari
- 在云中:呼啸
- 不断发展的 Big Data 跟踪平台工具
- ETL 层应用程序问题
第 2 天:第 3 节:Business Intelligence -1 中的预测分析:基础技术和基于机器学习的 BI:
- 机器学习简介
- 学习分类技术
- 贝叶斯预测准备训练文件
- 马尔可夫随机场
- 监督学习和无监督学习
- 特征提取
- 支持向量机
- 神经网络
- 强化学习
- Big Data 大变量问题 -随机森林 (RF)
- 表征学习
- 深度学习
- Big Data 自动化问题 – 多模型集成射频
- 通过 Soft10-M 实现自动化
- LDA 和主题建模
- 敏捷学习
- 基于智能体的学习 - 电信运营示例
- 分布式学习——以电信运营为例
- 用于预测分析的开源工具简介:R、Rapidminer、Mahut
- 更具可扩展性的 Analytic-Apache Hama、Spark 和 CMU Graph 实验室
第 2 天:第 4 节 预测分析生态系统 2:Telecom 中常见的预测分析问题
- 洞察分析
- 可视化分析
- 结构化预测分析
- 非结构化预测分析
- 客户画像
- 推荐引擎
- 模式检测
- 规则/场景发现 - 失败、欺诈、优化
- 发现根本原因
- 情绪分析
- CRM分析
- 网络分析
- 文本分析
- 技术辅助审查
- 欺诈分析
- 实时分析
第 3 天:第 1 天:网络运营分析——网络故障的根本原因分析、元数据服务中断、IPDR 和 CRM:
- CPU 使用率
- 内存使用情况
- QoS 队列使用情况
- 设备温度
- 接口错误
- IoS 版本
- 路由事件
- 延迟变化
- Syslog 分析
- 丢包
- 负载模拟
- 拓扑推理
- 性能阈值
- 设备陷阱
- IPDR(IP详细记录)收集和处理
- 将 IPDR 数据用于用户带宽消耗、网络接口利用率、调制解调器状态和诊断
- HFC信息
第 3 天:第 2 节:网络服务故障分析工具:
- 网络摘要仪表板:监控整体网络部署并跟踪组织的关键绩效指标
- 高峰期分析仪表板:了解推动高峰利用率的应用程序和用户趋势,并具有特定于位置的粒度
- 路由效率仪表板:通过全面了解互连和传输关系,控制网络成本并为资本项目构建业务案例
- 实时娱乐仪表板:访问重要指标,包括视频观看次数、持续时间和视频体验质量 (QoE)
- IPv6 过渡仪表板:调查 IPv6 在您的网络上的持续采用情况,并深入了解推动趋势的应用程序和设备
- 案例研究1:阿尔卡特朗讯大网络分析(BNA)数据挖掘器
- 多维移动智能(m.IQ6)
第 3 天:第 3 节:Marketing/Sales 的大数据 BI – 从销售数据中了解销售/营销:(所有这些都将通过实时预测分析演示展示)
- 识别速度最快的客户端
- 标识给定产品的客户端
- 为客户确定正确的产品集(推荐引擎)
- 市场细分技术
- 交叉销售和追加销售技术
- 客户细分技术
- 销售收入预测技术
第 3 天:第 4 节:电信首席财务官办公室需要 BI:
- CFO 办公室所需的 Business 分析工作概述
- 新投资风险分析
- 收入、利润预测
- 新客户获取预测
- 损失预测
- 财务欺诈分析(下节详述)
第 4 天:第 1 节:电信欺诈分析中 Big Data 的欺诈预防 BI:
- 带宽泄漏/带宽欺诈
- 供应商欺诈/项目多收费用
- 客户退款/索赔欺诈
- 差旅报销欺诈
第 4 天:第 2 节:从流失预测到流失预防:
- 3 种流失类型:主动/故意、轮换/偶然、被动、非自愿
- 流失客户的 3 种分类:总计、隐藏、部分
- 了解客户流失的 CRM 变量
- 客户行为数据收集
- 客户感知数据收集
- 客户人口统计数据收集
- 清理CRM数据
- 非结构化CRM数据(客户电话、工单、电子邮件)及其转换为结构化数据以进行客户流失分析
- Social Media CRM-提取客户满意度指数的新方法
- 案例研究 1 : T-Mobile USA:客户流失率降低 50%
第 4 天:第 3 节:如何使用预测分析进行客户不满意的根本原因分析:
- 案例研究 -1 : 将不满意与问题联系起来 – 会计、工程故障,如服务中断、带宽服务差
- 案例研究-2:Big Data QA 仪表板,用于跟踪来自各种参数的客户满意度指数,例如呼叫升级、问题的严重性、待处理的服务中断事件等。
第 4 天:第 4 节:Big Data 用于快速访问各种数据和显示的仪表板:
- 现有应用平台与大数据仪表盘的整合
- 大数据管理
- 大数据仪表板案例研究:Tableau 和 Pentaho
- 使用大数据应用程序推送基于位置的广告
- 跟踪系统和管理
第 5 天:第 1 节:如何证明 Big Data BI 在组织内实施的合理性:
- 定义 Big Data 实施的 ROI
- 节省分析师收集和准备数据时间的案例研究 - 提高生产力
- 客户流失带来的收入增长案例研究
- 基于位置的广告和其他定向广告的收入收益
- 一种集成的电子表格方法,用于计算 Big Data 实施的近似费用与收入收益/节省。
第 5 天:第 2 节:将遗留数据系统替换为 Big Data 系统的分步过程:
- 了解实用 Big Data 迁移路线图
- 在构建 Big Data 实现之前需要哪些重要信息
- 计算数据量、速度、多样性和准确性的不同方法有哪些
- 如何估算数据增长
- 2 家电信公司的案例研究
第 5 天:第 3 节和第 4 节:审查 Big Data 供应商并审查他们的产品。问答环节:
- 埃森哲阿尔卡特朗讯
- 亚马逊–A9
- APTEAN(前身为 CDC Software)
- 思科系统
- 克劳德拉
- 山谷
- 电磁兼容
- GoodData公司
- 番石榴
- 日立数据系统
- 霍顿工厂
- 华为
- 惠普
- IBM公司
- 信息网
- 英特尔
- Jaspersoft的
- Microsoft
- MongoDB(以前称为 10Gen)
- MU西格玛
- NetApp 的
- Opera 解决方案
- 神谕
- 贝尔塔霍
- 普拉特福拉
- Qliktech的
- 量子
- 机架空间
- 革命分析
- Salesforce的
- 树液
- SAS学院
- 西森
- 软件 AG/Terracotta
- Soft10 自动化
- Splunk的
- 平方
- Supermicro 超微
- Tableau 软件
- Teradata的
- 大分析思维
- 潮汐系统
- VMware (EMC 的一部分)
要求
- 应具备其领域内 Telecom 的业务运营和数据系统的基本知识
- 必须对 SQL/Oracle 或关系数据库有基本的了解
- 对统计学有基本的了解(在Excel级别中)
35 小时
客户评论 (3)
All the examples used and the lecturing style was on point even for a begginer i was able to understand and the training was so patient and always willing to go extra mile when in need of assistance.
Mathipa Chepape - Vodacom
课程 - Big Data Business Intelligence for Telecom and Communication Service Providers
All the examples used and the lecturing style was on point even for a begginer i was able to understand and the training was so patient and always willing to go extra mile when in need of assistance.
Mathipa Chepape - Vodacom
课程 - Big Data Business Intelligence for Telecom and Communication Service Providers
Understanding big data beter