课程一:据科学
数据科学概览
信息文明
数据科学
分析思维
比特与数据
数据处理与数据
管理
数据处理的基础设施
数据管理的技术架构
大数据系统与数
据工程
大数据系统
统计基础与数学建模
数据挖掘与机器学习
算法
编程语言
数据工程
数据科学应用
智慧城市
人工智能
课程二:HDFS
HDFS 简介、架构设计、工作机制、高可用性、Shell
命令/Java API
Mapreduce
Mapreduce 简介、开发入门、工作机制、高级特
性
3
Hive Hive 简介、架构设计、HiveQL 的使用
Zookeeper
分布式系统理论、Zookeeper 简介、原理与架构、
API
Hbase
Hbase 数据库简介与安装、Hbase 架构与功能、
Hbase 常用命令和参数、关键流程、Phoenix 介
绍
Sqoop Sqoop 简介与安装、数据导入与导出功能
Spark
Spark 介绍、基础概念、Spark 原理与架构、Spark
运行模式
Nifi
Nifi 介绍、原理与架构、Nifi 组建详解、DataFlow
的控制与监控
Oozie Oozie 介绍、原理与架构、实现过程
Hue Hue 介绍、原理与架构
大数据运维与调
优
集群操作系统管理、服务组件管理、组件运维操
作、运维管理平台
课程三:数据仓库概述
数据仓库简介、数据仓库设计方法论、数据仓库
应用
数据仓库一般架构
架构价值、数据仓库架构介绍、数据管理(元数
据、数据质量、任务调度、数据安全、服务监控)
数据仓库结构
与模型构建
主题与主题域、数仓建模流程与方法、数仓表分
类、数仓分层与数据分层
4
数据仓库建设规范
分层规范、表命名规范、字段命名规范、代码规
范
数据仓库建设过程
确定主题、选择软件平台、构建逻辑模型、转换
物理模型、数据模型转化步骤、数据模型优化、
数据源接入与数据清洗传输、数仓管理
数据应用范围
数据仓库优点、应用场景、行业应用举例(证券、
银行、医院)
数据仓库实际案例 ECS 电商数据仓库、BIS 实时数据仓库
课程四:BI 基础概念
商务 BI 流程、基础架构、热点应用、术语介绍、
OLAP
BI 的一般框架
总体框架、技术框架、架构解释、BI/DW 方法论、
框架示例(阿里、腾讯、移动公司、微软、SAP、
IBM)
BI 工具介绍
Tableau、Superset、Redash、QlikView、DataV、
DataFocus、IBM cognos、Polymaps
BI 应用场景
与案例分析
制造业、零售业、电商行业、金融业、零售业、
医疗领域、地产案例分析
数据仓库方法论 数据仓库与 BI
数据体系框架
现代数据体系、OneData、OneModel、OneID、
OneService
机器学习算法入门 机器学习介绍、机器学习应用、常用