课程一:据科学 数据科学概览 信息文明 数据科学 分析思维 比特与数据 数据处理与数据 管理 数据处理的基础设施 数据管理的技术架构 大数据系统与数 据工程 大数据系统 统计基础与数学建模 数据挖掘与机器学习 算法 编程语言 数据工程 数据科学应用 智慧城市 人工智能
课程二:HDFS HDFS 简介、架构设计、工作机制、高可用性、Shell 命令/Java API Mapreduce Mapreduce 简介、开发入门、工作机制、高级特 性 3 Hive Hive 简介、架构设计、HiveQL 的使用 Zookeeper 分布式系统理论、Zookeeper 简介、原理与架构、 API Hbase Hbase 数据库简介与安装、Hbase 架构与功能、 Hbase 常用命令和参数、关键流程、Phoenix 介 绍 Sqoop Sqoop 简介与安装、数据导入与导出功能 Spark Spark 介绍、基础概念、Spark 原理与架构、Spark 运行模式 Nifi Nifi 介绍、原理与架构、Nifi 组建详解、DataFlow 的控制与监控 Oozie Oozie 介绍、原理与架构、实现过程 Hue Hue 介绍、原理与架构 大数据运维与调 优 集群操作系统管理、服务组件管理、组件运维操 作、运维管理平台
课程三:数据仓库概述 数据仓库简介、数据仓库设计方法论、数据仓库 应用 数据仓库一般架构 架构价值、数据仓库架构介绍、数据管理(元数 据、数据质量、任务调度、数据安全、服务监控) 数据仓库结构 与模型构建 主题与主题域、数仓建模流程与方法、数仓表分 类、数仓分层与数据分层 4 数据仓库建设规范 分层规范、表命名规范、字段命名规范、代码规 范 数据仓库建设过程 确定主题、选择软件平台、构建逻辑模型、转换 物理模型、数据模型转化步骤、数据模型优化、 数据源接入与数据清洗传输、数仓管理 数据应用范围 数据仓库优点、应用场景、行业应用举例(证券、 银行、医院) 数据仓库实际案例 ECS 电商数据仓库、BIS 实时数据仓库
课程四:BI 基础概念 商务 BI 流程、基础架构、热点应用、术语介绍、 OLAP BI 的一般框架 总体框架、技术框架、架构解释、BI/DW 方法论、 框架示例(阿里、腾讯、移动公司、微软、SAP、 IBM) BI 工具介绍 Tableau、Superset、Redash、QlikView、DataV、 DataFocus、IBM cognos、Polymaps BI 应用场景 与案例分析 制造业、零售业、电商行业、金融业、零售业、 医疗领域、地产案例分析 数据仓库方法论 数据仓库与 BI 数据体系框架 现代数据体系、OneData、OneModel、OneID、 OneService 机器学习算法入门 机器学习介绍、机器学习应用