
教程涵盖Apache生态系统的所有主流技术:Hadoop 、Hive、Spark、Flume 、Kafka、Azkaban、Zookeeper、Sqoop 、Atlas、Kylin、Presto 、Kerberos、Ranger、Zabbix等 ,均采用了最新稳定版 。数据治理内容更加全面,搭建Kerberos+Ranger的一体化权限管理系统,使用Python+Shell脚本实现自动化数据质量监控 ,使用Zabbix+Grafana实现集群性能监控,采用目前企业主流的元数据管理应用Atlas实现了数据血缘管理,保障了数仓的安全性 、一致性和可靠性。
百度:https://pan.baidu.com/s/1gFzpKNwXG4e_31_hbV-aFQ
天翼:https://cloud.189.cn/t/7BrA326bIrq2
阿里:https://www.aliyundrive.com/s/7fcxoDFTDwo