为了更好管理数据,出现数据湖DataLake:用来存储大量的原始数据。当下最流行数据湖框架Apache Hudi,使用HDFS存储数据,集成Spark、Flink、Hive等分析数据,逐步在大中型公司中使用,构建湖仓一体化架构。为了让大家更好学习使用Hudi,基于0.9.0版本,推出本套课程,从数据湖概念,到集成Spark和Flink,最后整合实际需求案例,由0到1深入浅出剖析Hudi使用
课程目录
1.Hudi 基础入门篇视频
00--Apache Hudi 课程内容提纲.mp4
01--Hudi 基础入门篇--课程内容大纲和学习目标.wmv
02--为什么要学习Apache Hudi--什么是数据湖DataLake.wmv
03--为什么要学习Apache Hudi--数据仓库和数据湖区别.wmv
04--为什么要学习Apache Hudi--三大流式数据湖框架.wmv
05--为什么要学习Apache Hudi--Hudi 框架基本介绍.wmv
06--为什么要学习Apache Hudi--Hudi 快速发展.wmv
07--Hudi 快速体验使用--编译Hudi 源码.wmv
08--Hudi 快速体验使用--大数据环境准备概述.wmv
09--Hudi 快速体验使用--HDFS 安装部署测试.wmv
10--Hudi 快速体验使用--Spark 安装部署测试.wmv
11--Hudi 快速体验使用--启动spark-shell添加jar包.wmv
12--Hudi 快速体验使用--模拟产生乘车Trip数据.wmv
13--Hudi 快速体验使用--保存数据到Hudi表.wmv
14--Hudi 快速体验使用--查询Hudi表数据.wmv
15--Hudi 快速体验使用--初识Hudi数据管理.wmv
16--基于IDEA编程使用Hudi--构建Maven模块环境.wmv
17--基于IDEA编程使用Hudi--模拟数据并插入Insert.wmv
18--基于IDEA编程使用Hudi--快照查询及日期时间过滤查询.wmv
19--基于IDEA编程使用Hudi--更新数据Update.wmv
20--基于IDEA编程使用Hudi--增量查询Incremental数据.wmv
21--基于IDEA编程使用Hudi--删除数据Delete.wmv
22--Apache Hudi 核心概念剖析--三大基本概念.wmv
23--Apache Hudi 核心概念剖析--数据计算三种模型.wmv
24--Apache Hudi 核心概念剖析--Hudi数据三种查询类型.wmv
25--Apache Hudi 核心概念剖析--COW 类型表.wmv
26--Apache Hudi 核心概念剖析--MOR 类型表.wmv
27--Apache Hudi 核心概念剖析--数据写操作流程.wmv
28--Hudi 基础入门篇--课程内容内容总结和作业.mp4
2.Hudi 应用进阶篇(Spark 集成)视频
01--Hudi 应用进阶篇之集成Spark--课程内容大纲和学习目标.wmv
02--大数据环境准备--离线tar安装MySQL 5.7.wmv
03--大数据环境准备--安装部署Hive.wmv
04--大数据环境准备--安装部署Zookeeper.wmv
05--大数据环境准备--安装部署Kafka.wmv
06--滴滴运营数据分析--业务数据调研和需求分析.wmv
07--滴滴运营数据分析--构建开发环境.wmv
08--滴滴运营数据分析--工具类SparkUtils.wmv
09--滴滴运营数据分析--日期转换星期测试.wmv
10--滴滴运营数据分析--业务数据加载存储--思路分析.wmv
11--滴滴运营数据分析--业务数据加载存储--加载CSV数据.wmv
12--滴滴运营数据分析--业务数据加载存储--数据ETL转换.wmv
13--滴滴运营数据分析--业务数据加载存储--保存Hudi表.wmv
14--滴滴运营数据分析--指标查询分析--加载Hudi表数据.wmv
15--滴滴运营数据分析--指标查询分析--订单类型统计.wmv
16--滴滴运营数据分析--指标查询分析--订单时效性统计.wmv
17--滴滴运营数据分析--指标查询分析--订单交通类型统计.wmv
18--滴滴运营数据分析--指标查询分析--订单价格区间统计.wmv
19--滴滴运营数据分析--指标查询分析--订单距离区间统计.wmv
20--滴滴运营数据分析--指标查询分析--订单星期统计.wmv
21--滴滴运营数据分析--集成Hive查询--创建表和添加分区.wmv
22--滴滴运营数据分析--集成Hive查询--编写SQL指标分析.wmv
23--结构化流写入Hudi--模拟交易订单数据和流程分析.wmv
24--结构化流写入Hudi--流式程序开发.wmv
25--结构化流写入Hudi--订单数据查询分析.wmv
26--结构化流写入Hudi--工具类DeltaStreamer.wmv
27--集成 SparkSQL--快速体验数据CRUD.wmv
28--集成 SparkSQL--创建表方式.wmv
29--集成 SparkSQL--MergeInto语句.wmv
30--Hudi 应用进阶篇之集成Spark--课程内容内容总结和作业.wmv
3.Hudi 应用进阶篇(Flink 集成)视频
01--Hudi 应用进阶篇之集成Flink--课程内容大纲和学习目标.wmv
02--快速入门使用--Flink Standalone 集群安装部署.wmv
03--快速入门使用--集成方式及启动SQL Client.wmv
04--快速入门使用--创建表及数据插入更新查询.wmv
05--快速入门使用--流式查询StreamingQuery.wmv
06--Flink SQL Writer--Flink SQL集成Kafka.wmv
07--Flink SQL Writer--构建Maven开发环境.wmv
08--Flink SQL Writer--采用Flink SQL编程加载Kafka数据.wmv
09--Flink SQL Writer--编程实现数据实时增量存储Hudi表.wmv
10--Flink SQL Writer--编程实现流式增量读取Hudi表数据.wmv
11--Flink SQL Client 写入Hudi--整体思路流程及环境配置.wmv
12--Flink SQL Client 写入Hudi--编写DDL和DML语句数据实时入湖Hudi.wmv
13--Flink CDC Hudi--CDC 概念和类型.wmv
14--Flink CDC Hudi--重新编译Hudi源码集成Flink与Hive.wmv
15--Flink CDC Hudi--开启MySQL binlog和创建表.wmv
16--Flink CDC Hudi--使用Flink CDC创建表及测试.wmv
17--Flink CDC Hudi--创建视图View存储中间数据.wmv
18--Flink CDC Hudi--插入视图数据插入Hudi表.wmv
19--Flink CDC Hudi--使用Hive查询Hudi表数据.wmv
20--Flink CDC Hudi--Hudi管理命令hudi-cli使用.wmv
21--Hudi 应用进阶篇之集成Flink--课程内容内容总结和作业.wmv
资料-2022数据湖架构开发Hudi
HudiLinux.zip
第1部分、Hudi 基础入门篇-资料.rar
第2部分、Hudi 应用进阶篇(Spark 集成)-资料.rar
第3部分、Hudi 应用进阶篇(Flink 集成)-资料.rar