一 spark基础
1.spark特点
2.spark架构
3.spark部署
4.代码执行流程
先由driver构建sparkcontext对象,再由executor分布式执行,结果汇集到driver上输出
二 sparkcore
1.RDD
2.RDD算子
3.宽窄依赖p100
4.spark内存计算
三.sparksql
1.spark SQL和sparkRDD区别p107
2.入口全用spark session
3.dataframe组成
4.执行流程
详细spark SQL详细流程 p135
5.Catalyst优化器 p134 18分