大数据_Spark理论视频,中软承志,Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
课程目录
01_Spark初始
02_RDD+Spark部分算子
03_Spark部分算子1
04_WordCount
05_持久化
06_Spark集群搭建
01_Spark on Standalone,Yarn
02_资源调度源码
03_RDD的宽窄依赖
04_Spark任务调度
05_Spark任务调度源码分析+ yarn
01_广播变量
02_累加器、分组取TOPN、 二次排序
03_Spark HA
04_Spark shuffle
05_Spark案例PV UV
06_Spark总结
01_自定义分区
02_Spark Demo
03_SparkSQL
04_Spark SQL连接MySQL
05_Spark on Hive整合
06_UDF UDAF开窗函数
01_SparkStreaming初始
02_Driver HA
03_SparkStraming有状态算子
04_Kafka
05_SparkStreaing 整合kafka
06_SparkStreaming动态改变广播变量的值 适用人群:有java,scala基础,想学习spark,往数据仓库,大数据挖掘、大数据spark机器学习方向发展的学员