"Spark的相关理论详谈(二)"的笔记

什么是学习笔记?

你在学习中想写的批注、摘抄及随感。
Spark的相关理论详谈(二), Spark的编程套路: 1.获取编程入口 SparkContext SqlContext/HiveContext StreamingContext 2.通过编程入口加载数据 RDD DataFrame DataSet 3.对数据进行处理得到结果 各种算子(30个) 4.对结果进行处理 测试:打印 线上:存储到各种数据存储地(文件系统+数据库) 5.关闭编程入口