spark学习笔记

spark 学习笔记

基本概念

环境配置

是可以在不安装Hadoop的情况下,直接单击运行spark。可以直观的感受下。

框架结构

streaming MLlib sparkSql Graphx

RDD弹性分布式数据集

task,stage,job

作业运行流程

#