Spark RDDS

RDD(Resilient Distributed Datasets)全称为弹性分布式数据集,是一种分布的内存抽象。RDD是Spark的核心概念,它表示一个只读的记录分区集合,即一旦被创建就无法修改,只能通过RDD的转化操作产生一个新的RDD。

RDDs 的特点RDDs 的操作RDDs 的函数

最后更新于

这有帮助吗?