RDD(Resilient Distributed Datasets)全称为弹性分布式数据集,是一种分布的内存抽象。RDD是Spark的核心概念,它表示一个只读的记录分区集合,即一旦被创建就无法修改,只能通过RDD的转化操作产生一个新的RDD。
最后更新于5年前
这有帮助吗?