Spark PruneDependency 依赖关系 Filter

Represents a dependency between the PartitionPruningRDD and its parent. In this case, the child RDD contains a subset of partitions of the parents'.

youtub视频演示

https://youtu.be/5ZCNiEhO_Qg (youtube视频)
https://www.bilibili.com/video/av37442139/?p=3 (bilibili)

输入数据

List(("a",2),("d",1),("b",8),("d",3)

处理程序scala

package com.opensource.bigdata.spark.local.rdd.operation.dependency.narrow.n_03_pruneDependency.n_03_filterByRange_filter

import com.opensource.bigdata.spark.local.rdd.operation.base.BaseScalaSparkContext

object Run extends BaseScalaSparkContext{

  def main(args: Array[String]): Unit = {

    val sc = pre()
    val rdd1 = sc.parallelize(List(("a",2),("d",1),("b",8),("d",3)),2)  //ParallelCollectionRDD
    val rdd2 =rdd1.filterByRange("a","b")  //MapParttionsRDD

    println("rdd \n" + rdd2.collect().mkString("\n"))

    sc.stop()
  }

}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PruneDependency.md

PruneDependency.md

Spark PruneDependency 依赖关系 Filter

更多资源

youtub视频演示

输入数据

处理程序scala

数据处理图

Files

PruneDependency.md

Latest commit

History

PruneDependency.md

File metadata and controls

Spark PruneDependency 依赖关系 Filter

更多资源

youtub视频演示

输入数据

处理程序scala

数据处理图