GitHub - haosky/SparkCommonTools: any usage for spark common tools

Description

By RDD Partition execution

MySQL Upsert Support / Customize SQL execution
MongoDB Upsert Support /Customize Document execution

How To Use

  val rddz = spark.sparkContext.parallelize(Seq(Row(1,"a3","1"),Row(2,"bzzz","1"),Row(3,"a43","2"),Row(4,"a","634")))
  val struct =
      StructType(
        StructField("id", IntegerType, true) ::
          StructField("c1", StringType, false) ::
          StructField("c2", StringType, false) :: Nil)

    // generate Sql
    val sql = MySQLGen.mkUpsertSql(table ,struct)
    println(sql)
    // INSERT INTO testa (id,c1,c2) VALUES (?,?,?) ON DUPLICATE KEY UPDATE  id = values( id), c1 = values( c1), c2 = values( c2)
    
    // mapping configuration
    val reConfig = spark.sparkContext.getConf.setAll(Map(
      "spark.mysql.url" -> outMyqlUrl,
      "spark.mysql.password" -> outPassword,
      "spark.mysql.user" -> outUsername,
      "spark.mysql.sql" -> sql,
      "spark.mysql.driver" -> outMysqlDriverClass
    ))

    // Implicit execution on partition batch SQL statement
    MySQLWriter.MySQLSparkExecute(rddz,reConfig,struct)

    // Explicit execution on partition batch SQL statement
    val rddData =  spark.sparkContext.parallelize(Seq((1,"a3","1"),(2,"bzzz","1"),(3,"a43","2"),(4,"a","634")))
    MySQLWriter.MySQLSparkExecute[(Int,String,String)](rddData,reConfig,(unit,ps) => {
          ps.setInt(1,unit._1)
          ps.setString(2,unit._2)
          ps.setString(3,unit._3)

          ps.addBatch()
      })

Install

Maven pom.xml adding SparkCommonTools as a dependency.

<dependency>
    <groupId>com.haooho.spark</groupId>
    <artifactId>SparkCommonTools</artifactId>
    <version>1.1</version>
</dependency>

default version of dependencies

<spark.version>2.4.0</spark.version>
<hadoop.version>3.0.0</hadoop.version>
<scala.binary.version>2.11</scala.binary.version>
<scala.library.version>2.11.12</scala.library.version>
<log4j.version>2.12.1</log4j.version>
<target.java.version>1.8</target.java.version>

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
src/main/scala/com/haooho/spark		src/main/scala/com/haooho/spark
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

src/main/scala/com/haooho/spark

src/main/scala/com/haooho/spark

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

pom.xml

pom.xml

Repository files navigation

Description

How To Use

Install

Maven pom.xml adding SparkCommonTools as a dependency.

default version of dependencies

Please review

Contributing

Pull requests for new features, bug fixes, and suggestions are welcome!

License

About

Releases 1

Packages

Languages

License

haosky/SparkCommonTools

Folders and files

Latest commit

History

Repository files navigation

Description

How To Use

Install

Maven pom.xml adding SparkCommonTools as a dependency.

default version of dependencies

Please review

Contributing

Pull requests for new features, bug fixes, and suggestions are welcome!

License

About

Resources

License

Stars

Watchers

Forks

Languages