spark connectors with sbt

Architecture

ConnectorClient is the entry point of spark connectors.

How to extend plugin

reader extends SparkReader by pass ConnectorsReadConf.
implements read method and return DataFrame.
writer is the same as reader, That's all.

check jdbc plugin for example:

class ReadJdbc(conf: ConnectorsReadConf) extends SparkReader{

  override def init(spark: SparkSession) = {
    println("init jdbc reader...")
  }

  override def read(spark: SparkSession): DataFrame = {
    val url = conf.getReadConf("url")
    val table = conf.getReadConf("table")
    val username = conf.getReadConf("user")
    val password = conf.getReadConf("password")

    val properties = new Properties
    properties.put("user", username)
    properties.put("password", password)

    spark.read.jdbc(url, table, properties)
  }
}

How to run

jdbc2jdbc, only need to add jdbc-assembly.jar to --jars

bin/spark-submit --driver-class-path /Users/zhengqh/.m2/repository/mysql/mysql-connector-java/5.1.40/mysql-connector-java-5.1.40.jar \
--jars /Users/zhengqh/spark-connectors-sbt/jdbc/target/scala-2.11/jdbc-assembly-0.0.1.jar \
--class com.zqh.spark.connectors.ConnectorClient \
--files /Users/zhengqh/spark-connectors-sbt/core/src/main/resources/application.conf \
--driver-java-options -Dconfig.file=/Users/zhengqh/spark-connectors-sbt/core/src/main/resources/application.conf \
/Users/zhengqh/spark-connectors-sbt/core/target/scala-2.11/core-assembly-0.0.1.jar

if execute in pipeline mode, you should add all related jar to --jars. for example: reader is : [jdbc, cassandra], writer is [jdbc, mongodb].

configuration file:

connectors: [
  {
    "readers" :
      [
        {
          "type": "jdbc",
          "url": "jdbc:mysql://localhost/test",
          "table": "test",
          "user": "root",
          "password": "root"
        },
        {
          "type": "cassandra",
          "keyspace": "mykeyspace",
          "host": "192.168.6.70",
          "table": "user"
        }
      ]
  },
  {
    "writers" :
      [
        {
          "type": "jdbc",
          "url": "jdbc:mysql://localhost/test",
          "table": "test3",
          "user": "root",
          "password": "root",
          "mode": "overwrite"
        },
        {
          "type": "mongodb",
          "host": "localhost",
          "table": "test3",
          "db": "root",
          "mode": "overwrite"
        }
      ]
  }
]

run spark job:

bin/spark-submit --driver-class-path /Users/zhengqh/.m2/repository/mysql/mysql-connector-java/5.1.40/mysql-connector-java-5.1.40.jar \
--jars /Users/zhengqh/spark-connectors-sbt/jdbc/target/scala-2.11/jdbc-assembly-0.0.1.jar,/Users/zhengqh/spark-connectors-sbt/cassandra/target/scala-2.11/cassandra-assembly-0.0.1.jar,/Users/zhengqh/spark-connectors-sbt/mongodb/target/scala-2.11/mongodb-assembly-0.0.1.jar \
--class com.zqh.spark.connectors.ConnectorClient \
--files /Users/zhengqh/spark-connectors-sbt/core/src/main/resources/application.conf \
--driver-java-options -Dconfig.file=/Users/zhengqh/spark-connectors-sbt/core/src/main/resources/application.conf \
/Users/zhengqh/spark-connectors-sbt/core/target/scala-2.11/core-assembly-0.0.1.jar

Ref

http://centerqi.github.io/java/2015/11/30/spark-scala-application-config

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
api/src/main/scala/com/zqh/spark/connectors		api/src/main/scala/com/zqh/spark/connectors
cassandra		cassandra
codis		codis
core		core
elasticsearch		elasticsearch
hbase		hbase
hdfs		hdfs
hive		hive
jdbc		jdbc
jobserver		jobserver
kafka		kafka
mongodb		mongodb
neo4j		neo4j
orientdb		orientdb
project		project
redis		redis
streaming/src		streaming/src
.gitignore		.gitignore
README.md		README.md
build.sbt		build.sbt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

spark connectors with sbt

Architecture

How to extend plugin

How to run

Ref

About

Releases

Packages

Languages

zqhxuyuan/spark-connectors-sbt

Folders and files

Latest commit

History

Repository files navigation

spark connectors with sbt

Architecture

How to extend plugin

How to run

Ref

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages