Trueno Elastic Search Spark Connector

Trueno's ElasticSearch Connector for Apache Spark.

Requirements

Elasticsearch 2.x cluster accessible through [transport].

Architecture

Installation

Available through any Maven-compatible tool:

<dependency>
  <groupId>org.trueno.elasticsearch.spark.connector</groupId>
  <artifactId>elasticsearch-spark-connector</artifactId>
  <version>0.0.1</version>
</dependency>

Using Trueno's Elastic Search Spark Connector

spark-2.1.0-bin-hadoop2.7$ ./bin/spark-shell --jars elasticsearch-spark-connector.jar

Loading library from scala/spark

Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 2.1.0
      /_/
         
Using Scala version 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_91)
Type in expressions to have them evaluated.
Type :help for more information.

scala> import org.trueno.elasticsearch.spark.connector._
import org.trueno.elasticsearch.spark.connector._

scala> val transportClient = new ESTransportClient(index, sc)
transportClient: org.trueno.elasticsearch.spark.connector.ESTransportClient = org.trueno.elasticsearch.spark.connector.ESTransportClient@31b7112d

scala> val verticesRDD = transportClient.getVertexRDD()
Elasticsearch client retrieving vertices ...

API Example

/* Trueno ES Spark Connector */
import org.trueno.elasticsearch.spark.connector._

/* GraphX references */
import org.apache.spark.graphx._
import org.apache.spark.graphx.lib._
import org.apache.spark.graphx.VertexRDD
import org.apache.spark.rdd.RDD

val transportClient = new ESTransportClient("biogrid",sc)

val verticesRDD = transportClient.getVertexRDD()

val edgesRDD = transportClient.getEdgeRDD()

val graph = transportClient.getGraph()

val g2 = PageRank.runUntilConvergence(graph,0.001)

Please refer to the development guide for further explanation.

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
assets/images		assets/images
src		src
development-guide.md		development-guide.md
elasticsearch-spark-connector.iml		elasticsearch-spark-connector.iml
pom.xml		pom.xml
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Trueno Elastic Search Spark Connector

Requirements

Architecture

Installation

Using Trueno's Elastic Search Spark Connector

Loading library from scala/spark

API Example

About

Releases

Packages

Languages

TruenoDB/trueno-elasticsearch-spark-connector

Folders and files

Latest commit

History

Repository files navigation

Trueno Elastic Search Spark Connector

Requirements

Architecture

Installation

Using Trueno's Elastic Search Spark Connector

Loading library from scala/spark

API Example

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages