# Creación de un `StreamingContext`

In [None]:
import org.apache.spark._

In [None]:
import org.apache.spark.streaming._

## Crea el objeto StreamingContext

In [None]:
val streamctx = new StreamingContext(sc, Seconds(30))

## Lee los datos desde un `socket`

In [None]:
val datos = streamctx.socketTextStream("localhost", 19000)

## Muestra los datos por pantalla

In [None]:
datos.print()

## Inicia el análisis de datos en streaming

In [None]:
streamctx.start()

## Para el análisis de datos en streaming

In [None]:
streamctx.stop()

# Creación de un `StreamingContext` con soporte de `checkpoint`

In [None]:
import org.apache.spark._

In [None]:
import org.apache.spark.streaming._

## Función para registar el checkpoint si no existe.

In [None]:
// Crea el objeto StreamingContext incluyendo checkpoint
def createStreamingContext(): StreamingContext = {
    val stream = new StreamingContext(sc, Seconds(30))
    val datos = stream.socketTextStream("localhost", 19000)
    datos.print()
    stream.checkpoint("/eoi/streaming/checkpoint_dstream")
    stream
}

## Crea un `StreamingContext`basándose en un `checkpoint` 

In [None]:
val streamctx = StreamingContext.getOrCreate("/eoi/streaming/checkpoint_dstream", createStreamingContext);

In [None]:
streamctx.start()

In [None]:
// Esperar que se reciban varios RDDs con datos.
streamctx.stop()

## Reinicia el análisis

In [None]:
val streamctx = StreamingContext.getOrCreate("/eoi/streaming/checkpoint_dstream", createStreamingContext);

In [None]:
streamctx.start()

In [None]:
streamctx.stop()

# Guardar los resultados en el sistema de ficheros

In [None]:
val streamctx = new StreamingContext(sc, Seconds(30))

In [None]:
val datos = streamctx.socketTextStream("localhost", 19000)

In [None]:
datos.print()

In [None]:
datos.repartition(1).saveAsTextFiles("/eoi/streaming/tmp", "txt")

In [None]:
streamctx.start()

In [None]:
streamctx.stop()

# Analiza los datos de entrada

In [None]:
val streamctx = new StreamingContext(sc, Seconds(30))

In [None]:
val datos = streamctx.socketTextStream("localhost", 19000)

In [None]:
datos.print()

In [None]:
case class Medicion(nodo:String, sensor:String, valor:String)

In [None]:
val medidas = datos.flatMap(x => {
    val campos = x.split(";")
    try {
        List(Medicion(campos(0), campos(1), campos(2)))
    }
    catch {
        case e : Throwable => {
            // LLamar al sistema de notificación en caso de fallo en la entrada. 
        }
        List ()
    }
})

In [None]:
// Calcula cuántos datos de cada sensor se recibe en cada `batch`
val resultado_sensor = medidas.map(x => (x.sensor, 1)).reduceByKey(_ + _)

In [None]:
resultado_sensor.print

In [None]:
// Calcula cuántos datos de cada nodo se recibe en cada `batch`
val resultado_nodo = medidas.map(x => (x.nodo, 1)).reduceByKey(_ + _)

In [None]:
resultado_nodo.print

In [None]:
// Mostrar el nodo que más medidas ha transmitido.
val resultado_max = resultado_nodo.transform(x => x.sortBy(x => x._2, false))

In [None]:
resultado_max.print

In [None]:
streamctx.start()

In [None]:
streamctx.stop()