# Ventanas temporales de procesamiento - `window`, `countByWindow` y `countByValueAndWindow`

In [None]:
import org.apache.spark._

In [None]:
import org.apache.spark.streaming._

In [None]:
val streamctx = new StreamingContext(sc, Seconds(15))

In [None]:
val datos = streamctx.socketTextStream("localhost", 19000)

In [None]:
// Obligatorio al trabajar con estados.
streamctx.checkpoint("/eoi/streaming/checkpoint")

In [None]:
datos.print()

In [None]:
case class Medicion(nodo:String, sensor:String, valor:String)

In [None]:
val medidas = datos.flatMap(x => {
    val campos = x.split(";")
    try {
        List(Medicion(campos(0), campos(1), campos(2)))
    }
    catch {
        case e : Throwable => {
            // LLamar al sistema de notificación en caso de fallo en la entrada. 
        }
        List ()
    }
})

In [None]:
// Medidas de dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val ventana = medidas.map(x => (x.sensor, x.valor)).window(Seconds(45), Seconds(15))

In [None]:
ventana.print()

In [None]:
// Número de medidas dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val contar_ventana = medidas.map(x => (x.sensor, x.valor)).countByWindow(Seconds(45), Seconds(15))

In [None]:
contar_ventana.print()

In [None]:
// Número de medidas dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val contar_ventana_valor = medidas.map(x => (x.sensor)).countByValueAndWindow(Seconds(45), Seconds(15))

In [None]:
contar_ventana_valor.print()

In [None]:
streamctx.start()

In [None]:
streamctx.stop()

# Ventanas temporales de procesamiento - `reduceByWindow`

In [None]:
val streamctx = new StreamingContext(sc, Seconds(15))

In [None]:
val datos = streamctx.socketTextStream("localhost", 19000)

In [None]:
// Obligatorio al trabajar con estados.
streamctx.checkpoint("/eoi/streaming/checkpoint")

In [None]:
datos.print()

In [None]:
case class Medicion(nodo:String, sensor:String, valor:String)

In [None]:
val medidas = datos.flatMap(x => {
    val campos = x.split(";")
    try {
        List(Medicion(campos(0), campos(1), campos(2)))
    }
    catch {
        case e : Throwable => {
            // LLamar al sistema de notificación en caso de fallo en la entrada. 
        }
        List ()
    }
})

In [None]:
// Medidas de dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val ventana = medidas.map(x => (x.nodo, x.sensor, x.valor)).window(Seconds(45), Seconds(15))

In [None]:
ventana.print

In [None]:
// Máximo de temperatura dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val reduce_ventana_1 = medidas.filter(x => x.sensor == "Temp").
map(x => (x.sensor, x.valor.toDouble)).
reduceByWindow((v1, v2) => if (v1._2 > v2._2) v1 else v2, Seconds(45), Seconds(15))

In [None]:
reduce_ventana_1.print

In [None]:
// Medidas producidas por cada nodo dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val reduce_ventana_2 = medidas.map(x => (x.nodo, 1)).reduceByWindow((v1,v2) => (v1._1, v1._2 + v2._2), 
                                                                    (w1, w2) => (w1._1, w1._2 - w2._2), 
                                                                    Seconds(45), Seconds(15))

In [None]:
reduce_ventana_2.print

In [None]:
streamctx.start()

In [None]:
streamctx.stop()

# Ventanas temporales de procesamiento - `reduceByKeyAndWindow`

In [None]:
val streamctx = new StreamingContext(sc, Seconds(15))

In [None]:
val datos = streamctx.socketTextStream("localhost", 19000)

In [None]:
// Obligatorio al trabajar con estados.
streamctx.checkpoint("/eoi/streaming/checkpoint")

In [None]:
datos.print()

In [None]:
case class Medicion(nodo:String, sensor:String, valor:String)

In [None]:
val medidas = datos.flatMap(x => {
    val campos = x.split(";")
    try {
        List(Medicion(campos(0), campos(1), campos(2)))
    }
    catch {
        case e : Throwable => {
            // LLamar al sistema de notificación en caso de fallo en la entrada. 
        }
        List ()
    }
})

In [None]:
// Medidas de dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val ventana = medidas.map(x => (x.nodo, x.sensor, x.valor)).window(Seconds(45), Seconds(15))

In [None]:
ventana.print()

In [None]:
// Número de medidas producidas de cada tipo dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val reduce_ventana_1 = medidas.filter(x => x.sensor == "Temp" || x.sensor == "Humd").
map(x => (x.sensor, 1)).
reduceByKeyAndWindow((v1:Int, v2:Int) => v1 + v2, Seconds(45), Seconds(15))

In [None]:
reduce_ventana_1.print

In [None]:
// Número de medidas producidas de cada tipo dentro de la ventana (45 segundos con desplazamiento de 15 segundos).
// Sólo incluir aquellas que aparecen más de una vez.
val reduce_ventana_2 = medidas.filter(x => x.sensor == "Temp" || x.sensor == "Humd").
map(x => (x.sensor, 1)).
reduceByKeyAndWindow((v1:Int, v2:Int) => v1 + v2, 
                (w1:Int, w2:Int) => w1 - w2, 
                Seconds(45), Seconds(15), 3, (x: (String,Int)) => x._2 != 0)

In [None]:
reduce_ventana_2.print

In [None]:
streamctx.start()

In [None]:
streamctx.stop()

# Ventanas temporales de procesamiento - `groupByKeyAndWindow`

In [None]:
val streamctx = new StreamingContext(sc, Seconds(15))

In [None]:
val datos = streamctx.socketTextStream("localhost", 19000)

In [None]:
// Obligatorio al trabajar con estados.
streamctx.checkpoint("/eoi/streaming/checkpoint")

In [None]:
datos.print()

In [None]:
case class Medicion(nodo:String, sensor:String, valor:String)

In [None]:
val medidas = datos.flatMap(x => {
    val campos = x.split(";")
    try {
        List(Medicion(campos(0), campos(1), campos(2)))
    }
    catch {
        case e : Throwable => {
            // LLamar al sistema de notificación en caso de fallo en la entrada. 
        }
        List ()
    }
})

In [None]:
// Medidas de dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val ventana = medidas.map(x => (x.nodo, x.sensor, x.valor)).window(Seconds(45), Seconds(15))

In [None]:
ventana.print()

In [None]:
// Medidas producidas por los botonoes dentro de la ventana (45 segundos con desplazamiento de 15 segundos)
val group_ventana = medidas.filter(x => x.sensor == "Boton").
map(x => (x.sensor, x.valor)).
groupByKeyAndWindow(Seconds(45), Seconds(15))

In [None]:
group_ventana.print

In [None]:
streamctx.start()

In [None]:
streamctx.stop()