In [None]:
# -*- coding: utf-8 -*-
"""
@author: Miryam Subiza
"""
from datetime import datetime, timedelta
from pymongo import MongoClient
import pandas as pd
import argparse
import plotly
import re
import getpass

def getFechaHoraIni(x):
    return (datetime.strptime(x, "%Y%m%d")).strftime("%Y-%m-%dT%H:%M:%S.%fZ")
def getFechaHoraFin(x):
    return (datetime.strptime(x, "%Y%m%d") + timedelta(days=1)).strftime("%Y-%m-%dT%H:%M:%S.%fZ")
def getFechaHoraTitle(x):
    return (datetime.strptime(x, "%Y%m%d")).strftime("%d/%m/%Y")

fecha_ini = input("Introduce una fecha de inicio con el siguiente formato AAAAMMDD: ")
while not re.match("^[0-9]{8}$", fecha_ini):
    print("ERROR: El formato no es correcto")
    fecha_ini = input("Introduce una fecha de inicio con el siguiente formato AAAAMMDD: ")
fecha_fin = input("Introduce una fecha de fin con el siguiente formato AAAAMMDD: ")
while not re.match("^[0-9]{8}$", fecha_fin):
    print("ERROR: El formato no es correcto")
    fecha_fin = input("Introduce una fecha de fin con el siguiente formato AAAAMMDD: ")
sensor_ini = input("Introduce un sensor de inicio: ")
while not re.match("^[0-9]{1}$", sensor_ini):
    print("ERROR: El formato no es correcto")
    sensor_ini = input("Introduce un sensor de inicio: ")

print("\nSe va a generar un gráfico de los datos capturados entre " + getFechaHoraTitle(fecha_ini) + " y " + getFechaHoraTitle(fecha_fin) + ", tomando el sensor " + sensor_ini + " de inicio")

u = input("\nUsuario: ")
p = getpass.getpass("Contraseña: ")

client = MongoClient("mongodb://"+u+":"+p+"@localhost:27017/lth_upna")
db = client["lth_upna"]

df = pd.DataFrame(columns=['momento', 'IMSI', 'sensor'])
sensores_fin = []

for c in db.list_collection_names():
    if 'lth_/imsi_sensor/' in c and db[c].count_documents({}) != 0:
        if c.split("/")[-1] != sensor_ini:
            sensores_fin.append(c.split("/")[-1])
        cursor = db[c].find({
            'observation_time': {
                '$gte': getFechaHoraIni(fecha_ini),
                '$lte': getFechaHoraFin(fecha_fin)
            }
        })
        for document in cursor:
            if 'observation_time' in document and 'entityId' in document:
                df = df.append({
                        'momento': document['observation_time'],
                        'IMSI': document['entityId'],
                        'sensor': c.split("/")[-1]
                        }, ignore_index=True) 

values = [0]*(len(sensores_fin)*len(sensores_fin)+len(sensores_fin)+1)
data = df.groupby('IMSI')

for imsi, group in data:
    if len(group) > 1:
        group = group.sort_values('momento')
        if group.iloc[0]['sensor'] == sensor_ini and group.iloc[1]['sensor'] != sensor_ini:
            index_salto1 = sensores_fin.index(group.iloc[1]['sensor'])
            values[index_salto1] = values[index_salto1] + 1
            if len(group) > 2:
                if (group.iloc[1]['sensor'] != group.iloc[2]['sensor']):
                    if group.iloc[2]['sensor'] == sensor_ini:
                        index_salto2 = (index_salto1+1) * len(sensores_fin) + index_salto1
                    else:
                        index_salto2 = (index_salto1+1) * len(sensores_fin) + sensores_fin.index(group.iloc[2]['sensor'])
                    values[index_salto2] = values[index_salto2] + 1

labels = []
all_colors = ['pink', 'lightblue', 'lightgreen', '#727272', '#F1595F', '#F9A65A', '#9E66AB', '#CD7058', '#D77FB3', '#599AD3', '#79C36A']
colors = []
for s in sensor_ini.split(","):
    labels.append("Sensor " + s)
    colors.append(all_colors[0]);
for s in sensores_fin:
    labels.append("Sensor " + s)
    colors.append(all_colors[sensores_fin.index(s)+1])
for s1 in sensores_fin:
    aux = 0
    for s2 in sensores_fin:
        if sensores_fin.index(s1) == aux:
            labels.append("Sensor " + sensor_ini)
            colors.append(colors[0])
        else:
            labels.append("Sensor " + s2)
            colors.append(colors[sensores_fin.index(s2)+1])
        aux = aux+1

sources = [0]*len(sensores_fin)
for i in range(1,len(sensores_fin)+1):
    sources.extend([i]*len(sensores_fin))


data = dict(
    type='sankey',
    node = dict(
      pad = 15,
      thickness = 20,
      line = dict(
        color = "black",
        width = 0.5
      ),
      label = labels,
      color = colors
    ),
    valueformat = ".0f",
    valuesuffix = " dispositivos",
    link = dict(
      source = sources,
      target = list(range(1,(len(sensores_fin)*len(sensores_fin)+len(sensores_fin)+1))),
      value = values
))

layout =  dict(
    title = "<b>Flujo de dispositivos ("+ getFechaHoraTitle(fecha_ini) + " - " + getFechaHoraTitle(fecha_fin) + ") desde sensor " + sensor_ini + "</b>",
    height = 772,
    font = dict(
      size = 10,
      color = '#DA4453'
    )
)

fig = dict(data=[data], layout=layout)

plotly.offline.plot(fig)