# Importa los módulos necesarios y establece configuraciones

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import funs
import seaborn as sns
import plotly.plotly as py
from plotly.graph_objs import *
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
from sklearn.preprocessing import StandardScaler
init_notebook_mode(connected=True)
pd.options.display.max_rows = 10

## Importa el .csv que contiene las mediciones de todos los nodos

In [None]:
df = pd.read_csv('all_nodos.csv')
df

## Suprime las columnas que no se necesitan

In [None]:
try:
    df.drop(columns=['T_NODO', 'TRY', 'FECHA', 'Carga', 'RSSI', 'T_SERVIDOR', 'TIPO_Nodo'], inplace = True)
except KeyError:
    pass
df

## Atrasa la columna HORA del mes mayo en tres unidades, la hora estaba adelantada para esos registros

In [None]:
ind_rem = [[x,int(df.HORA[x])-3] for x in range(len(df)) if df.MES[x] < 6]
df.loc[pd.DataFrame(ind_rem).iloc[:,0],'HORA'] = pd.DataFrame(ind_rem).iloc[:,1].values
ind_rem = [[x, df.HORA[x]+24,df.DIA[x]-1] for x in range(len(df)) if df.HORA[x]<0]
df.loc[pd.DataFrame(ind_rem).iloc[:,0],'HORA'] = pd.DataFrame(ind_rem).iloc[:,1].values
df.loc[pd.DataFrame(ind_rem).iloc[:,0],'DIA'] = pd.DataFrame(ind_rem).iloc[:,2].values

## Se introduce un cero antes de las unidades de las columnas MES, DIA, HORA, MINUTO

In [None]:
ind_rem = {}
for i in ['MES','DIA','HORA','MINUTO']:
    ind_rem[i] = [[x,'0'+str(df[i][x])] for x in range(len(df)) if df[i][x] < 10]
    df.loc[pd.DataFrame(ind_rem[i]).iloc[:,0],i] = pd.DataFrame(ind_rem[i]).iloc[:,1].values
df

## Se crea una columna con la estrucutura AÑO+MES+DIA+HORA+MINUTO

In [None]:
df['TIME'] = [str(df.AÑO[i])+str(df.MES[i])+str(df.DIA[i])+str(df.HORA[i])+str(df.MINUTO[i]) for i in range(len(df))]
df.TIME

## Convierte la columna TIME al fomato Timestamp

In [None]:
df['TIME'] = [pd.Timestamp(x) for x in df['TIME']]
df

## Suprime las columnas que no se van a utilizar

In [None]:
try:
    df.drop(columns = ['id_Variable','AÑO','MES','DIA','MINUTO'], inplace = True)
except KeyError:
    pass

## Cambia los nombres de las columnas

In [None]:
old_names = ['id_Variable','id_nodo','Temperatura','Humedad','Hum. Tierra','Nivel_UV','INT. LUMÍN'] 
new_names = ['id_Variable','NODO','TEMPERATURA','HUMEDAD RELATIVA','HUMEDAD DE LA TIERRA','NIVEL UV','INTENSIDAD LUMÍNICA']
df.rename(columns=dict(zip(old_names, new_names)), inplace=True)
df

## Elimina los elementos de df anteriores al registro 2882, correspondientes a pruebas

In [None]:
if len(df) == 50501:
    df = df.iloc[2822::,:].reset_index(drop = True)

## Mormaliza las variables

In [None]:
df2 = StandardScaler().fit_transform(df.iloc[:,1:6])
df2=pd.DataFrame(df2)
df2.columns=df.iloc[:,1:6].columns
df.iloc[:,1:6] = df2
df

In [None]:
# convierte a entero los registros de la columna HORA
df.HORA = [int(df.HORA[x]) for x in range(len(df))]

In [None]:
n = df.NODO.value_counts()
# imprime los nodos contenidos en df y la cantidad de registros que posee
print(n)
nodos  = n.index.tolist()

## Separa los nodos

In [None]:
tablas = {}
for i in nodos:
    tablas[i] = (df.query('NODO == %s' %i).reset_index(drop=True))
    
tabla = []
for i in nodos:
    tabla_nodo = df.query('NODO == %s' %i).reset_index(drop=True)
    tabla_nodo.columns = [j+str(tabla_nodo.NODO[0]) for j in tabla_nodo.columns]
    tabla_nodo.drop(columns = ['NODO%s'%i,'TIME%s'%i],inplace=True)
    tabla.append(tabla_nodo)

## Concatena los DFs contenidos en tabla

In [None]:
tabla = pd.concat(tabla,axis=1)
tabla

## Ordena las columnas por orden alfabético

In [None]:
tabla = tabla.reindex(columns = sorted(tabla.columns))
tabla

## Matrices de correlación entre variables de diferentes nodos

In [None]:
tcorr = tabla.corr()
for i in range(0,len(tcorr),6):
    for j in range(0,len(tcorr),6):
        sns.heatmap(tcorr[i:i+6].iloc[:,j:j+6], annot=True, cmap='RdYlGn',fmt=".2f")
        plt.show()

## Realiza una gráfica interactiva de valores medidos por un nodo

### "tablas" es un diccionario de DFs. Para acceder al DF correspondiente a cada nodo se hace tabla[nodo], tabla[2] (nodo 2).
#### Cada DF tiene 7 columnas:
0 - TEMPERATURA  
1 - HUMEDAD RELATIVA  
2 - HUMEDAD DE LA TIERRA  
3 - HUMEDAD DE LA TIERRA  
4 - NIVEL UV  
5 - INTENSIDAD LUMÍNICA  
6 - HORA  
7 - TIME  

In [None]:
nodo = 2

data = ([{'x': tablas[nodo].TIME,'y': tablas[nodo][col],'name': col}
       for col in tablas[nodo].columns[1:6]])
layout = dict(title = 'NODO %s' %nodo,
              yaxis = dict(title = 'MAGNITUD'),
              xaxis = dict(title = 'FECHA')
             )
fig = dict(data=data, layout=layout)
iplot(fig,layout)

In [None]:
nodo = 5

data = ([{'x': tablas[nodo].index,'y': tablas[nodo][col],'name': col}
       for col in tablas[nodo].columns[1:6]])
layout = dict(title = 'NODO %s' %nodo,
              yaxis = dict(title = 'FECHA'),
              xaxis = dict(title = 'MAGNITUD')
             )
fig = dict(data=data, layout=layout)
iplot(fig,layout)