# Exploración de las alarmas de ascensores de 2016

In [None]:
# Load libraries
import pandas as pd
from matplotlib import pyplot as plt

In [None]:
key = 'ASC_2016_HIST'

store = pd.HDFStore('../data/SRA.hf5', mode='a')
if key in store:
    print('... reading from hdf')
    alarmas = pd.read_hdf(store, key)
else:
    print('... reading from csv')
    alarmas = pd.read_csv('../data/SRA/Parciales originales/SRA_' + key + '.csv', sep=';', parse_dates=['Fecha Inicio', 'Fecha Solución'], encoding='windows-1252', low_memory=False)
    alarmas.to_hdf(store, key)
    
store.close()

In [None]:
alarmas.head()

In [None]:
alarmas.shape

In [None]:
alarmas.dtypes

In [None]:
# Let's see how many alerts there are by metro line
alarmas.groupby('Línea').size()

In [None]:
alarmas['Línea'].value_counts().plot(kind='bar', figsize=(15, 10))
plt.show()

In [None]:
alarmas['Línea'].unique()

In [None]:
alarmas['Línea_number'] = alarmas['Línea'].map({'L1':1, 'L2':2, 'L3':3, 'L4':4, 'L5':5, 'L6':6, 'L7':7, 'L8':8, 'L9':9, 'L10':10, 
                                         'L11':11, 'L12':12, 'RAMAL OPERA-P.PIO':13, 'ML1':14, 'ML2':15, 'ML3':16})

alarmas.head()

In [None]:
# Nueva variable: Tiempo de resolución
alarmas['Tiempo resolucion'] = alarmas['Fecha Solución'] - alarmas['Fecha Inicio']
alarmas['Tiempo resolucion'] = alarmas['Tiempo resolucion'].dt.total_seconds()
alarmas.head()

In [None]:
alarmas['Tiempo resolucion'].describe()

In [None]:
alarmas['Tiempo resolucion'].plot(kind='density')
plt.show()

In [None]:
alarmas['Tiempo resolucion'].hist()
plt.show()

In [None]:
# Observamos que las fechas de solución no están bien informadas (1669/339867)
# De momento nos quitamos las que están mal informadas
alarmas = alarmas[alarmas['Tiempo resolucion'] >= 0]
alarmas.head()

In [None]:
alarmas['Tiempo resolucion'].plot(kind='box')
plt.show()

In [None]:
alarmas.shape

In [None]:
# Nueva variable: Día de la semana en la que se informa la alarma
alarmas['Dia semana informada'] = alarmas['Fecha Inicio'].dt.dayofweek

# Nueva variable: día de la semana en la que se da por resuelta la incidencia
alarmas['Dia semana resolucion'] = alarmas['Fecha Solución'].dt.dayofweek

alarmas.head()

In [None]:
# Veamos si a simple vista el día de la semana influye en el número de alarmas
alarmas.groupby('Dia semana informada').size()

In [None]:
# Veamos si a simple vista el día de la semana de inicio de la alarma influye en el tiempo de resolución
# Scatter day of week - resolution time
plt.scatter(alarmas['Dia semana informada'], alarmas['Tiempo resolucion'])
plt.show()

In [None]:
# Veamos si la hora a la que se informa una incidencia y el tiempo de resolución están relacionados
# Primero definimos una nueva variable: Hora a la que se informa la alarma (en segundos)
alarmas['Hora informada(sec)'] = alarmas['Fecha Inicio'].dt.hour * 3600 + alarmas['Fecha Inicio'].dt.minute * 60 + alarmas['Fecha Inicio'].dt.second

alarmas.head()

In [None]:
plt.scatter(alarmas['Hora informada(sec)'], alarmas['Tiempo resolucion'])
plt.show()

In [None]:
# Veamoslo por línea
plt.scatter(alarmas['Hora informada(sec)'], alarmas['Tiempo resolucion'], c=alarmas['Dia semana informada'], alpha=0.5)
plt.show()

In [None]:
# Veamos si la línea en la que se da la alarma influye en el tiempo de resolución
# Scatter line - resolution time
plt.scatter(alarmas['Línea_number'], alarmas['Tiempo resolucion'])
plt.show()

In [None]:
# Veamos si dependiendo de la hora hay más o menos inciencias
alarmas['Hora informada(sec)'].hist()
plt.show()

In [None]:
# Comprobamos que a simple vista no hay diferencia de unos días a otros
alarmas['Hora informada(sec)'].hist(by=alarmas['Dia semana informada'], layout=(1,7), figsize=(16,3))
plt.show()

In [None]:
# Parece que las correctivas se informan por la noche a partir de las 00:00 principalmente. Las predictivas se informan
# a lo largo del día, principalmente en las horas en las que el metro está abierto
alarmas['Hora informada(sec)'].hist(by=alarmas['Predictiva/Correctiva'])
plt.show()

In [None]:
# Queremos ver si está relacionada la hora de la incidencia con el código de la misma
plt.scatter(alarmas['Código Alarma'], alarmas['Hora informada(sec)'])
plt.show()

In [None]:
# Veamos si el tiempo de resolución lo está
plt.scatter(alarmas['Código Alarma'], alarmas['Tiempo resolucion'])
plt.show()

In [None]:
alarmas.groupby('Código Alarma').size()