<a href="https://colab.research.google.com/github/lmillana/MasterProjects/blob/main/Machine%20Learning/%20Time%20Series%20Classification%20with%20RNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Clasificación de series temporale desde cero

Entrenamiento de un clasificador de series temporales desde cero en el conjunto de datos FordA del archivo UCR/UEA.

## Introducción

Este ejemplo muestra cómo realizar la clasificación de series temporales desde cero, partiendo de archivos de series temporales CSV sin procesar en disco.
CSV en disco.

Demostramos el flujo de trabajo con el conjunto de datos FordA de la base de datos
[UCR/UEA archivo](https://www.cs.ucr.edu/%7Eeamonn/time_series_data_2018/).

## Setup

In [None]:
!pip install tensorflow



In [None]:
# instala las librerías necesarias para el proyecto

import numpy as np

from tensorflow import keras
from tensorflow.python.keras import layers

from keras.models import Sequential
from keras.layers import Embedding, LSTM, GRU, SimpleRNN,  Dense, Dropout



## Cargar los datos: el dataset FordA

### Descripción del dataset

El conjunto de datos que utilizamos aquí se llama FordA.
Los datos proceden del archivo de la UCR.
El conjunto de datos contiene 3.601 instancias de entrenamiento y otras 1.320 instancias de prueba.
Cada serie temporal corresponde a una medición del ruido del motor captada por un sensor del motor.
Para esta tarea, el objetivo es detectar automáticamente la presencia de un problema específico en el motor.


El problema es una **tarea de clasificación binaria equilibrada**. La descripción completa de este conjunto de datos [aquí](http://www.j-wichard.de/publications/FordPaper.pdf).

### Leer los datos TSV

Utilizaremos el archivo `FordA_TRAIN` para el entrenamiento y el archivo para las pruebas. La simplicidad de este conjunto de datos
nos permite demostrar eficazmente cómo utilizar RNN y CNN para la clasificación de series temporales.
En este archivo, la primera columna corresponde a la etiqueta.

In [None]:
## OPCION 1: dividimos entre df_train & df_test
# habría que dividir después x_train, y_train & x_test, y_test

import pandas as pd

root_url = "https://raw.githubusercontent.com/hfawaz/cd-diagram/master/FordA/"

df_train = pd.read_csv(root_url + "FordA_TRAIN.tsv", sep= "\t", header = None)
df_test = pd.read_csv(root_url + "FordA_TEST.tsv", sep= "\t", header = None)

In [None]:
df_test.head()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,491,492,493,494,495,496,497,498,499,500
0,-1,-0.140402,0.171641,0.302044,0.232804,0.033853,-0.224183,-0.469987,-0.645396,-0.6177,...,-0.319966,0.390903,0.974831,1.258717,1.143316,0.647092,-0.049582,-0.690402,-0.976596,-0.794263
1,-1,0.334038,0.322253,0.453844,0.671852,0.887897,1.020469,1.05975,1.03029,0.950746,...,0.435186,-0.346502,-0.924912,-1.208716,-1.247996,-1.139974,-1.041772,-1.041772,-1.159614,-1.375659
2,-1,0.716686,0.744367,0.725913,0.661325,0.555217,0.413585,0.24658,0.065273,-0.121109,...,3.17102,2.276019,1.219548,0.081881,-1.05025,-2.092881,-2.983269,-3.675281,-4.136622,-4.339612
3,1,1.240282,1.331189,1.386596,1.38322,1.305979,1.142784,0.878613,0.532291,0.140025,...,-0.820262,-1.124551,-1.302012,-1.340564,-1.27144,-1.146352,-1.011328,-0.931222,-0.934498,-1.001288
4,-1,-1.159478,-1.204174,-1.167605,-1.033518,-0.818166,-0.558119,-0.299291,-0.093691,0.02277,...,0.660853,0.441438,0.206176,-0.006941,-0.146919,-0.183082,-0.112382,0.008987,0.131413,0.186266


In [None]:
## OPCION 2: dividimos x_train, y_train & x_test, y_test

# lee un TSV
# utiliza numpy o pandas para leerlo
def readucr (filename):
  data = np.loadtxt(filename, delimiter = "\t")
  y = data[:, 0]
  x = data [:, 1:]
  return x, y.astype(int)


root_url = "https://raw.githubusercontent.com/hfawaz/cd-diagram/master/FordA/"

# lee un TSV
# utiliza numpy o pandas para leerlo

# obtén x_train, x_test, y_train, y_test
x_train, y_train = readucr (root_url + "FordA_TRAIN.tsv") #500
x_test, y_test = readucr (root_url + "FordA_TEST.tsv") #500


In [None]:
## LONGITUD
print(x_train.shape) #(3601, 500)
print(y_train.shape) #(3601,)
print(x_test.shape) #(1320, 500)
print(y_test.shape) #(1320,)

(3601, 500)
(3601,)
(1320, 500)
(1320,)


In [None]:
## Comprobamos que los datos de entrenamiento están BALANCEADOS

val, frec = np.unique(y_train, return_counts=True)

print(val, frec)

[-1  1] [1846 1755]


## Visualizar los datos

Aquí visualizamos un ejemplo de serie temporal para cada clase del conjunto de datos.

In [None]:
# tienes que tener en cuenta las clases que hay y visualizar las series de cada clase
# no tine que ser igual el gráfico

import matplotlib.pyplot as plt

class1 = df_train[df_train[0] == 1]
class_1 = df_train[df_train[0] == -1]



## Estandarizar los datos

Nuestras series temporales ya tienen una única longitud (500). Sin embargo, sus valores
suelen estar en varios rangos. Esto no es lo ideal para una red neuronal;
en general, deberíamos intentar normalizar los valores de entrada.

Para este conjunto de datos concreto, los datos ya están normalizados en z: cada muestra de serie temporal
tiene una media igual a cero y una desviación estándar igual a uno.

Este tipo de normalización es muy común en los problemas de clasificación de series temporales.
[Bagnall et al. (2016)](https://link.springer.com/article/10.1007/s10618-016-0483-9).

Tenga en cuenta que los datos de series temporales utilizados aquí son univariantes, lo que significa que sólo tenemos un canal
por ejemplo de serie temporal.
Por lo tanto, transformaremos la serie temporal en una multivariante con un canal
utilizando una simple remodelación a través de numpy.
Esto nos permitirá construir un modelo fácilmente aplicable a series temporales multivariantes.
multivariantes.

In [None]:
# Utiliza el reshape en x_test y x_train
# x_train tiene que ser de la forma (x_train.shape[0],x_train.shape[1],1)

## reshape((array que cambiamos, new shape, num canal))
## old: (3601, 500)
x_train = x_train.reshape((x_train.shape[0],x_train.shape[1],1) )

# x_test tiene que ser de la forma (x_test.shape[0],x_test.shape[1],1)
## old: (1320, 500)
x_test = x_test.reshape((x_test.shape[0],x_test.shape[1],1))



In [None]:
print('new shape x_train: ', x_train.shape)
print('new shape x_test: ', x_test.shape)

new shape x_train:  (3601, 500, 1)
new shape x_test:  (1320, 500, 1)


Por último, para utilizar `sparse_categorical_crossentropy`, tendremos que contar el número de clases de antemano.

In [None]:
num_classes = np.unique(y_train) # cuenta el numero de clases

print(f'Tenemos {len(num_classes)} clases: {num_classes}')

Tenemos 2 clases: [-1  1]


Ahora barajamos el conjunto de entrenamiento porque vamos a utilizar la opción `validation_split`
más tarde cuando entrenemos.

In [None]:
# para barajar los datos, puedes utilizar np.random.permutation(longitud datos train)
idx = np.random.permutation(len(x_train)) # utiliza lo anterior para generar un índice aleatorio

# separa cada train con ese índice
x_train = x_train[idx]
y_train = y_train[idx]

x_train.shape, y_train.shape

((3601, 500, 1), (3601,))

In [None]:
y_train

array([ 1,  1, -1, ...,  1, -1, -1])

Se normalizan las etiquetas a números enteros positivos.
Las etiquetas esperadas serán entonces 0 y 1.

In [None]:
# para normalizar, tienes que quedarte con los valores de y_train == -1
# estos valores van a ser ahora 0

y_train = np.where(y_train == -1, 0, y_train)
y_test = np.where(y_test == -1,0, y_test)

y_train


array([0, 0, 0, ..., 1, 1, 1])

## Construyendo el modelo

En este punto, se pueden crear muchos tipos.

Para series temporales puedes utilizar las siguientes:
- SimpleRNN
- LSTM
- GRU
- Conv1D

Y algunas más que no vamos a hablar aquí.

Intenta probar con RNN, LSTM y GRU por sencillez.

In [None]:
x_train.shape[1]

500

In [None]:
#from keras.models import Sequential
#from keras.layers import Embedding, LSTM, GRU, SimpleRNN,  Dense

# @title PRIMER MODELO: RNN SIMPLE

input_shape = (x_train.shape[1], 1) #datos de entrada

RNN = Sequential()

RNN.add(SimpleRNN(32, input_shape=input_shape)) # Capa RNN, 64 vectores
RNN.add(Dropout(0.5)) #Prevenimos sobreajuste
RNN.add(Dense(1, activation='sigmoid'))


In [None]:
# @title ENTRENAMIENTO

## CREAMOS MODELO:
# compila el modelo eligiendo optimizer, loss y metrics
RNN.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])


In [None]:
## ENTRENAMOS:

# Define las épocas y batch_size
epochs = 200 #muchos datos por lo que se necesitan muchas epochs
batch_size = 64

# entrena el modelo y almacena el entrenamiento en la variable history
history = RNN.fit(x_train, y_train,
                  epochs= epochs,
                  batch_size=batch_size,
                  validation_split= 0.2)


# guarda el modelo en .h5
RNN.save('RNN.h5')

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200
Epoch 78


## Evaluar el modelo en los datos de test

In [None]:
from keras.models import load_model

# carga el modelo
model = load_model('RNN.h5')

test_loss, test_acc = model.evaluate(x_test, y_test)

# evalua el modelo con evaluate y saca test_loss y test_acc

print("Test accuracy", test_acc)
print("Test loss", test_loss)

Test accuracy 0.5181818008422852
Test loss 0.6928234696388245


In [None]:

# @title SEGUNDO MODELO: LSTM

model_LSTM = Sequential()

model_LSTM.add(LSTM(64, return_sequences=True, input_shape=input_shape)) # Capa RNN, 32 vectores
model_LSTM.add(Dropout(0.5))  # Capa Dropout para prevenir sobreajuste
model_LSTM.add(LSTM(32)) # Capa RNN, 32 vectores
model_LSTM.add(Dropout(0.5))
model_LSTM.add(Dense(1, activation='sigmoid'))

In [None]:
# @title ENTRENAMIENTO

## CREAMOS MODELO:
# compila el modelo eligiendo optimizer, loss y metrics
model_LSTM.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])

In [None]:
## ENTRENAMOS:

# Define las épocas y batch_size
epochs = 200
batch_size = 64

# entrena el modelo y almacena el entrenamiento en la variable history
history = model_LSTM.fit(x_train, y_train,
                  epochs= epochs,
                  batch_size=batch_size,
                  validation_split=0.2)


# guarda el modelo en .h5
model_LSTM.save('LSTM.h5')

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200
Epoch 78

In [None]:
## EVALUAMOS:

# carga el modelo
model = load_model('LSTM.h5')

test_loss, test_acc = model.evaluate(x_test, y_test)

# evalua el modelo con evaluate y saca test_loss y test_acc

print("Test accuracy", test_acc)
print("Test loss", test_loss)

Test accuracy 0.5159090757369995
Test loss 0.6926639676094055


In [None]:

# @title TERCER MODELO: GRU

model_GRU = Sequential()

model_GRU.add(GRU(64)) # Capa RNN, 32 vectores
model_GRU.add(Dropout(0.5))
model_GRU.add(Dense(1, activation='sigmoid'))

In [None]:
# @title ENTRENAMIENTO

## CREAMOS MODELO:
# compila el modelo eligiendo optimizer, loss y metrics
model_GRU.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])

In [None]:
## ENTRENAMOS:

# Define las épocas y batch_size
epochs = 200
batch_size = 64

# entrena el modelo y almacena el entrenamiento en la variable history
history = model_GRU.fit(x_train, y_train,
                  epochs= epochs,
                  batch_size=batch_size,
                  validation_split=0.2)


# guarda el modelo en .h5
model_GRU.save('GRU.h5')

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200
Epoch 78

  saving_api.save_model(


In [None]:
# carga el modelo
model = load_model('GRU.h5')

test_loss, test_acc = model.evaluate(x_test, y_test)

# evalua el modelo con evaluate y saca test_loss y test_acc

print("Test accuracy", test_acc)
print("Test loss", test_loss)

Test accuracy 0.939393937587738
Test loss 0.16572408378124237


# Conclusión

Qué puedes decir de estos modelos?

Hay sobreajuste?

Entrenan bien?



---



**CONCLUSIONES**

* Se han probado varias combinaciones con **RNN** (32/64 capas, con/sin dropout, batch_size 32/64) sin llegar a superar el 0.51 de accuracy y una pérdida de 0.69.
* En RNN vemos sobreajuste y con cambios insignificante a pesar de las capas de Dropout.

* Con LSTM también se han probado varias combinaciones, incluso añadiendo dos capas LSTM (64 y 32)  y el máximo accuracy ha sido de 0.51 pero con mucha pérdida.

* El resultado con GRU es sorprendente. Con una sola capa GRU, se obtiene un resultado de rendimiento de 0.5. Sin embargo, si añadimos una capa de Dropout, **conseguimos un 0.939 con una pérdida de 0.165**, demostrando así su buen rendimiento.


**Nota**: Para optimizar las redes neuronales, se utiliza una herramienta llamada KerasTuner.
[Puedes echarle un vistazo si quieres en este enlace](https://keras.io/keras_tuner/)

In [None]:
!pip install keras-tuner

Collecting keras-tuner
  Downloading keras_tuner-1.4.7-py3-none-any.whl (129 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/129.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m129.1/129.1 kB[0m [31m4.4 MB/s[0m eta [36m0:00:00[0m
Collecting kt-legacy (from keras-tuner)
  Downloading kt_legacy-1.0.5-py3-none-any.whl (9.6 kB)
Installing collected packages: kt-legacy, keras-tuner
Successfully installed keras-tuner-1.4.7 kt-legacy-1.0.5


In [None]:
import keras_tuner

def build_model(hp):
  model_tuner = Sequential()
  model_tuner.add(Dense(
      hp.Choice('units', [8, 16, 32]),
      activation='relu'))
  model_tuner.add(Dense(1, activation='relu'))
  model_tuner.compile(loss='mse')
  return model_tuner


tuner = keras_tuner.RandomSearch(
    build_model,
    objective='val_loss',
    max_trials=5)

# Start the search and get the best model
tuner.search(x_train, y_train, epochs=5, validation_data=(x_test, y_test))
best_model = tuner.get_best_models()[0]

print(best_model)

Trial 3 Complete [00h 00m 06s]
val_loss: 0.2504463195800781

Best val_loss So Far: 0.2499276101589203
Total elapsed time: 00h 00m 20s
<keras.src.engine.sequential.Sequential object at 0x7dd1707ae440>
