### Instrucciones generales <a class="tocSkip"></a>

1. Forme un grupo de **máximo dos estudiantes**
1. Versione su trabajo usando un **repositorio <font color="red">privado</font> de github**. Agregue a su compañero y a su profesor (usuario github: phuijse) en la pestaña *Settings/Manage access*. No se aceptarán consultas si la tarea no está en github. No se evaluarán tareas que no estén en github.
1. Se evaluará el **resultado, la profundidad de su análisis y la calidad/orden de sus códigos** en base al último commit antes de la fecha y hora de entrega". Se bonificará a quienes muestren un método de trabajo incremental y ordenado según el histórico de *commits*
1. Sean honestos, ríganse por el [código de ética de la ACM](https://www.acm.org/about-acm/code-of-ethics-in-spanish)



# Tarea 3: Predicción de una serie de tiempo caótica

En esta tarea se pide entrenar y evaluar un predictor para el sistema no-lineal [Mackey-Glass](https://en.wikipedia.org/wiki/Mackey-Glass_equations)

Esta serie de tiempo se obtiene de la solución de la siguiente ecuación diferencial

$$
\frac{dy}{dt} = \beta \frac{ y(t-\tau)}{1 + y(t-\tau)^{n}} - \gamma y(t),
$$

donde el parámetro $\tau$ controla el comportamiento dinámico de la serie de tiempo 

En esta tarea nos limitaremos en estudiar el caso con $n=10$, $\gamma = 0.1$ y $\beta = 0.2$

El valor del parámetro $\tau$ modifica el comportamiento dinámico del sistema, en particular se tiene que

- $\tau = 17$ el sistema tiene un comportamiento debilmente caótico
- $\tau = 30$ el sistema tiene un comportamiento fuertemente caótico

La ecuación de diferencial anterior fue propuesta por Michael Mackey and Leon Glass en 1977 como modelo para procesos fisiológicos asociados a la [homeostasis](https://es.wikipedia.org/wiki/Homeostasis)

El código adjunto a esta tarea genera la serie de tiempo en función 

Se generan 1000 muestras de la serie de tiempo. Use los primeros 500 puntos para entrenar, los siguientes 250 puntos para calibrar los hiperparámetros y los últimos 250 para evaluar y comparar los filtros

In [93]:
import numpy as np
%matplotlib notebook
import matplotlib.pylab as plt
from mackey import MackeyGlass

# Puede calcular el error medio cuadrático normalizado usando:
NMSE = lambda y, yhat : np.sum((y - yhat)**2)/np.var(y)

# Gráfico
(t_train, y_train), (t_valid, y_valid), (t_test, y_test) = MackeyGlass(tau=17.)
fig, ax = plt.subplots(figsize=(6, 3), tight_layout=True)
ax.plot(t_train, y_train, label='Entrenamiento')
ax.plot(t_valid, y_valid, label='Validación')
ax.plot(t_test, y_test, label='Prueba')
ax.set_title('Serie de tiempo Mackey-Glass');
ax.legend();

<IPython.core.display.Javascript object>


## (45%) Predicción con algoritmo LMS

1. Describa en detalle el algoritmo LMS e implemente un predictor a un paso basado en el **algoritmo LMS normalizado**
1. Considere el caso $\tau=17$. Entrene su predictor en el conjunto de entrenamiento y encuentre la combinación de parámetros $\mu$ y $L$ que minimiza el NMSE en el conjunto de validación. Se recomienda realizar un barrido logarítmo para $\mu$. Para $L$ pruebe al menos los siguientes valores [5, 10, 20, 30]. Comente sobre lo que observa.
1. Repita el paso anterior para el caso $\tau = 30$
1. Compare los resultados obtenidos con cada serie de tiempo ($\tau=17$ y $\tau=30$). Muestre la predicción en el conjunto de prueba versus su valor real. Muestre también los residuos. Discuta y analice sus resultados

## (45%) Predicción con algoritmo RLS

1. Describa en detalle el algoritmo RLS e implemente un predictor a un paso basado en el algoritmo RLS. Resalte las diferencias con el algoritmo LMS
1. Considere el caso $\tau=17$. Entrene su predictor en el conjunto de entrenamiento y encuentre la combinación de parámetros $\beta$ y $L$ que minimiza el NMSE en el conjunto de validación. Para $L$ pruebe al menos los siguientes valores [5, 10, 20, 30]. Comente sobre lo que observa.
1. Repita el paso anterior para el caso $\tau = 30$
1. Compare los resultados obtenidos con cada serie de tiempo. Muestre la predicción en el conjunto de prueba versus su valor real. Muestre también los residuos. Discuta y analice sus resultados

## (10%) Comparación entre LMS y RLS

1. Compare el mejor predictor LMS y RLS en el conjunto de test en términos de la calidad de la predicción y la velocidad a la que sigue los cambios. Comente y discuta


# Solucion

In [94]:
%matplotlib notebook
import numpy as np
import scipy.signal
import scipy.fft as sfft
import matplotlib.pylab as plt
from matplotlib import animation

from IPython.display import YouTubeVideo, HTML, Audio
from bokeh.layouts import column, row
from bokeh.models import CustomJS, ColumnDataSource, Slider
from bokeh.plotting import Figure, show, output_notebook
output_notebook()

## Predicción con algoritmo LMS

### Descripcion de algoritmo 

### Implementacion del predictor


In [95]:
class Filtro_NLMS:
    
    def __init__(self, L, mu, delta=1e-6, winit=None):
        self.L = L
        self.w = np.zeros(shape=(L+1, ))
        self.mu = mu
        self.delta = delta
        
    def update(self, un, dn):
        # Asumiendo que un = [u[n], u[n-1], ..., u[n-L]]
        unorm = np.dot(un, un) + self.delta
        yn = np.dot(self.w, un)
        self.w += 2*self.mu*(dn - yn)*(un/unorm)
        return yn

### Respuesta 1.1.2 (TAU = 17)

In [96]:
L = [5,10,15,20,25,30]
mus =  np.logspace(-2, 0, num=100)
y_pred = np.zeros(shape=(len(y_valid)))
best_mu_t17 = 0
best_L_t17 = 0
best_NMSE_t17 = 0
for i in range(len(L)):
    for j in range(len(mus)):
        myfilter = Filtro_NLMS(L=L[i], mu=mus[j])
        #Entrenamiento 
        for k in range(L[i]+1, len(y_train)):
            myfilter.update(y_train[k-L[i]-1:k][::-1], y_train[k])
        #validacion
        for k in rangenge(L[i]+1, len(y_valid)):
            y_pred[k] = myfilter.update(y_valid[k-L[i]-1:k][::-1], y_valid[k])
        if (i == 0 and j ==0):
            best_NMSE_t17 = NMSE(y_valid,y_pred)
            best_mu_t17= mus[j]
            best_L_t17 = L[i]
        else:
            error = NMSE(y_valid,y_pred)
            if(error < best_NMSE_t17):
                best_NMSE_t17 = error
                best_mu_t17= mus[j]
                best_L_t17 = L[i]
            

In [97]:
L = best_L_t17
mu = best_mu_t17
y_pred = np.zeros(shape=(len(y_test)))
myfilter = Filtro_NLMS(L=L, mu=mu)
#Entrenamiento 
for k in range(L+1, len(y_train)):
    myfilter.update(y_train[k-L-1:k][::-1], y_train[k])
#validacion

for k in range(L+1, len(y_valid)):
    y_pred[k] = myfilter.update(y_valid[k-L-1:k][::-1], y_valid[k])
    
fig, ax = plt.subplots(2, 1, figsize=(9, 7), tight_layout=True)
ax[0].plot(t_valid, y_valid, linewidth=2, alpha=0.75, label='real')
ax[0].set_title('Serie de tiempo real vs predecido (TAU = 17, mu = '+str(mu)+', L = '+str(L))
ax[0].plot(t_valid, y_pred, linewidth=2, alpha=0.75, label='predecido')
ax[0].legend()
ax[1].plot(t_valid,(y_valid-y_pred)**2, color = 'red', label= 'tau = 17')
ax[1].set_title('Residuos de la prediccion')

<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'Residuos de la prediccion')

#### Observaciones

### Respuesta 1.1.3 (TAU = 30)

In [98]:
import numpy as np
%matplotlib notebook
import matplotlib.pylab as plt
from mackey import MackeyGlass

# Puede calcular el error medio cuadrático normalizado usando:
NMSE = lambda y, yhat : np.sum((y - yhat)**2)/np.var(y)

# Gráfico
(t_train, y_train), (t_valid, y_valid), (t_test, y_test) = MackeyGlass(tau=30.)
fig, ax = plt.subplots(figsize=(6, 3), tight_layout=True)
ax.plot(t_train, y_train, label='Entrenamiento')
ax.plot(t_valid, y_valid, label='Validación')
ax.plot(t_test, y_test, label='Prueba')
ax.set_title('Serie de tiempo Mackey-Glass');
ax.legend();

<IPython.core.display.Javascript object>

In [114]:
L = [5,10,15,20,25,30]
mus =  np.logspace(-2, 0, num=100)
y_pred = np.zeros(shape=(len(y_valid)))
best_mu_t30 = 0
best_L_t30 = 0
best_NMSE_t30 = 0
for i in range(len(L)):
    for j in range(len(mus)):   
        myfilter = Filtro_NLMS(L=L[i], mu=mus[j])
        #Entrenamiento 
        for k in range(L[i]+1, len(y_train)):
            myfilter.update(y_train[k-L[i]-1:k][::-1], y_train[k])
        #validacion
        for k in range(L[i]+1, len(y_valid)):
            y_pred[k] = myfilter.update(y_valid[k-L[i]-1:k][::-1], y_valid[k])
        if (i == 0 and j ==0):
            best_NMSE_t30 = NMSE(y_valid,y_pred)
            best_mu_t30 = mus[j]
            best_L_t30 = L[i]
        else:
            error = NMSE(y_valid,y_pred)
            if(error < best_NMSE_t30):
                best_NMSE_t30 = error
                best_mu_t30= mus[j]
                best_L_t30 = L[i]
            

In [100]:
L = best_L_t30
mu = best_mu_t30
y_pred = np.zeros(shape=(len(y_test)))
myfilter = Filtro_NLMS(L=L, mu=mu)
#Entrenamiento 
for k in range(L+1, len(y_train)):
    myfilter.update(y_train[k-L-1:k][::-1], y_train[k])
#validacion
for k in range(L+1, len(y_valid)):
    y_pred[k] = myfilter.update(y_valid[k-L-1:k][::-1], y_valid[k])
    
fig, ax = plt.subplots(2, 1, figsize=(9, 7), tight_layout=True)
ax[0].plot(t_valid, y_valid, linewidth=2, alpha=0.75, label='real')
ax[0].set_title('Serie de tiempo real vs predecido (TAU = 30), mu = '+str(mu)+', L = '+str(L))
ax[0].plot(t_valid, y_pred, linewidth=2, alpha=0.75, label='predecido')
ax[0].legend()
ax[1].plot(t_valid,(y_valid-y_pred)**2, color = 'red', label= 'tau = 30')
ax[1].set_title('Residuos de la prediccion')

<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'Residuos de la prediccion')

#### Observaciones

### Respuesta 1.1.4

#### Comparacion resultados anteriores

#### Prediccion conjunto de pruebas

In [132]:
L30 = best_L_t30
mu30 = best_mu_t30
L17 = best_L_t17
mu17 = best_mu_t17

#tau = 17
(t_train17, y_train17), (t_valid17, y_valid17), (t_test17, y_test17) = MackeyGlass(tau=17.)
y_pred17 = np.zeros(shape=(len(y_test17)))
myfilter = Filtro_NLMS(L=L17, mu=mu17)
#Entrenamiento 
for k in range(L17+1, len(y_train17)):
    myfilter.update(y_train17[k-L17-1:k][::-1], y_train17[k])
#test
for k in range(L17+1, len(y_test17)):
    y_pred17[k] = myfilter.update(y_test17[k-L17-1:k][::-1], y_test17[k])
    
fig, ax = plt.subplots(3, 1, figsize=(9, 7), tight_layout=True)
ax[0].plot(t_test17, y_test17, linewidth=2, alpha=0.75, label='real')
ax[0].set_title('Serie de tiempo real vs predecido set de prueba (TAU = 17), mu = '+str(mu17)+', L = '+str(L17))
ax[0].plot(t_test17, y_pred17, linewidth=2, alpha=0.75, label='predecido')
ax[0].legend()

#tau = 30
(t_train30, y_train30), (t_valid30, y_valid30), (t_test30, y_test30) = MackeyGlass(tau=30.)
y_pred30 = np.zeros(shape=(len(y_test30)))
myfilter = Filtro_NLMS(L=L30, mu=mu30)
#Entrenamiento 
for k in range(L30+1, len(y_train30)):
    myfilter.update(y_train30[k-L30-1:k][::-1], y_train30[k])
#test
for k in range(L30+1, len(y_test30)):
    y_pred30[k] = myfilter.update(y_test30[k-L30-1:k][::-1], y_test30[k])
ax[1].plot(t_test30, y_test30, linewidth=2, alpha=0.75, label='real')
ax[1].plot(t_test30, y_pred30, linewidth=2, alpha=0.75, label='predecido')
ax[1].set_title('Serie de tiempo real vs predecido set de prueba (TAU = 30), mu = '+str(mu)+', L = '+str(L30))
ax[0].legend()


#Residuos
ax[2].plot(t_test17,(y_test17-y_pred17)**2, color = 'red', label= 'tau = 17')
ax[2].plot(t_test30,(y_test30-y_pred30)**2, color = 'blue', label= 'tau = 30')
ax[2].set_title('Residuos de la prediccion en el set de pruebas para tau = (30 y 17)')
ax[2].legend()

<IPython.core.display.Javascript object>

<matplotlib.legend.Legend at 0x18aa4a105b0>

#### Discusion y analisis

## Prediccion con algoritmo R