In [None]:
import numpy as np
import matplotlib.pyplot as plt
import ipywidgets as widgets
%matplotlib widget
layout = widgets.Layout(align_items = 'center')

<h1> APRENDIZAJE AUTOMÁTICO </h1>

<ol>
    <li><b>APRENDIZAJE SUPERVISADO</b> Hace uso de un set de datos para el cual se conoce la salida
        correcta. Se busca encontrar la relación entre la entrada y la salida.</li>
        <ol> 
            <li><b>REGRESIÓN</b> Intenta predecir resultados de una salida continua. 
                Los valores de entrada se mapean a una función continua.</li> 
            <li><b>CLASIFICACIÓN</b> Intenta predecir resultados de una salida discreta. 
                Los valores de entrada se mapean a categorías discretas.</li>
        </ol>
    <br>
    <li><b>APRENDIZAJE NO SUPERVISADO</b> Hace uso de un set de datos para el cual no se conoce la 
        salida correcta, no se conoce la categoría a la que pertenecen los datos. 
        Se busca derivar una estructura a partir de los datos, intentar agrupar los mismos.</li>

</ol>
<center>
<img src="./figures/aprendizajeAutomatico.png"  height="800" width="800"/>
</center>

<h2> APRENDIZAJE SUPERVISADO </h2>
A partir de un set de <b>datos de entrenamiento</b> se busca aprender una 
función denominada <b>hipótesis h(x)</b> que permita predecir correctamente 
el valor de <b>salida y</b> correspondiente.
<center>
<img src="./figures/learning-supervised.jpg"  height="500" width="500"/>
</center>

<hr>
<h2> REGRESIÓN LINEAL </h2>

La regresión lineal es un modelo lineal, el cual asume una relación lineal entre las variables de entrada (x) y la variable de salida (y).
Cuando hay una sola variable de entrada, el método se denomina <b>regresión lineal simple</b>. Cuando las variables de entrada son múltiples, el método se denomina <b>regresión lineal múltiple</b>.

<ol>
    <li> La función hipótesis de regresión lineal simple es de la forma:
            $$
            h_\theta(x^i)=\theta_0+\theta_1x_1^i
            $$
    </li>   
    <br>  
    <li> La función hipótesis de regresión lineal múltiple es de la forma:
            $$
            h_\theta(x^i)=\theta_0+\theta_1x_1^i+\theta_2x_2^i+...+\theta_nx_n^i
            $$</li>      
<br>
<ul> 
     <li> $(x^i,y^i)$ es un ejemplo de entrenamiento.</li>   
     <li> $x^i$ denota las variables de entrada del ejemplo $i$.</li>
     <li> $y^i$ denota la salida del ejemplo $i$ que se intenta predecir.</li>
     <li> $x_j^i$ es el valor de la variable $j$ del ejemplo de entrenamiento $i$.</li>
     <li> $x_0^i$ es siempre igual a 1.</li>
     <li> $m$ es el número total de ejemplos de entrenamiento.</li>
     <li> $n$ es el número total de variables de entrada (features).</li>
</ul>
</ol>


<h3>FUNCIÓN DE COSTO</h3>

Permite medir la <b>precisión</b> de la función hipótesis. Para los modelos 
de regresión lineal se utiliza la función de <b>error cuadrático medio</b>, 
la cual realiza un promedio de la diferencia de todos los resultados de la 
hipótesis para los valores de x, $h_\theta(x)$, y su salida correcta, y, 
correspondiente.
    
$$
J(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(ŷ_i-y_i)^2 = \frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)^2
$$

La función <b>$J(\theta)$</b> obtenida es una función <b>convexa</b>. El 
objetivo es lograr la mejor hipótesis que permita predecir los valores 
correctos de salida, para ello es necesario <b>minimizar</b> la función 
de costo <b>$J(\theta)$</b>, con respecto a los valores de $\theta$.

**Una hipótesis que permita predecir correctamente todos los valores de 
salida del set de datos de entrenamiento tiene un valor de $J(\theta)$ 
igual a 0.**

In [None]:
x_lr = np.array([1, 2, 3]) 
y_lr = np.array([1, 2, 3])
m_lr = x_lr.size


def make_plot_lr(theta0 = 0, theta1 = 1):
    h = theta0 + theta1 * x_lr
    return h

slider0_lr = widgets.SelectionSlider(
    options = np.arange(-5,5.5,0.5),
    description = r'$\theta_0$',
    value = 0
)

slider1_lr = widgets.SelectionSlider(
    options = np.arange(-5,5.5,0.5),
    description = r'$\theta _1$',
    value = 1
)

out_lr = widgets.Output()

with out_lr:
    fig_lr = plt.figure(figsize = (6,4),tight_layout = True)
    fig_lr.suptitle('Hipótesis vs Valores de salida reales')
    ax_lr = fig_lr.add_subplot(111)
    h_lr = make_plot_lr(slider0_lr.value, slider1_lr.value)
    
    line_lr, = ax_lr.plot(x_lr, h_lr,  label = 'h')
    ax_lr.plot(x_lr, y_lr, 'o', label = 'y') 
    ax_lr.set_ylim(0, 5)    
    ax_lr.set_xlabel('x')
    ax_lr.set_ylabel('y')  
    ax_lr.grid(True)
    ax_lr.legend()

out2_lr = widgets.HTMLMath(value = f'J = {(1/(2 * m_lr)*np.sum(np.square(h_lr - y_lr))):.2f}')

def update_plot_lr(change):
    h_lr = make_plot_lr(slider0_lr.value, slider1_lr.value)
    line_lr.set_ydata(h_lr)
    out2_lr.value =  f'J = {(1/(2 * m_lr) * np.sum(np.square(h_lr - y_lr))):.2f}'
    
    
slider0_lr.observe(update_plot_lr, 'value')
slider1_lr.observe(update_plot_lr, 'value')

widgets.VBox([out_lr,slider0_lr, slider1_lr, out2_lr],layout = layout)


<hr>
<h2>REGRESIÓN POLINÓMICA</h2>
Es posible modificar el comportamiento de la curva de la 
<strong>función hipótesis</strong> haciendo que la misma 
sea <strong>no lineal</strong>, de manera que se adecue 
mejor a los datos de entrenamiento. Se pueden combinar 
distintas variables en una nueva, o crear nuevas variables 
a partir de las potencias o raices de las variables ya 
existentes.

Si la función hipótesis original es $h_\theta(x)=\theta_0+\theta_1x_1$ 
se pueden crear variables originales basadas en $x_1$ 
para obtener, por ejemplo, una función hipótesis cuadrática 
$h_\theta(x)=\theta_0+\theta_1x_1+\theta_1x_1^2$, o cúbica 
$h_\theta(x)=\theta_0+\theta_1x_1+\theta_1x_1^2+\theta_1x_1^3$

In [None]:
x_polyR = np.arange(1, 15, 1)
y_polyR = np.power(x_polyR,3)

x_polyR2 = np.power(x_polyR,2) 
x_polyR3 = np.power(x_polyR,3) 

h_polyR1 = -196 + 211 * x_polyR 
h_polyR2 = 1 + 0 * x_polyR + 14 * x_polyR2 
h_polyR3 = 0 + 0 * x_polyR + 0 * x_polyR2 + 1 * x_polyR3
           
out_polyR = widgets.Output()

with out_polyR:
    fig_polyR, ax_polyR = plt.subplots(figsize = (6,4),tight_layout = True)
    fig_polyR.suptitle(r'Regresión polinómica')
    ax_polyR.plot(x_polyR,y_polyR,'o',label='Valores de salida')
    ax_polyR.plot(x_polyR,h_polyR1, label='Función hipótesis lineal')
    ax_polyR.plot(x_polyR,h_polyR2, label='Función hipótesis cuadrática')
    ax_polyR.plot(x_polyR,h_polyR3, label='Función hipótesis cúbica')
    ax_polyR.set_xlabel('x')
    ax_polyR.grid(True)
    ax_polyR.legend();
    
widgets.VBox([out_polyR],layout = layout)