# Regresión
En este notebook exploraremos los conceptos básicos e implementación de la regresión lineal, para ajuste de curvas y la regresión logística para clasificación binaria.

## Regresión Lineal
Como ya se exploró anteriormente, podemos definir la regresión lineal como un ajuste de curvas en el cual nuestra hipótesis es una combinación lineal de las entradas y los parámetros.

### Hipótesis
Sea $\mathbf{x}$ un vector de entrada con $m$ elementos donde cada elemento se denota por $x_1, x_2, \dots x_m$, el vector $\mathbf{x}$ se corresponde con un vector de salida $\mathbf{y}$ con la misma cantidad de elementos. Cada elemento $x_i$ cuenta con su correspondiente valor de salida $y_i$. Sea $\mathbf{w}$ un vector que representa a los coeficientes o parámetros de la regresión lineal, y un elemento $b$ que se denomina el *bias* estos parámetros definen la naturaleza del hiperplano que representa a la solución. La función de hipótesis para la regresión lineal se define de la siguiente forma:

\begin{equation}
h(\mathbf{x}, \mathbf{w}, b) = w_1 x_1 + w_2 x_2 \dots w_m x_m + b
\end{equation}

### Función de costo
La función de costo está definida por el **error cuadrático medio** o MSE denotada por la siguiente ecuación:
\begin{equation}
J(\mathbf{w}, b) = \frac{1}{m} \sum_{i=1}^m(h(x_i)-y_i)^2
\end{equation}

### Descenso de gradiente
La forma de encontrar la solución con error mínimo se denomina **descenso de gradiente** y está definido de la siguiente forma:
\begin{equation}
Repetir: \\
    \mathbf{w} := \mathbf{w} - \alpha \frac{\partial{J}}{\partial{\mathbf{w}}}
\end{equation}

$\alpha$ es el *learning rate*


In [None]:
from sklearn.datasets import load_boston
import random
X, y = load_boston(return_X_y=True)
X = X.tolist()
y = y.tolist()

In [None]:
w = [random.random() for x in X[0]]
b = random.random()

In [None]:
def h(x,w,b):
    res = 0
    for i in range(len(x)):
        res += w[i]*x[i]
    res +=b
    return res
def cost(x, y, hyp, w, b):
    m = len(x)
    res = 0
    for i in range(len(x)):
        res += (hyp(x[i], w, b) - y[i])**2
    return res/(2*m)
    

In [None]:
def d_cost_w(x, y, hyp, w, b):
    # w
    m = len(x)
    deriv = []
    for j in range(len(w)):
        res = 0
        for i in range(len(x)):
            res += (hyp(x[i],w,b) - y[i])*x[i][j]
        res /= m
        
        deriv.append(res)
    return deriv
        
def d_cost_b(x, y, hyp, w, b):
    m = len(x)
    res = 0
    for i in range(len(x)):
        res += (hyp(x[i],w,b) - y[i])
    res /= m
    return res

In [None]:
print(X[0])

In [None]:
from sklearn.datasets import load_boston
import random
X, y = load_boston(return_X_y=True)
X = X.tolist()
y = y.tolist()
w = [random.random() for x in X[0]]
b = random.random()
# entrenamiento
# repetir hasta la convergencia
alpha = 0.0001
iters = 1000

for i in range(iters):
    for j in range(len(w)):
        w[j] = w[j] - alpha * d_cost_w(X,y,h,w,b)[j]
    b = b - alpha * d_cost_b(X,y,h,w,b)
    print(cost(X,y,h,w,b))



## normalizacion de vectores de entrada *extra*
Los pasos para normalizar las entradas:
1. Encontrar los rangos (min, max) de cada una de las columnas del vector
2. Generar una funcion (lista, operacion) que convierta un vector a su forma normalizada
3. Entrenar el algoritmo con esos vectores normalizados

Si la normalización esta bien implementada, el entrenamiento debería realizarse correctamente.
