# Regresión
En este notebook exploraremos los conceptos básicos e implementación de la regresión lineal, para ajuste de curvas y la regresión logística para clasificación binaria.

## Regresión Lineal
Como ya se exploró anteriormente, podemos definir la regresión lineal como un ajuste de curvas en el cual nuestra hipótesis es una combinación lineal de las entradas y los parámetros.

### Hipótesis
Sea $\mathbf{x}$ un vector de entrada con $m$ elementos donde cada elemento se denota por $x_1, x_2, \dots x_m$, el vector $\mathbf{x}$ se corresponde con un vector de salida $\mathbf{y}$ con la misma cantidad de elementos. Cada elemento $x_i$ cuenta con su correspondiente valor de salida $y_i$. Sea $\mathbf{w}$ un vector que representa a los coeficientes o parámetros de la regresión lineal, y un elemento $b$ que se denomina el *bias* estos parámetros definen la naturaleza del hiperplano que representa a la solución. La función de hipótesis para la regresión lineal se define de la siguiente forma:

\begin{equation}
h(\mathbf{x}, \mathbf{w}, b) = w_1 x_1 + w_2 x_2 \dots w_m x_m + b
\end{equation}

### Función de costo
La función de costo está definida por el **error cuadrático medio** o MSE denotada por la siguiente ecuación:
\begin{equation}
J(\mathbf{w}, b) = \frac{1}{m} \sum_{i=1}^m(h(x_i)-y_i)^2
\end{equation}

### Descenso de gradiente
La forma de encontrar la solución con error mínimo se denomina **descenso de gradiente** y está definido de la siguiente forma:
\begin{equation}
Repetir: \\
    \mathbf{w} := \mathbf{w} - \alpha \frac{\partial{J}}{\partial{\mathbf{w}}}
\end{equation}

$\alpha$ es el *learning rate*


In [9]:
from sklearn.datasets import load_boston
import random
X, y = load_boston(return_X_y=True)
X = X.tolist()
y = y.tolist()

In [16]:
w = [random.random() for x in X[0]]
b = random.random()

In [18]:
def h(x,w,b):
    res = 0
    for i in range(len(x)):
        res += w[i]*x[i]
    res +=b
    return res
def cost(x, y, hyp, w, b):
    m = len(x)
    res = 0
    for i in range(len(x)):
        res += (hyp(x[i], w, b) - y[i])**2
    return res/(2*m)
    

In [38]:
def d_cost_w(x, y, hyp, w, b):
    # w
    m = len(x)
    deriv = []
    for j in range(len(w)):
        res = 0
        for i in range(len(x)):
            res += (hyp(x[i],w,b) - y[i])*x[i][j]
        res /= m
        
        deriv.append(res)
    return deriv
        
def d_cost_b(x, y, hyp, w, b):
    m = len(x)
    res = 0
    for i in range(len(x)):
        res += (hyp(x[i],w,b) - y[i])
    res /= m
    return res

In [51]:
print(X[0])

[0.00632, 18.0, 2.31, 0.0, 0.538, 6.575, 65.2, 4.09, 1.0, 296.0, 15.3, 396.9, 4.98]


In [50]:
from sklearn.datasets import load_boston
import random
X, y = load_boston(return_X_y=True)
X = X.tolist()
y = y.tolist()
w = [random.random() for x in X[0]]
b = random.random()
# entrenamiento
# repetir hasta la convergencia
alpha = 0.0001
iters = 1000

for i in range(iters):
    for j in range(len(w)):
        w[j] = w[j] - alpha * d_cost_w(X,y,h,w,b)[j]
    b = b - alpha * d_cost_b(X,y,h,w,b)
    print(cost(X,y,h,w,b))



2324083087.7331433
10505949589436.156
4.666243776251296e+16
2.071659668790065e+20
9.197400680371035e+23
4.083303871351069e+27
1.8128350598833118e+31
8.048313467353688e+34
3.573151860420973e+38
1.5863465394852303e+42
7.042788668490259e+45
3.1267362454807814e+49
1.388154608776432e+53
6.162890204290209e+56
2.736094051052e+60
1.2147240025452182e+64
5.392922811963074e+67
2.3942571641667064e+71
1.0629611377799346e+75
4.719152133449532e+78
2.09512804063134e+82
9.301589316280606e+85
4.129559727656266e+89
1.833370939569656e+93
8.139485135782791e+96
3.613628690502741e+100
1.6043167466966185e+104
7.12256970533727e+107
3.1621560587612216e+111
1.4038796885999468e+115
6.232703710504366e+118
2.7670886514267665e+122
1.2284844524135498e+126
5.454014091827753e+129
2.421379420424441e+133
1.07500241087389e+137
4.772610907802708e+140
2.1188617482970078e+144
9.406958151682296e+147
4.1763395718774196e+151
1.8541394506480448e+155
8.231689601102043e+158
3.6545640439940135e+162
1.6224905212492258e+166
7.2032545

OverflowError: (34, 'Numerical result out of range')

In [49]:
w = [random.random() for x in X[0]]
b = random.random()
alpha = 0.0001
for j in range(len(w)):
        w[j] = w[j] - alpha * d_cost_w(X,y,h,w,b)[j]
print(w)

[-0.13041028099047797, 0.11300622876816202, 0.2438671615392592, 0.8457186779237458, 0.7326673183097852, -0.059807872715958, -2.532970620988835, 0.7345899001357766, 0.6421357073257004, -7.657834787537038, 6.164333509739006, 98.15683814291361, -36.732057678560835]
