<img style="float: left;;" src='Figures/alinco.png' /></a>


# <center> <font color= #000047>  Módulo 1: Regresion Lineal, Multiple y Polinomial

## Regresión Lineal
Consideremos un polinomio de grado uno:

$$y = \beta_1 x + \beta_0.$$

Esta es una **línea recta** que tiene pendiente $\beta_1$. Sabemos que habrá una línea conectando dos puntos cualesquiera. Por tanto, *una ecuación polinómica de primer grado es un ajuste perfecto entre dos puntos*.

Si consideramos ahora un polinomio de segundo grado,

$$y = \beta_2 x^2 + \beta_1 x + \beta_0,$$

este se ajustará exactamente a tres puntos. Si aumentamos el grado de la función a la de un polinomio de tercer grado, obtenemos:

$$y = \beta_3 x^3 + \beta_2 x^2 + \beta_1 x + \beta_0,$$

que se ajustará a cuatro puntos.

**Ejemplos**
1. Encontrar la línea recta que pasa exactamente por los puntos $(0,1)$ y $(1,0)$.
2. Encontrar la parábola que pasa exactamente por los puntos $(-1,1)$, $(0,0)$ y $(1,1)$.

**Solución**
1. Consideramos $y=\beta_1 x + \beta_0$. Evaluando en el punto $(0,1)$, obtenemos $\beta_1(0) + \beta_0 = 1$. Ahora, evaluando en el punto $(1,0)$, obtenemos $\beta_1(1) + \beta_0 = 0$. De esta manera,
$$\left[\begin{array}{cc} 1 & 0 \\ 1 & 1\end{array}\right]\left[\begin{array}{c} \beta_0 \\ \beta_1\end{array}\right]=\left[\begin{array}{c} 1 \\ 0\end{array}\right].$$
Resolviendo, $\beta_0=-\beta_1=1$.

2. Consideramos $y=\beta_2 x^2 + \beta_1 x + \beta_0$. Evaluando en el punto $(-1,1)$, obtenemos $\beta_2(-1)^2 + \beta_1(-1) + \beta_0 = 1$. Ahora, evaluando en el punto $(0,0)$, obtenemos $\beta_2(0)^2 + \beta_1(0) + \beta_0 = 0$. Finalmente, evaluando en el punto $(1,1)$, obtenemos $\beta_2(1)^2 + \beta_1(1) + \beta_0 = 1$. De esta manera,
$$\left[\begin{array}{ccc} 1 & -1 & 1 \\ 1 & 0 & 0 \\ 1 & 1 & 1 \end{array}\right]\left[\begin{array}{c} \beta_0 \\ \beta_1 \\ \beta_2 \end{array}\right]=\left[\begin{array}{c} 1 \\ 0 \\ 1 \end{array}\right].$$
Resolviendo, $\beta_0=\beta_1=0$ y $\beta_2=1$.

### ¿Qué tienen en común los anteriores problemas?
Las curvas están completamente determinadas por los puntos (datos limpios, suficientes y necesarios).

Esto se traduce en que, al llevar el problema a un sistema de ecuaciones lineales, existe una única solución: **no hay necesidad, ni se puede optimizar nada**.

La realidad es que los datos que encontraremos en nuestra vida profesional se parecen más a esto...

In [None]:
import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns
import random

In [None]:
from sklearn import datasets
X, y = datasets.make_regression(n_samples=100, n_features=1, noise=20, random_state=4, bias=50)

plt.figure(figsize=(8,6))
plt.scatter(X[:,0],y, color='b', marker='o', s=30)
plt.xlabel('$x$')
plt.ylabel('$y$')
plt.show()

### ¿Cómo ajustamos una curva a esto?

Consideramos entonces ajustes de la forma 

$$\hat{f}(x) = \beta_0+\beta_1 x = \left[1 \quad x\right]\left[\begin{array}{c} \beta_0 \\ \beta_1 \end{array}\right]=\left[1 \quad x\right]\boldsymbol{\beta}$$ (lineas rectas).


Para decir '*mejor*', tenemos que definir algún sentido en que una recta se ajuste *mejor* que otra.

> El objetivo es seleccionar los coeficientes $\boldsymbol{\beta}=\left[\beta_0 \quad \beta_1 \right]^T$, de forma que la función evaluada en los puntos $x_i$ ($\hat{f}(x_i)$) aproxime los valores correspondientes $y_i$.

> El objetivo es encontrar los $\boldsymbol{\beta}=\left[\beta_0 \quad \beta_1 \right]^T$ que minimiza El error cuadrático medio (MSE):
$$\frac{1}{2n}\sum_{i=1}^{n}(y_i-\hat{f}(x_i))^2=\frac{1}{2n}\sum_{i=1}^{n}(y_i-(\beta_0+ \beta_1x_i))^2=\frac{1}{2n}\sum_{i=1}^{n}(y_i-\left[1 \quad x_i\right]\boldsymbol{\beta})^2=\frac{1}{2n}\left|\left|\boldsymbol{y}-\boldsymbol{X}\boldsymbol{\beta}\right|\right|^2,$$

donde $\boldsymbol{y}=\left[y_1\quad\dots\quad y_n\right]^T$, y $\boldsymbol{X}=\left[\begin{array}{ccc}1 & x_1\\ \vdots & \vdots \\ 1 & x_n\end{array}\right].$ 

## Gradiente Descendente

Partiendo del **MSE**:

$$ J(\beta) = \frac{1}{2m}\sum_{i=1}^m (\hat{y}(x_i) - y_i)^2$$  

$\beta = [\beta_0, \beta_1]$


El algoritmo de gradiente descendente es un método de optimización local en el que, en cada paso, empleamos el gradiente negativo como dirección de descenso. 

$$\boldsymbol{\beta}_{k} = \boldsymbol{\beta}_{k-1}\nabla J(\boldsymbol{\beta}_{k-1})$$

Para una regresión lineal tendríamos que las ecuaciones del algoritmo de gradiente descendente son:


$$ \nabla J(\boldsymbol{\beta}) = \left[\begin{array}{c} \frac{1}{m} \sum_{i=1}^m (\hat{y}(x_i) - y_i) \\ 
\frac{1}{m} \sum_{i=1}^m (\hat{y}(x_i) - y_i)x_i\end{array}\right].$$


$$ \beta_0 = \beta_0 - \alpha \frac{1}{m} \sum_{i=1}^m (\hat{y}(x_i) - y_i)$$

$$ \beta_1 = \beta_1 - \alpha \frac{1}{m} \sum_{i=1}^m (\hat{y}(x_i) - y_i)x_i$$

<img alt="Datos categóricos con Python" title="GradientDescendt" src="https://cdn-images-1.medium.com/max/1600/0*fU8XFt-NCMZGAWND." high=300px, width=300px>



## Linear Regression Class

## Train-Test-Split

### Ejemplo 1:

In [None]:
# Cargar de la Librería LinearRegression


In [None]:
# Aplicar un Modelo de regresión Lineal

#1.- Entrenamiento del modeloreg_model = LinearRegression()


#2.- Predecir los valores de x


#3.- Graficar el modelo con los datos

#4.- Evaluar el modelo : 


## Regression Polinomial 

Ahora, la ecuación para la Regresión Polinomial será la siguiente:

$$y =  \beta_0 + \beta_1 x + \beta_2 x^2 + ... + \beta_n x^n$$


## Regression Multiple 

$$y =  \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_n x_n$$


## Actividad:



Considere el dataset "real_state.csv" que se encuentra en la carpeta de Data, realice un Análisis Exploratorio de Datos. En base a lo obtenido seleccione una variable a predecir ($y$) y un conjunto de variables para entrenar ($X$) un modelo de regresión lineal. Utilice la librería de la clase, después compare sus resultados con un modelo de regresion lineal creado mediante la librería sklearn.

> Programe la métrica r2_score y mse en su librería, estas métricas sirven para medir el rendimiento de los modelos de regresión.

> Utilice las métricas mean_squared_error y r2_score para evaluar el modelo

