# Ejercicio: Regresión Lineal usando Scikit-Learn

Existe una herramienta de aprendizaje automático de código abierto y de uso comercial llamada [scikit-learn](https://scikit-learn.org/stable/index.html). Este toolkit contiene implementaciones de muchos de los algoritmos que trabajarás en este curso.

## Objetivos
En este ejercicio usted:
- Utilizará scikit-learn para implementar regresión lineal usando una solución de forma cerrada basada en la ecuación normal

## Herramientas
Utilizará funciones de scikit-learn así como matplotlib y NumPy.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from ejerc_utils_multi import load_house_data
plt.style.use('./deeplearning.mplstyle')
np.set_printoptions(precision=2)

<a name="toc_40291_2"></a>
# Regresión Lineal, solución de forma cerrada
Scikit-learn tiene el [modelo de regresión lineal](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression) que implementa una regresión lineal de forma cerrada.

Vamos a usar los datos de los primeros ejercicios: una casa de 1000 metros cuadrados se vendió por $300,000 y una casa de 2000 metros cuadrados se vendió por $500,000.

| Tamaño (1000 metros cuadrados) | Precio (miles de dólares) |
|-------------------------------|--------------------------|
| 1                             | 300                      |
| 2                             | 500                      |

### Cargar el conjunto de datos

In [None]:
X_train = np.array([1.0, 2.0])   # entradas (características)
y_train = np.array([300, 500])   # valor objetivo

### Crear y ajustar el modelo
El siguiente código realiza la regresión usando scikit-learn.
El primer paso crea un objeto de regresión.
El segundo paso utiliza uno de los métodos asociados al objeto, `fit`. Esto realiza la regresión, ajustando los parámetros a los datos de entrada. La herramienta espera una matriz X de dos dimensiones.

In [None]:
linear_model = LinearRegression()
# X debe ser una matriz 2-D
linear_model.fit(X_train.reshape(-1, 1), y_train) 

### Ver Parámetros
Los parámetros $\mathbf{w}$ y $\mathbf{b}$ se denominan 'coeficientes' e 'intercepto' en scikit-learn.

In [None]:
b = linear_model.intercept_
w = linear_model.coef_
print(f"w = {w:}, b = {b:0.2f}")
print(f"predicción 'manual': f_wb = wx+b : {1200*w + b}")

### Realizar Predicciones

Llamar a la función `predict` genera predicciones.

In [None]:
y_pred = linear_model.predict(X_train.reshape(-1, 1))

print("Predicción en el conjunto de entrenamiento:", y_pred)

X_test = np.array([[1200]])
print(f"Predicción para una casa de 1200 metros cuadrados: ${linear_model.predict(X_test)[0]:0.2f}")

## Segundo Ejemplo
El segundo ejemplo es de un ejercicio anterior con múltiples X entradas (características). Los valores finales de los parámetros y las predicciones son muy cercanos a los resultados de la ejecución sin normalizar ('long-run') de ese ejercicio. Esa ejecución sin normalizar tomó horas en producir resultados, mientras que esto es casi instantáneo. La solución de forma cerrada funciona bien en conjuntos de datos pequeños como estos, pero puede ser computacionalmente exigente en conjuntos de datos grandes.

>La solución de forma cerrada no requiere normalización.

In [None]:
# cargar el conjunto de datos
X_train, y_train = load_house_data()
X_features = ['tamaño(metros²)','habitaciones','pisos','antigüedad']

In [None]:
linear_model = LinearRegression()
linear_model.fit(X_train, y_train) 

In [None]:
b = linear_model.intercept_
w = linear_model.coef_
print(f"w = {w:}, b = {b:0.2f}")

In [None]:
print(f"Predicción en el conjunto de entrenamiento:\n {linear_model.predict(X_train)[:4]}" )
print(f"predicción usando w,b:\n {(X_train @ w + b)[:4]}")
print(f"Valores objetivo \n {y_train[:4]}")

x_house = np.array([1200, 3,1, 40]).reshape(-1,4)
x_house_predict = linear_model.predict(x_house)[0]
print(f" precio predicho de una casa con 1200 metros cuadrados, 3 habitaciones, 1 piso, 40 años de antigüedad = ${x_house_predict*1000:0.2f}")

## ¡Felicitaciones!
En este ejercicio usted:
- utilizó una herramienta de aprendizaje automático de código abierto, scikit-learn
- implementó regresión lineal usando una solución de forma cerrada con esa herramienta