<a href="https://colab.research.google.com/github/WellcomePeujio/Regresion-Lineal-Multiple-para-la-Prediccion/blob/main/Regresi%C3%B3n_Lineal_M%C3%BAltiple.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Regresión Lineal Múltiple para la Predicción

## Problema

Se quiere predecir el precio de una casa basado en su tamaño en metros cuadrados y su antigüedad en años.

## Datos Hipotéticos

| Casa | Tamaño (m²) | Antigüedad (años) | Precio (miles de $) |
|------|-------------|-------------------|---------------------|
| 1    | 80          | 15                | 150                 |
| 2    | 100         | 10                | 180                 |
| 3    | 120         | 5                 | 250                 |
| 4    | 140         | 7                 | 300                 |
| 5    | 160         | 3                 | 350                 |
| 6    | 90          | 12                | 170                 |
| 7    | 110         | 8                 | 220                 |
| 8    | 130         | 4                 | 270                 |

## Preguntas:

1. **Realiza una regresión lineal múltiple utilizando este conjunto de datos.**
2. **Predice el precio de una casa con 120 m² y 10 años de antigüedad.**


# Resolución Matemática: Regresión Lineal Múltiple

## Datos del problema

Se tiene el siguiente conjunto de datos:

| Casa | Tamaño (m²) | Antigüedad (años) | Precio (miles de $) |
|------|-------------|-------------------|---------------------|
| 1    | 80          | 15                | 150                 |
| 2    | 100         | 10                | 180                 |
| 3    | 120         | 5                 | 250                 |
| 4    | 140         | 7                 | 300                 |
| 5    | 160         | 3                 | 350                 |
| 6    | 90          | 12                | 170                 |
| 7    | 110         | 8                 | 220                 |
| 8    | 130         | 4                 | 270                 |

## 1. Fórmula de la Regresión Lineal Múltiple

La fórmula general de la regresión lineal múltiple es:

$$
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2
$$

Donde:
- \$( Y \$) es la variable dependiente (precio de la casa),
- \$( X_1 \$) es la variable independiente 1 (tamaño en m²),
- \$( X_2 \$) es la variable independiente 2 (antigüedad en años),
- \$( \beta_0 \$) es la ordenada al origen (intercepto),
- \$( \beta_1 \$) es el coeficiente de regresión para \$( X_1 \$),
- \$( \beta_2 \$) es el coeficiente de regresión para \$( X_2 \$).

### Datos para la regresión:

- \$( Y \$): Precio de la casa en miles de dólares
- \$( X_1 \$): Tamaño en metros cuadrados
- \$( X_2 \$): Antigüedad en años

## 2. Cálculo de los coeficientes de la regresión

Usamos el método de los mínimos cuadrados para calcular los coeficientes \$( \beta_0 \$), \$( \beta_1 \$), y \$( \beta_2 \$). A través de este método, obtenemos las siguientes ecuaciones:

$$
\beta_1 = \frac{\sum(X_1 - \bar{X}_1)(Y - \bar{Y})}{\sum(X_1 - \bar{X}_1)^2}
$$

$$
\beta_2 = \frac{\sum(X_2 - \bar{X}_2)(Y - \bar{Y})}{\sum(X_2 - \bar{X}_2)^2}
$$

$$
\beta_0 = \bar{Y} - \beta_1 \bar{X}_1 - \beta_2 \bar{X}_2
$$

Donde:
- \$( \bar{X}_1 \$) es el promedio de los tamaños,
- \$( \bar{X}_2 \$) es el promedio de las antigüedades,
- \$( \bar{Y} \$) es el promedio de los precios.

## 3. Predicción del precio de una casa con 120 m² y 10 años de antigüedad

Una vez que tenemos los coeficientes \$( \beta_0 \$), \$( \beta_1 \$), y \$( \beta_2 \$), usamos la fórmula de la regresión para predecir el precio de una casa con \$( X_1 = 120 \$) m² y \$( X_2 = 10 \$) años de antigüedad:

$$
Y = \beta_0 + \beta_1 \times 120 + \beta_2 \times 10
$$

El resultado nos dará el precio estimado de la casa en miles de dólares.




In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from sklearn.linear_model import LinearRegression

# Datos hipotéticos
data = {
    'Tamaño (m²)': [80, 100, 120, 140, 160, 90, 110, 130],
    'Antigüedad (años)': [15, 10, 5, 7, 3, 12, 8, 4],
    'Precio (miles $)': [150, 180, 250, 300, 350, 170, 220, 270]
}

# Convertir los datos a un DataFrame
df = pd.DataFrame(data)

# Variables independientes (Tamaño y Antigüedad)
X = df[['Tamaño (m²)', 'Antigüedad (años)']]

# Variable dependiente (Precio)
y = df['Precio (miles $)']

# Crear el modelo de regresión lineal múltiple
modelo = LinearRegression()
modelo.fit(X, y)

# Coeficientes de la regresión
intercepto = modelo.intercept_
coeficientes = modelo.coef_
print(f"Intercepto (β0): {intercepto}")
print(f"Coeficiente para Tamaño (β1): {coeficientes[0]}")
print(f"Coeficiente para Antigüedad (β2): {coeficientes[1]}")

# Predicción para una casa con 120 m² y 10 años de antigüedad
nueva_casa = np.array([[120, 10]])
prediccion_precio = modelo.predict(nueva_casa)
print(f"El precio predicho para una casa de 120 m² y 10 años de antigüedad es: {prediccion_precio[0]:.2f} miles de dólares")

# Generar una gráfica 3D para mostrar la evolución del precio en función del tamaño y antigüedad
fig = plt.figure(figsize=(10, 7))
ax = fig.add_subplot(111, projection='3d')

# Graficar los datos reales
ax.scatter(df['Tamaño (m²)'], df['Antigüedad (años)'], df['Precio (miles $)'], color='blue', label='Datos Reales')

# Superficie de regresión
tamaño_range = np.linspace(df['Tamaño (m²)'].min(), df['Tamaño (m²)'].max(), 10)
antigüedad_range = np.linspace(df['Antigüedad (años)'].min(), df['Antigüedad (años)'].max(), 10)
tamaño_grid, antigüedad_grid = np.meshgrid(tamaño_range, antigüedad_range)
prediccion_grid = modelo.predict(np.c_[tamaño_grid.ravel(), antigüedad_grid.ravel()]).reshape(tamaño_grid.shape)

# Graficar la superficie de predicción
ax.plot_surface(tamaño_grid, antigüedad_grid, prediccion_grid, color='red', alpha=0.6)

# Etiquetas
ax.set_xlabel('Tamaño (m²)')
ax.set_ylabel('Antigüedad (años)')
ax.set_zlabel('Precio (miles $)')
ax.set_title('Regresión Lineal Múltiple: Predicción de Precios de Casas')

plt.show()

# Ecuación Final de la Regresión Lineal Múltiple

La ecuación final de la regresión lineal múltiple, utilizando los coeficientes encontrados, es la siguiente:

$$
 Y  = -85.12 + 2.71  X_1  + 0.86  X_2
$$

Ahora, utilizamos estos coeficientes para predecir el precio de una casa con **120 metros cuadrados** y **10 años de antigüedad**. El precio predicho se obtiene utilizando la siguiente fórmula de regresión:

$$
Y = -85.1175 + 2.7057 \times 120 + 0.8621 \times 10
$$

El precio predicho es:

$$
Y = 248.12 \, \text{miles de dólares}
$$
