<a href="https://colab.research.google.com/github/WellcomePeujio/-Prediccion-de-Ventas-con-Regresion-Lineal/blob/main/Predicci%C3%B3n_de_Ventas_con_Regresi%C3%B3n_Lineal.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Predicción de Ventas con Regresión Lineal

**Problema**: Una empresa ha recopilado datos sobre sus ventas mensuales $(y)$ y el gasto en publicidad $(x)$ durante los últimos 12 meses. La empresa quiere utilizar un modelo de regresión lineal para predecir las ventas en función del gasto en publicidad.

**Datos Recopilados**:

| Mes | Gasto en publicidad ($1000) (x) | Ventas (1000) (y) |
|-----|-------------------------------|--------------------|
| 1   | 2                             | 20                 |
| 2   | 3                             | 30                 |
| 3   | 5                             | 50                 |
| 4   | 7                             | 70                 |
| 5   | 8                             | 80                 |
| 6   | 9                             | 85                 |
| 7   | 10                            | 88                 |
| 8   | 11                            | 90                 |
| 9   | 13                            | 95                 |
| 10  | 14                            | 100                |
| 11  | 15                            | 110                |
| 12  | 17                            | 120                |

La fórmula de la regresión lineal simple es:

$$
y = \beta_0 + \beta_1 x
$$

Donde:
- $(y)$ es la variable dependiente (ventas en $1000).

- $(x)$ es la variable independiente (gasto en publicidad en $1000).

- $(\beta_0)$ es el intercepto (valor de $y$ cuando $x = 0$).

- $(\beta_1)$ es el coeficiente de regresión (pendiente de la recta).

**Preguntas**:

1. Encuentra los valores de $(\beta_0)$ (intercepto) y $(\beta_1)$ (pendiente) utilizando la fórmula de mínimos cuadrados.

2. Usa el modelo de regresión lineal para predecir las ventas si el gasto en publicidad es de $12,000.

3. Traza la gráfica de dispersión de los datos junto con la línea de regresión.

4. ¿Cuál es el error cuadrático medio (MSE) de las predicciones?


# Desarrollo Matemático de la Predicción de Ventas con Regresión Lineal

## Paso 1: Cálculo de los Promedios

Para calcular los coeficientes de la regresión lineal, primero encontramos los promedios de $x$ y $y$:

$$
\bar{x} = \frac{\sum x}{n} = \frac{2 + 3 + 5 + 7 + 8 + 9 + 10 + 11 + 13 + 14 + 15 + 17}{12} = 9.5
$$

$$
\bar{y} = \frac{\sum y}{n} = \frac{20 + 30 + 50 + 70 + 80 + 85 + 88 + 90 + 95 + 100 + 110 + 120}{12} = 78.17
$$

## Paso 2: Cálculo de la Pendiente $(\beta_1)$

Usamos la fórmula de mínimos cuadrados para encontrar $\beta_1$:

$$
\beta_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}
$$

Cálculos intermedios:
- Numerador: $\sum (x_i - \bar{x})(y_i - \bar{y}) = 1559$
- Denominador: $\sum (x_i - \bar{x})^2 = 249$

Por lo tanto, la pendiente es:

$$
\beta_1 = \frac{1559}{249} \approx 6.26
$$

## Paso 3: Cálculo del Intercepto $(\beta_0)$

Usamos la fórmula para el intercepto:

$$
\beta_0 = \bar{y} - \beta_1 \cdot \bar{x}
$$

Sustituyendo los valores:

$$
\beta_0 = 78.17 - 6.26 \cdot 9.5 \approx 18.69
$$

## Paso 4: Predicción para un Gasto en Publicidad de $12,000

La ecuación de regresión lineal es:

$$
y = \beta_0 + \beta_1 \cdot x
$$

Para $x = 12$:

$$
y = 18.69 + 6.26 \cdot 12 \approx 93.82
$$

Por lo tanto, si el gasto en publicidad es de 12,000, las ventas estimadas son **$93,820**.

## Paso 5: Cálculo del Error Cuadrático Medio (MSE)

El error cuadrático medio se define como:

$$
MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y_i})^2
$$

donde:
- $n = 12$ es el número de observaciones,
- $y_i$ son los valores reales de ventas,
- $\hat{y_i}$ son los valores predichos por el modelo.

Sustituyendo los valores, el MSE es:

$$
MSE \approx 51.06
$$

## Resultados Finales

- **Intercepto $(\beta_0)$**: 18.69
- **Pendiente $(\beta_1)$**: 6.26
- **Predicción de ventas para $x = 12$**: $93.82 (en miles)$
- **Error Cuadrático Medio (MSE)**: 51.06

Estos resultados coinciden con el desarrollo numérico detallado y el modelo de regresión lineal implementado en Python.


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Datos del problema
x = np.array([2, 3, 5, 7, 8, 9, 10, 11, 13, 14, 15, 17]).reshape(-1, 1)  # Gasto en publicidad ($1000)
y = np.array([20, 30, 50, 70, 80, 85, 88, 90, 95, 100, 110, 120])  # Ventas ($1000)

# Crear el modelo de regresión lineal
modelo = LinearRegression()
modelo.fit(x, y)

# Coeficientes de la regresión
beta_0 = modelo.intercept_
beta_1 = modelo.coef_[0]

# Predicción para un gasto en publicidad de $12,000
gasto_publicidad = 12
prediccion_ventas = modelo.predict([[gasto_publicidad]])

# Cálculo del Error Cuadrático Medio (MSE)
y_pred = modelo.predict(x)
mse = mean_squared_error(y, y_pred)

# Generar la línea de regresión
x_linea = np.linspace(0, 18, 100).reshape(-1, 1)
y_linea = modelo.predict(x_linea)

# Crear la gráfica de dispersión y la línea de regresión
plt.figure(figsize=(12, 6))
plt.scatter(x, y, color="blue", label="Datos Reales", s=100)
plt.plot(x_linea, y_linea, color="red", label="Línea de Regresión", linewidth=2)
plt.scatter(gasto_publicidad, prediccion_ventas, color="green", marker="o", s=150, label=f"Predicción para x=12: {prediccion_ventas[0]:.2f}")
plt.axhline(y=prediccion_ventas, color="green", linestyle="--", linewidth=1)
plt.axvline(x=gasto_publicidad, color="green", linestyle="--", linewidth=1)
plt.xlabel("Gasto en Publicidad ($1000)", fontsize=14)
plt.ylabel("Ventas ($1000)", fontsize=14)
plt.title("Modelo de Regresión Lineal para Predicción de Ventas", fontsize=16)
plt.legend(fontsize=12)
plt.grid(True)
plt.show()

# Mostrar los resultados
beta_0, beta_1, prediccion_ventas[0], mse
