# Regresión Múltiple con Interacción - Cincinnati Paint Company

Este análisis aplica un modelo de regresión lineal múltiple con término de interacción para predecir las comisiones de ventas basándose en:
- **Calls**: Número de llamadas realizadas
- **Driven**: Millas conducidas

El modelo incluye un término de interacción (Calls × Driven) para capturar efectos combinados.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

In [None]:
df = pd.read_csv('Cincinnati Paint Company.csv')

## Carga y preparación de datos

In [None]:
X = df[['Calls', 'Driven']]
Y = df['Commissions']

In [None]:
poly = PolynomialFeatures(degree=2, interaction_only=True, include_bias=False)
X_interaction = poly.fit_transform(X)

## Creación de términos de interacción

Usamos `PolynomialFeatures` con `interaction_only=True` para crear el término de interacción sin incluir términos cuadráticos.

In [None]:
print(poly.get_feature_names_out())

In [None]:
model = LinearRegression()
model.fit(X_interaction, y)

## Ajuste del modelo

El modelo de regresión tiene la forma:

$$\hat{Y} = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 (X_1 \cdot X_2)$$

Donde:
- $X_1$ = Llamadas (Calls)
- $X_2$ = Millas (Driven)
- $X_1 \cdot X_2$ = Término de interacción

In [None]:
print(f"β0: {model.intercept_:.4f}")
print(f"β1 (llamadas): {model.coef_[0]:.4f}")
print(f"β2 (millas): {model.coef_[1]:.4f}")
print(f"β3 (llamadas*millas): {model.coef_[2]:.4f}")  # ← interacción               # β0

## Coeficientes del modelo

Los coeficientes nos indican:
- **β0**: Intercepto (comisión base)
- **β1**: Efecto de cada llamada adicional
- **β2**: Efecto de cada milla adicional
- **β3**: Efecto de interacción (cómo las llamadas y millas se potencian mutuamente)