In [None]:
# 📌 Importar librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.metrics import r2_score
from scipy.stats import f
import statsmodels.api as sm



In [None]:
# 📌 Cargar datos
data = {
    "Dia": range(1, 31),
    "Promoción": [
        "2x1 en bebidas", "Combo especial", "Sin promoción", "2x1 en bebidas", "2x1 en bebidas",
        "Combo especial", "Sin promoción", "Sin promoción", "2x1 en bebidas", "Descuento 10%",
        "2x1 en bebidas", "2x1 en bebidas", "2x1 en bebidas", "2x1 en bebidas", "Combo especial",
        "Sin promoción", "Combo especial", "Combo especial", "Combo especial", "2x1 en bebidas",
        "Descuento 10%", "Sin promoción", "Descuento 10%", "Combo especial", "Combo especial",
        "Descuento 10%", "Sin promoción", "Sin promoción", "Sin promoción", "Sin promoción"
    ],
    "Numero_Clientes": [
        130, 163, 104, 151, 137, 163, 82, 88, 148, 125,
        111, 116, 153, 123, 136, 81, 125, 148, 137, 157,
        114, 95, 144, 145, 144, 140, 128, 100, 89, 120
    ],
    "Ventas_Diarias_COP": [
        643871.34, 671161.45, 524493.35, 554283.72, 606662.37, 601960.70, 512510.33, 524973.86, 539198.41, 608582.71,
        581948.80, 655568.35, 583990.54, 599834.16, 649676.35, 463374.69, 634689.99, 583197.49, 631559.15, 626452.83,
        571530.55, 490966.89, 598211.01, 608855.75, 635308.55, 522108.80, 592463.68, 601632.45, 599823.47, 615723.63
    ]
}

df = pd.DataFrame(data)

# 📌 Filtrar datos SIN promoción
df_sin_promo = df[df["Promoción"] == "Sin promoción"]

# 📌 Extraer X e Y
X = df_sin_promo["Numero_Clientes"].values.reshape(-1, 1)
Y = df_sin_promo["Ventas_Diarias_COP"].values

# 📌 Transformación polinómica (grado 2)
poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(X)

# 📌 Ajustar modelo
modelo_polinomico = LinearRegression()
modelo_polinomico.fit(X_poly, Y)

# 📌 Obtener coeficientes
b0 = modelo_polinomico.intercept_  # Término independiente
b1 = modelo_polinomico.coef_[1]    # Coeficiente de X
b2 = modelo_polinomico.coef_[2]    # Coeficiente de X^2

# 📌 Calcular métricas de ajuste
r2 = r2_score(Y, modelo_polinomico.predict(X_poly))  # R²
r = np.corrcoef(df_sin_promo["Numero_Clientes"], df_sin_promo["Ventas_Diarias_COP"])[0, 1]  # R (correlación de Pearson)

# 📌 Calcular X óptimo (máximo de la parábola)
if b2 != 0:  
    X_optimo = -b1 / (2 * b2)
else:
    X_optimo = None  # No se puede calcular si no hay término cuadrático

# 📌 Graficar modelo
X_range = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)
X_range_poly = poly.transform(X_range)
Y_pred = modelo_polinomico.predict(X_range_poly)

plt.figure(figsize=(8, 5))
sns.scatterplot(x=df_sin_promo["Numero_Clientes"], y=df_sin_promo["Ventas_Diarias_COP"], label="Datos reales")
plt.plot(X_range, Y_pred, color="red", label=f"Modelo polinómico (R²={r2:.4f})")
plt.xlabel("Número de Clientes")
plt.ylabel("Ventas Diarias (COP)")
plt.title("Relación Clientes-Ventas (Sin Promoción)")
plt.legend()
plt.grid()
plt.show()

# 📌 Mostrar resultados
print(f"Coeficientes del modelo:\n b0 = {b0:.2f}, b1 = {b1:.2f}, b2 = {b2:.2f}")
print(f"Coeficiente de determinación R²: {r2:.4f}")
print(f"Coeficiente de correlación R: {r:.4f}")
if X_optimo:
    print(f"Número óptimo de clientes para maximizar ventas: {X_optimo:.2f}")
else:
    print("No se puede calcular un X óptimo válido.")


In [None]:
# 📌 Filtrar solo los datos sin promoción
df_sin_promo = df[df['Promoción'] == 'Sin promoción'].copy()

# 📌 Reiniciar los índices para evitar problemas en el futuro
df_sin_promo.reset_index(drop=True, inplace=True)

# 📌 Mostrar las primeras filas para verificar
df_sin_promo.head()

df_sin_promo.sample(9)



In [None]:
# 📌 Datos sin promoción
df_sin_promo = df[df["Promoción"] == "Sin promoción"]
X = df_sin_promo["Numero_Clientes"].values.reshape(-1, 1)
Y = df_sin_promo["Ventas_Diarias_COP"].values

# 📌 Transformación polinómica
degree = 2  # Modelo cuadrático
poly = PolynomialFeatures(degree=degree)
X_poly = poly.fit_transform(X)

# 📌 Ajustar modelo
modelo = LinearRegression()
modelo.fit(X_poly, Y)
Y_pred = modelo.predict(X_poly)

# 📌 ANOVA
SCT = np.sum((Y - np.mean(Y))**2)  # Suma de Cuadrados Total
SCM = np.sum((Y_pred - np.mean(Y))**2)  # Suma de Cuadrados del Modelo
SCR = np.sum((Y - Y_pred)**2)  # Suma de Cuadrados del Residuo

# 📌 Grados de libertad
GLM = degree  # Grados de libertad del modelo
GLR = len(Y) - (degree + 1)  # Grados de libertad del residuo

# 📌 Media cuadrática
MCM = SCM / GLM  # Media cuadrática del modelo
MCR = SCR / GLR  # Media cuadrática del residuo

# 📌 Estadístico F
F = MCM / MCR

# 📌 Valor p
p_value = 1 - f.cdf(F, GLM, GLR)

# 📌 Mostrar resultados
print("Suma de Cuadrados Total (SCT):", SCT)
print("Suma de Cuadrados del Modelo (SCM):", SCM)
print("Suma de Cuadrados del Residuo (SCR):", SCR)
print("Grados de Libertad del Modelo (GLM):", GLM)
print("Grados de Libertad del Residuo (GLR):", GLR)
print("Estadístico F:", F)
print("Valor p:", p_value)

In [None]:


# 📌 Preparar datos para ANOVA
X_poly_const = sm.add_constant(X_poly)  # Agregar término de intercepción
modelo_ols = sm.OLS(Y, X_poly_const).fit()  # Ajustar modelo con OLS
anova_resultado = sm.stats.anova_lm(modelo_ols, typ=2)  # ANOVA de tipo II

# 📌 Mostrar tabla con los resultados
print("ANOVA del modelo polinómico (sin promoción):")
print(anova_resultado)

