In [None]:
# analisis_precalculo.py
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.stats as stats
import numpy as np

# --- 1. Cargar datos ---
# Asume que el archivo está en la carpeta /data del repositorio
df = pd.read_excel("data/APRECIONES_DE_LOS_ESTUDIANTES2.xlsx")

# --- 2. Selección automática de columnas ---
# Ajusta estos nombres según tu archivo exacto
col_auto = "Autopercepción"
col_metodo = "Método Preferido"

df_clean = df[[col_auto, col_metodo]].dropna()
df_clean.columns = ["Autopercepcion", "Metodo_Preferido"]

# --- 3. Gráfico descriptivo ---
plt.figure(figsize=(10,6))
sns.countplot(y="Metodo_Preferido", data=df_clean,
              palette="viridis",
              order=df_clean["Metodo_Preferido"].value_counts().index)
plt.title("Preferencia de Métodos de Refuerzo")
plt.xlabel("Cantidad de Estudiantes")
plt.tight_layout()
plt.savefig("figures/preferencias_metodos.png", dpi=300)
plt.close()

# --- 4. Tabla de contingencia ---
tabla = pd.crosstab(df_clean["Autopercepcion"], df_clean["Metodo_Preferido"])
print("\n--- TABLA DE CONTINGENCIA ---")
print(tabla)

# --- 5. Prueba Chi-cuadrado ---
chi2, p, dof, expected = stats.chi2_contingency(tabla)
min_dim = min(tabla.shape) - 1
v_cramer = np.sqrt(chi2 / (tabla.sum().sum() * min_dim))

print("\n--- RESULTADOS ESTADÍSTICOS ---")
print(f"Chi-cuadrado: {chi2:.4f}")
print(f"P-value:      {p:.4f}")
print(f"V de Cramer:  {v_cramer:.4f}")

if p < 0.05:
    print("RESULTADO: Significativo. La preferencia depende del nivel de conocimiento.")
else:
    print("RESULTADO: No significativo. Todos los grupos prefieren lo mismo.")
