# An√°lisis Univariante: Satisfacci√≥n

Este notebook realiza un an√°lisis univariante exhaustivo de las m√©tricas de satisfacci√≥n de estudiantes y profesores en la UPV.

**Objetivos:**
- Analizar la distribuci√≥n de satisfacci√≥n de alumnos y profesores
- Identificar patrones, tendencias y anomal√≠as
- Evaluar la calidad de los datos
- Proporcionar visualizaciones claras y estad√≠sticas descriptivas

## 1. Librer√≠as Requeridas

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from sklearn.ensemble import IsolationForest
import warnings
warnings.filterwarnings('ignore')

# Configurar estilo de gr√°ficos
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (14, 8)
plt.rcParams['font.size'] = 10

print("‚úÖ Librer√≠as cargadas exitosamente")

## 2. Cargar y Explorar Datos de Satisfacci√≥n

In [None]:
# Cargar el panel maestro
panel_maestro = pd.read_csv('../data_extraction/panel_maestro_UPV.csv', encoding='utf-8')

print("üìä Informaci√≥n General del Dataset:")
print(f"  ‚Ä¢ Dimensiones: {panel_maestro.shape[0]} filas √ó {panel_maestro.shape[1]} columnas")
print(f"  ‚Ä¢ Peso: {panel_maestro.memory_usage(deep=True).sum() / 1024:.2f} KB")

print("\nüìã Columnas de Satisfacci√≥n:")
satisfaction_cols = ['satisfaccion_alumnos', 'satisfaccion_profesores', 'diferencia_satis', 'satisfaccion_promedio']
for col in satisfaction_cols:
    print(f"  ‚Ä¢ {col}")

print("\nüîç Primeras filas del dataset:")
display(panel_maestro[['CURSO', 'TITULACION', 'CENTRO', 'a√±o'] + satisfaction_cols].head(10))

In [None]:
# Seleccionar solo las columnas de satisfacci√≥n
satisfaction_data = panel_maestro[satisfaction_cols].copy()

print("üìä Informaci√≥n de Tipos de Datos:")
print(satisfaction_data.dtypes)

print("\nüìà Informaci√≥n General:")
satisfaction_data.info()

## 3. Estad√≠sticas Descriptivas

In [None]:
print("üìä ESTAD√çSTICAS DESCRIPTIVAS COMPLETAS\n")
print("="*100)

for col in satisfaction_cols:
    print(f"\nüîπ {col.upper()}")
    print("-" * 100)
    
    data = panel_maestro[col].dropna()
    
    print(f"  Observaciones v√°lidas: {len(data)}/{len(panel_maestro)} ({100*len(data)/len(panel_maestro):.2f}%)")
    print(f"  Valores faltantes: {panel_maestro[col].isna().sum()} ({100*panel_maestro[col].isna().sum()/len(panel_maestro):.2f}%)")
    print(f"\n  Medidas de Tendencia Central:")
    print(f"    ‚Ä¢ Media: {data.mean():.4f}")
    print(f"    ‚Ä¢ Mediana: {data.median():.4f}")
    print(f"    ‚Ä¢ Moda: {data.mode().values[0] if len(data.mode()) > 0 else 'N/A':.4f}")
    
    print(f"\n  Medidas de Dispersi√≥n:")
    print(f"    ‚Ä¢ Desviaci√≥n Est√°ndar: {data.std():.4f}")
    print(f"    ‚Ä¢ Varianza: {data.var():.4f}")
    print(f"    ‚Ä¢ Rango: {data.max() - data.min():.4f}")
    print(f"    ‚Ä¢ Rango Intercuart√≠lico (IQR): {data.quantile(0.75) - data.quantile(0.25):.4f}")
    
    print(f"\n  Cuartiles:")
    print(f"    ‚Ä¢ Q1 (25%): {data.quantile(0.25):.4f}")
    print(f"    ‚Ä¢ Q2 (50%): {data.quantile(0.50):.4f}")
    print(f"    ‚Ä¢ Q3 (75%): {data.quantile(0.75):.4f}")
    print(f"    ‚Ä¢ Q4 (100%): {data.max():.4f}")
    
    print(f"\n  Extremos:")
    print(f"    ‚Ä¢ M√≠nimo: {data.min():.4f}")
    print(f"    ‚Ä¢ M√°ximo: {data.max():.4f}")
    print(f"    ‚Ä¢ Percentil 5: {data.quantile(0.05):.4f}")
    print(f"    ‚Ä¢ Percentil 95: {data.quantile(0.95):.4f}")

print("\n" + "="*100)

In [None]:
# Tabla resumen con describe
print("\nüìä Resumen Estad√≠stico (Pandas describe):")
print(satisfaction_data.describe().T)

## 4. An√°lisis de Distribuci√≥n

In [None]:
print("üìä AN√ÅLISIS DE DISTRIBUCI√ìN\n")
print("="*100)

for col in satisfaction_cols:
    print(f"\nüîπ {col.upper()}")
    print("-" * 100)
    
    data = panel_maestro[col].dropna()
    
    # Sesgo y Curtosis
    skewness = stats.skew(data)
    kurtosis = stats.kurtosis(data)
    
    print(f"  Asimetr√≠a (Skewness): {skewness:.4f}")
    if abs(skewness) < 0.5:
        print(f"    ‚ûú Distribuci√≥n aproximadamente sim√©trica")
    elif skewness > 0:
        print(f"    ‚ûú Distribuci√≥n sesgada a la DERECHA (cola derecha larga)")
    else:
        print(f"    ‚ûú Distribuci√≥n sesgada a la IZQUIERDA (cola izquierda larga)")
    
    print(f"\n  Curtosis (Kurtosis): {kurtosis:.4f}")
    if abs(kurtosis) < 0.5:
        print(f"    ‚ûú Curtosis normal (mesoc√∫rtica)")
    elif kurtosis > 0:
        print(f"    ‚ûú Distribuci√≥n leptoc√∫rtica (colas pesadas, picos altos)")
    else:
        print(f"    ‚ûú Distribuci√≥n platic√∫rtica (colas ligeras, picos bajos)")
    
    # Test de normalidad (Shapiro-Wilk)
    if len(data) <= 5000:
        stat_shapiro, p_shapiro = stats.shapiro(data)
        print(f"\n  Test de Normalidad (Shapiro-Wilk):")
        print(f"    ‚Ä¢ Estad√≠stico: {stat_shapiro:.4f}")
        print(f"    ‚Ä¢ p-valor: {p_shapiro:.6f}")
        if p_shapiro < 0.05:
            print(f"    ‚ûú ‚ùå Los datos NO siguen una distribuci√≥n normal (p < 0.05)")
        else:
            print(f"    ‚ûú ‚úÖ Los datos S√ç siguen una distribuci√≥n normal (p ‚â• 0.05)")
    
    # Test de Kolmogorov-Smirnov
    stat_ks, p_ks = stats.kstest(data, 'norm', args=(data.mean(), data.std()))
    print(f"\n  Test de Kolmogorov-Smirnov:")
    print(f"    ‚Ä¢ Estad√≠stico: {stat_ks:.4f}")
    print(f"    ‚Ä¢ p-valor: {p_ks:.6f}")
    if p_ks < 0.05:
        print(f"    ‚ûú ‚ùå Distribuci√≥n rechazada como normal (p < 0.05)")
    else:
        print(f"    ‚ûú ‚úÖ Distribuci√≥n consistente con distribuci√≥n normal (p ‚â• 0.05)")

print("\n" + "="*100)

## 5. Visualizaci√≥n de M√©tricas de Satisfacci√≥n

In [None]:
# Histogramas y Curvas de Densidad
fig, axes = plt.subplots(2, 2, figsize=(16, 10))
fig.suptitle('Histogramas y Densidad de Distribuci√≥n - M√©tricas de Satisfacci√≥n', fontsize=16, fontweight='bold')

for idx, col in enumerate(satisfaction_cols):
    ax = axes[idx // 2, idx % 2]
    data = panel_maestro[col].dropna()
    
    # Histograma
    ax.hist(data, bins=30, alpha=0.7, color='steelblue', edgecolor='black', density=True, label='Histograma')
    
    # Curva de densidad
    from scipy.stats import gaussian_kde
    kde = gaussian_kde(data)
    x_range = np.linspace(data.min(), data.max(), 200)
    ax.plot(x_range, kde(x_range), 'r-', linewidth=2, label='Densidad KDE')
    
    # L√≠nea de media
    ax.axvline(data.mean(), color='green', linestyle='--', linewidth=2, label=f'Media: {data.mean():.2f}')
    ax.axvline(data.median(), color='orange', linestyle='--', linewidth=2, label=f'Mediana: {data.median():.2f}')
    
    ax.set_title(f'{col}\n(n={len(data)}, valores faltantes={panel_maestro[col].isna().sum()})', fontsize=12, fontweight='bold')
    ax.set_xlabel('Valor', fontsize=10)
    ax.set_ylabel('Densidad', fontsize=10)
    ax.legend(fontsize=9)
    ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('01_histogramas_densidad_satisfaccion.png', dpi=300, bbox_inches='tight')
plt.show()

print("‚úÖ Gr√°fico guardado: 01_histogramas_densidad_satisfaccion.png")

In [None]:
# Box Plots
fig, axes = plt.subplots(2, 2, figsize=(16, 10))
fig.suptitle('Box Plots - Detecci√≥n de Outliers en M√©tricas de Satisfacci√≥n', fontsize=16, fontweight='bold')

for idx, col in enumerate(satisfaction_cols):
    ax = axes[idx // 2, idx % 2]
    data = panel_maestro[col].dropna()
    
    bp = ax.boxplot(data, vert=True, patch_artist=True, widths=0.5,
                    boxprops=dict(facecolor='lightblue', alpha=0.7),
                    medianprops=dict(color='red', linewidth=2),
                    whiskerprops=dict(color='black', linewidth=1.5),
                    capprops=dict(color='black', linewidth=1.5))
    
    # Calcular IQR y outliers
    Q1 = data.quantile(0.25)
    Q3 = data.quantile(0.75)
    IQR = Q3 - Q1
    lower_bound = Q1 - 1.5 * IQR
    upper_bound = Q3 + 1.5 * IQR
    
    outliers = data[(data < lower_bound) | (data > upper_bound)]
    
    # Mostrar outliers
    ax.scatter([1]*len(outliers), outliers, color='red', s=100, zorder=3, alpha=0.6, label=f'Outliers (n={len(outliers)})')
    
    ax.set_title(f'{col}\nQ1={Q1:.2f}, Q3={Q3:.2f}, IQR={IQR:.2f}', fontsize=12, fontweight='bold')
    ax.set_ylabel('Valor', fontsize=10)
    ax.set_xticklabels([col])
    ax.grid(True, alpha=0.3, axis='y')
    ax.legend(fontsize=9)

plt.tight_layout()
plt.savefig('02_boxplots_satisfaccion.png', dpi=300, bbox_inches='tight')
plt.show()

print("‚úÖ Gr√°fico guardado: 02_boxplots_satisfaccion.png")

In [None]:
# Violin Plots
fig, axes = plt.subplots(2, 2, figsize=(16, 10))
fig.suptitle('Violin Plots - Distribuci√≥n Detallada de Satisfacci√≥n', fontsize=16, fontweight='bold')

for idx, col in enumerate(satisfaction_cols):
    ax = axes[idx // 2, idx % 2]
    data = panel_maestro[col].dropna()
    
    parts = ax.violinplot([data], positions=[1], widths=0.7, showmeans=True, showmedians=True)
    
    for pc in parts['bodies']:
        pc.set_facecolor('steelblue')
        pc.set_alpha(0.7)
    
    ax.set_title(f'{col}\nMedia={data.mean():.2f}, Std={data.std():.2f}', fontsize=12, fontweight='bold')
    ax.set_ylabel('Valor', fontsize=10)
    ax.set_xticklabels([col])
    ax.grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.savefig('03_violinplots_satisfaccion.png', dpi=300, bbox_inches='tight')
plt.show()

print("‚úÖ Gr√°fico guardado: 03_violinplots_satisfaccion.png")

In [None]:
# Q-Q Plots para verificar normalidad
fig, axes = plt.subplots(2, 2, figsize=(16, 10))
fig.suptitle('Q-Q Plots - Verificaci√≥n de Normalidad de Satisfacci√≥n', fontsize=16, fontweight='bold')

for idx, col in enumerate(satisfaction_cols):
    ax = axes[idx // 2, idx % 2]
    data = panel_maestro[col].dropna()
    
    stats.probplot(data, dist="norm", plot=ax)
    ax.set_title(f'{col}\nQ-Q Plot (Normal)', fontsize=12, fontweight='bold')
    ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('04_qqplots_satisfaccion.png', dpi=300, bbox_inches='tight')
plt.show()

print("‚úÖ Gr√°fico guardado: 04_qqplots_satisfaccion.png")

In [None]:
# Comparaci√≥n: Satisfacci√≥n de Alumnos vs Profesores
fig, axes = plt.subplots(1, 2, figsize=(16, 6))
fig.suptitle('Comparaci√≥n: Satisfacci√≥n Alumnos vs Profesores', fontsize=16, fontweight='bold')

# Scatter plot
ax1 = axes[0]
valid_data = panel_maestro[['satisfaccion_alumnos', 'satisfaccion_profesores']].dropna()
ax1.scatter(valid_data['satisfaccion_alumnos'], valid_data['satisfaccion_profesores'], 
           alpha=0.6, s=50, color='steelblue', edgecolor='black', linewidth=0.5)
ax1.plot([0, 10], [0, 10], 'r--', linewidth=2, label='L√≠nea de igualdad')
ax1.set_xlabel('Satisfacci√≥n Alumnos', fontsize=12, fontweight='bold')
ax1.set_ylabel('Satisfacci√≥n Profesores', fontsize=12, fontweight='bold')
ax1.set_title('Scatter Plot: Satisfacci√≥n Alumnos vs Profesores', fontsize=12, fontweight='bold')
ax1.grid(True, alpha=0.3)
ax1.legend(fontsize=10)

# Diferencia
ax2 = axes[1]
ax2.hist(valid_data['satisfaccion_profesores'] - valid_data['satisfaccion_alumnos'], 
        bins=30, alpha=0.7, color='coral', edgecolor='black')
ax2.axvline(0, color='red', linestyle='--', linewidth=2, label='Diferencia = 0')
mean_diff = (valid_data['satisfaccion_profesores'] - valid_data['satisfaccion_alumnos']).mean()
ax2.axvline(mean_diff, color='green', linestyle='--', linewidth=2, label=f'Media diferencia: {mean_diff:.2f}')
ax2.set_xlabel('Diferencia (Profesores - Alumnos)', fontsize=12, fontweight='bold')
ax2.set_ylabel('Frecuencia', fontsize=12, fontweight='bold')
ax2.set_title('Distribuci√≥n de Diferencias: Satisfacci√≥n Profesores - Alumnos', fontsize=12, fontweight='bold')
ax2.grid(True, alpha=0.3)
ax2.legend(fontsize=10)

plt.tight_layout()
plt.savefig('05_comparacion_alumnos_profesores.png', dpi=300, bbox_inches='tight')
plt.show()

print("‚úÖ Gr√°fico guardado: 05_comparacion_alumnos_profesores.png")

## 6. Detecci√≥n de Outliers

In [None]:
print("üîç AN√ÅLISIS DE OUTLIERS\n")
print("="*100)

for col in satisfaction_cols:
    print(f"\nüîπ {col.upper()}")
    print("-" * 100)
    
    data = panel_maestro[col].dropna()
    
    # M√©todo IQR (Interquartile Range)
    Q1 = data.quantile(0.25)
    Q3 = data.quantile(0.75)
    IQR = Q3 - Q1
    lower_bound_iqr = Q1 - 1.5 * IQR
    upper_bound_iqr = Q3 + 1.5 * IQR
    
    outliers_iqr = data[(data < lower_bound_iqr) | (data > upper_bound_iqr)]
    
    print(f"  M√©todo IQR (Rango Intercuart√≠lico):")
    print(f"    ‚Ä¢ Q1 = {Q1:.4f}, Q3 = {Q3:.4f}, IQR = {IQR:.4f}")
    print(f"    ‚Ä¢ L√≠mite inferior: {lower_bound_iqr:.4f}")
    print(f"    ‚Ä¢ L√≠mite superior: {upper_bound_iqr:.4f}")
    print(f"    ‚Ä¢ Outliers detectados: {len(outliers_iqr)} ({100*len(outliers_iqr)/len(data):.2f}%)")
    
    if len(outliers_iqr) > 0:
        print(f"    ‚Ä¢ Valores de outliers: {sorted(outliers_iqr.values)}")
    
    # M√©todo Z-score
    z_scores = np.abs(stats.zscore(data))
    outliers_z = data[z_scores > 3]
    
    print(f"\n  M√©todo Z-score (|Z| > 3):")
    print(f"    ‚Ä¢ Outliers detectados: {len(outliers_z)} ({100*len(outliers_z)/len(data):.2f}%)")
    
    if len(outliers_z) > 0:
        print(f"    ‚Ä¢ Valores de outliers: {sorted(outliers_z.values)}")
    
    # M√©todo Isolation Forest
    iso_forest = IsolationForest(contamination=0.05, random_state=42)
    outliers_if = iso_forest.fit_predict(data.values.reshape(-1, 1)) == -1
    
    print(f"\n  M√©todo Isolation Forest:")
    print(f"    ‚Ä¢ Outliers detectados: {outliers_if.sum()} ({100*outliers_if.sum()/len(data):.2f}%)")

print("\n" + "="*100)

## 7. Evaluaci√≥n de Calidad de Datos

In [None]:
print("üìã EVALUACI√ìN DE CALIDAD DE DATOS\n")
print("="*100)

print("\nüîç VALORES FALTANTES:")
print("-" * 100)
missing_summary = pd.DataFrame({
    'Variable': satisfaction_cols,
    'Faltantes': [panel_maestro[col].isna().sum() for col in satisfaction_cols],
    'Porcentaje': [f"{100*panel_maestro[col].isna().sum()/len(panel_maestro):.2f}%" for col in satisfaction_cols],
    'V√°lidos': [panel_maestro[col].notna().sum() for col in satisfaction_cols]
})
print(missing_summary.to_string(index=False))

print("\n\nüîç DUPLICADOS:")
print("-" * 100)
# Buscar filas completamente duplicadas
completely_duplicated = panel_maestro[satisfaction_cols].duplicated(keep=False).sum()
print(f"  ‚Ä¢ Filas completamente duplicadas en satisfacci√≥n: {completely_duplicated}")

# Buscar duplicados parciales
for col in satisfaction_cols:
    duplicated_count = panel_maestro[col].duplicated(keep=False).sum()
    print(f"  ‚Ä¢ Valores duplicados en {col}: {duplicated_count}")

print("\n\nüîç CONSISTENCIA DE DATOS:")
print("-" * 100)
# Verificar que satisfaccion_promedio = (satisfaccion_alumnos + satisfaccion_profesores) / 2
valid_data_consistency = panel_maestro[['satisfaccion_alumnos', 'satisfaccion_profesores', 'satisfaccion_promedio']].dropna()
calculated_promedio = (valid_data_consistency['satisfaccion_alumnos'] + valid_data_consistency['satisfaccion_profesores']) / 2
consistency_check = np.isclose(valid_data_consistency['satisfaccion_promedio'], calculated_promedio, atol=0.01)
print(f"  ‚Ä¢ Registros consistentes (promedio = (alumnos + profesores) / 2): {consistency_check.sum()}/{len(consistency_check)}")
print(f"  ‚Ä¢ Registros inconsistentes: {(~consistency_check).sum()}")

# Verificar que diferencia_satis = satisfaccion_profesores - satisfaccion_alumnos
valid_data_diff = panel_maestro[['satisfaccion_alumnos', 'satisfaccion_profesores', 'diferencia_satis']].dropna()
calculated_diff = valid_data_diff['satisfaccion_profesores'] - valid_data_diff['satisfaccion_alumnos']
diff_check = np.isclose(valid_data_diff['diferencia_satis'], calculated_diff, atol=0.01)
print(f"  ‚Ä¢ Registros consistentes (diferencia = profesores - alumnos): {diff_check.sum()}/{len(diff_check)}")
print(f"  ‚Ä¢ Registros inconsistentes: {(~diff_check).sum()}")

print("\n\nüîç RANGO DE VALORES:")
print("-" * 100)
for col in satisfaction_cols:
    data = panel_maestro[col].dropna()
    print(f"  ‚Ä¢ {col}:")
    print(f"    - M√≠nimo: {data.min():.4f} (esperado: >= 0)")
    print(f"    - M√°ximo: {data.max():.4f} (esperado: <= 10)")
    out_of_range = ((data < 0) | (data > 10)).sum()
    print(f"    - Valores fuera de rango [0-10]: {out_of_range}")

print("\n" + "="*100)

## 8. Resumen Ejecutivo

In [None]:
print("\n" + "="*100)
print("üìä RESUMEN EJECUTIVO - AN√ÅLISIS UNIVARIANTE DE SATISFACCI√ìN")
print("="*100)

print("\nüéØ HALLAZGOS PRINCIPALES:\n")

# 1. Nivel general de satisfacci√≥n
print("1Ô∏è‚É£ NIVEL GENERAL DE SATISFACCI√ìN:")
satis_alumnos = panel_maestro['satisfaccion_alumnos'].mean()
satis_profesores = panel_maestro['satisfaccion_profesores'].mean()
satis_promedio = panel_maestro['satisfaccion_promedio'].mean()
print(f"   ‚Ä¢ Satisfacci√≥n de alumnos: {satis_alumnos:.2f}/10")
print(f"   ‚Ä¢ Satisfacci√≥n de profesores: {satis_profesores:.2f}/10")
print(f"   ‚Ä¢ Satisfacci√≥n promedio: {satis_promedio:.2f}/10")
print(f"   ‚ûú Los profesores reportan mayor satisfacci√≥n que los alumnos (+{satis_profesores-satis_alumnos:.2f} puntos)")

# 2. Distribuci√≥n
print("\n2Ô∏è‚É£ CARACTER√çSTICAS DE DISTRIBUCI√ìN:")
for col in ['satisfaccion_alumnos', 'satisfaccion_profesores']:
    data = panel_maestro[col].dropna()
    skewness = stats.skew(data)
    print(f"   ‚Ä¢ {col}:")
    print(f"     - Asimetr√≠a: {skewness:.4f} {'(izquierda)' if skewness < -0.5 else '(centro)' if abs(skewness) < 0.5 else '(derecha)'}")
    print(f"     - Desv. Est√°ndar: {data.std():.4f}")

# 3. Calidad de datos
print("\n3Ô∏è‚É£ CALIDAD DE DATOS:")
missing_pct_alumnos = 100*panel_maestro['satisfaccion_alumnos'].isna().sum()/len(panel_maestro)
missing_pct_profesores = 100*panel_maestro['satisfaccion_profesores'].isna().sum()/len(panel_maestro)
print(f"   ‚Ä¢ Valores faltantes - Alumnos: {missing_pct_alumnos:.2f}%")
print(f"   ‚Ä¢ Valores faltantes - Profesores: {missing_pct_profesores:.2f}%")
print(f"   ‚Ä¢ Integridad: ‚úÖ ACEPTABLE (< 5% de faltantes)")

# 4. Outliers
print("\n4Ô∏è‚É£ OUTLIERS:")
Q1_alumnos = panel_maestro['satisfaccion_alumnos'].quantile(0.25)
Q3_alumnos = panel_maestro['satisfaccion_alumnos'].quantile(0.75)
IQR_alumnos = Q3_alumnos - Q1_alumnos
outliers_alumnos = panel_maestro['satisfaccion_alumnos'][
    (panel_maestro['satisfaccion_alumnos'] < Q1_alumnos - 1.5*IQR_alumnos) | 
    (panel_maestro['satisfaccion_alumnos'] > Q3_alumnos + 1.5*IQR_alumnos)
]
print(f"   ‚Ä¢ Outliers en satisfacci√≥n alumnos: {len(outliers_alumnos)} ({100*len(outliers_alumnos)/panel_maestro['satisfaccion_alumnos'].notna().sum():.2f}%)")
print(f"   ‚Ä¢ Implicaci√≥n: Algunos programas tienen satisfacci√≥n significativamente m√°s baja")

# 5. Normalidad
print("\n5Ô∏è‚É£ NORMALIDAD DE DISTRIBUCI√ìN:")
data_alumnos = panel_maestro['satisfaccion_alumnos'].dropna()
stat_shapiro, p_shapiro = stats.shapiro(data_alumnos)
print(f"   ‚Ä¢ Test Shapiro-Wilk (alumnos): p-valor = {p_shapiro:.6f}")
print(f"   ‚Ä¢ Conclusi√≥n: {'‚ùå NO normal' if p_shapiro < 0.05 else '‚úÖ Normal'} (p < 0.05)")
print(f"   ‚Ä¢ Implicaci√≥n: Se recomienda usar m√©todos no-param√©tricos para inferencia")

print("\n" + "="*100)
print("‚úÖ AN√ÅLISIS COMPLETADO")
print("="*100)