# üß™ Gu√≠a de Pruebas de Hip√≥tesis No Param√©tricas

### El Concepto General
Si te preguntan qu√© son en general:
> *"Son **Pruebas de Hip√≥tesis No Param√©tricas**. Las usamos porque nuestros datos (encuestas) no siguen una distribuci√≥n normal (curva de campana) perfecta. Sirven para rechazar la Hip√≥tesis Nula ($H_0$) de que las variables no tienen relaci√≥n."*

---
### 1. Chi-Cuadrado de Pearson ($\chi^2$)
**Tu definici√≥n:** "Eval√∫a grupos y su correlaci√≥n con una categor√≠a binaria".
**La definici√≥n t√©cnica pulida:**
> *"Es una **Prueba de Independencia**. Compara frecuencias observadas vs. esperadas."*

*   **¬øPara qu√© sirve?** Para ver si dos variables categ√≥ricas est√°n "casadas" o son "solteras" (independientes).
*   **El Dato:** Cuentas (Frecuencias).
*   **Ejemplo:** ¬øSer "Becado" (S√≠/No) tiene algo que ver con "Desertar" (S√≠/No)? Solo contamos cu√°ntos caen en cada cajita.

In [1]:
import pandas as pd
from scipy.stats import chi2_contingency
import seaborn as sns
import matplotlib.pyplot as plt

# --- EJEMPLO CHI-CUADRADO ---
# Pregunta: ¬øSer Becado influye en Desertar?

# Datos simulados (Tabla de Contingencia)
data = {
    'Desert√≥': [30, 50],    # 30 Becados desertaron, 50 No Becados desertaron
    'No Desert√≥': [70, 20]  # 70 Becados se quedaron, 20 No Becados se quedaron
}
df_chi = pd.DataFrame(data, index=['Becado', 'No Becado'])

print("--- Tabla de Contingencia (Observada) ---")
display(df_chi)

# Ejecutar prueba
chi2, p, dof, expected = chi2_contingency(df_chi)

print(f"\nValor p: {p:.5f}")
if p < 0.05:
    print("‚úÖ Rechazamos H0: ¬°Hay relaci√≥n! Ser becado S√ç afecta la deserci√≥n.")
else:
    print("‚ùå No rechazamos H0: Son independientes (no tiene nada que ver).")

--- Tabla de Contingencia (Observada) ---


Unnamed: 0,Desert√≥,No Desert√≥
Becado,30,70
No Becado,50,20



Valor p: 0.00000
‚úÖ Rechazamos H0: ¬°Hay relaci√≥n! Ser becado S√ç afecta la deserci√≥n.


---
### 2. Mann-Whitney U
**Tu definici√≥n:** "Comparar dos grupos".
**La definici√≥n t√©cnica pulida:**
> *"Es la alternativa no param√©trica a la **Prueba t de Student**. Compara si las distribuciones (y medianas) de **dos** grupos independientes son diferentes."*

*   **¬øPara qu√© sirve?** Para ver qui√©n "gana" en una variable num√©rica/ordinal entre DOS equipos.
*   **El Dato:** Rangos (Orden).
*   **Ejemplo:** ¬øLa intensidad de estr√©s (1-5) es mayor en Hombres vs. Mujeres? (Solo 2 grupos).

In [2]:
from scipy.stats import mannwhitneyu
import numpy as np

# --- EJEMPLO MANN-WHITNEY U ---
# Pregunta: ¬øEl nivel de estr√©s (1-5) es diferente entre Hombres y Mujeres?

# Datos simulados (Nivel de estr√©s 1-5)
estres_hombres = [1, 2, 1, 3, 2, 1, 2, 3, 1, 2] # Menos estresados
estres_mujeres = [3, 4, 5, 3, 4, 5, 3, 4, 5, 4] # M√°s estresadas

print(f"Mediana Hombres: {np.median(estres_hombres)}")
print(f"Mediana Mujeres: {np.median(estres_mujeres)}")

# Ejecutar prueba
stat, p = mannwhitneyu(estres_hombres, estres_mujeres)

print(f"\nValor p: {p:.5f}")
if p < 0.05:
    print("‚úÖ Rechazamos H0: ¬°Hay diferencia significativa! Los niveles de estr√©s son distintos.")
else:
    print("‚ùå No rechazamos H0: No hay diferencia real, fue suerte.")

Mediana Hombres: 2.0
Mediana Mujeres: 4.0

Valor p: 0.00033
‚úÖ Rechazamos H0: ¬°Hay diferencia significativa! Los niveles de estr√©s son distintos.


---
### 3. Kruskal-Wallis H
**Tu definici√≥n:** "Como Mann-Whitney pero para m√°s grupos y escalas ordinales".
**La definici√≥n t√©cnica pulida:**
> *"Es la alternativa no param√©trica al **ANOVA de un factor**. Compara si las medianas de **tres o m√°s** grupos provienen de la misma distribuci√≥n."*

*   **¬øPara qu√© sirve?** Lo mismo que Mann-Whitney, pero cuando tienes un torneo de varios equipos.
*   **El Dato:** Rangos (Orden).
*   **Ejemplo:** ¬øLa intensidad de ganas de abandonar (1-5) var√≠a seg√∫n si tu Rendimiento es Alto, Medio o Bajo? (3 grupos).

In [3]:
from scipy.stats import kruskal

# --- EJEMPLO KRUSKAL-WALLIS ---
# Pregunta: ¬øLas ganas de abandonar (1-5) dependen del Rendimiento (Bajo, Medio, Alto)?

# Datos simulados
ganas_bajo =  [5, 4, 5, 4, 5, 3, 5, 4] # Rendimiento Bajo -> Muchas ganas de irse
ganas_medio = [3, 2, 3, 3, 2, 3, 4, 2] # Rendimiento Medio -> Ganas normales
ganas_alto =  [1, 1, 2, 1, 2, 1, 1, 2] # Rendimiento Alto -> Pocas ganas de irse

print(f"Mediana Bajo: {np.median(ganas_bajo)}")
print(f"Mediana Medio: {np.median(ganas_medio)}")
print(f"Mediana Alto: {np.median(ganas_alto)}")

# Ejecutar prueba
stat, p = kruskal(ganas_bajo, ganas_medio, ganas_alto)

print(f"\nValor p: {p:.5f}")
if p < 0.05:
    print("‚úÖ Rechazamos H0: ¬°Al menos un grupo es diferente! El rendimiento afecta las ganas de abandonar.")
else:
    print("‚ùå No rechazamos H0: Todos los grupos son iguales.")

Mediana Bajo: 4.5
Mediana Medio: 3.0
Mediana Alto: 1.0

Valor p: 0.00010
‚úÖ Rechazamos H0: ¬°Al menos un grupo es diferente! El rendimiento afecta las ganas de abandonar.


---
### Resumen "Acorde√≥n" para tu defensa

| Prueba | Tipo de Dato | ¬øCu√°ntos Grupos Comparas? | ¬øQu√© pregunta responde? |
| :--- | :--- | :--- | :--- |
| **Chi-Cuadrado** | Categor√≠as (Nombres) | Cualquiera (Tablas) | **¬øEst√°n asociadas?** (¬øSi cambia A, cambia B?) |
| **Mann-Whitney** | N√∫meros / Ordinales | **Solo 2** | **¬øQui√©n tiene m√°s?** (¬øEl Grupo A punt√∫a m√°s alto que el B?) |
| **Kruskal-Wallis** | N√∫meros / Ordinales | **3 o m√°s** | **¬øHay diferencias?** (¬øAlg√∫n grupo destaca del resto?) |

**Tu explicaci√≥n estaba bien, solo recuerda:**
*   **Chi-Cuadrado** = ¬øHay relaci√≥n? (Asociaci√≥n).
*   **Kruskal/Mann** = ¬øHay diferencias de nivel/intensidad? (Comparaci√≥n de Medianas).

¬°Con esto est√°s blindado! Tienes la l√≥gica y el vocabulario t√©cnico. ¬°A romperla!