# ANOVA de un factor y Prueba Kruskal-Wallis

El análisis de varianza (ANOVA) describe a un conjunto técnicas estadísticas que se utilizan para comparar la media entre dos o más grupos. La hipótesis nula es que todas las medias son iguales mientras que la hipótesis alternativa plantea que al menos una es diferente.

El análisis de varianza de un factor implica una variable dependiente continua y una variable independiente (llamada factor) que tiene cierto número de niveles. Los diferentes niveles de la variable independiente corresponden a diferente grupos o condiciones. Cuando existen dos o más factores el análisis se le llama análisis de varianza de n factores. Si el conjunto de variables independientes incluye variables cuantitativas (covariables), a la técnica se le llama análisis de covarianza (ANCOVA). Si hay dos o más variables dependientes se le conoce como MANOVA.

El análisis de varianza recibe su nombre debido a que compara la variabilidad entre grupos con la variabilidad dentro de los grupos. Se calcula un valor F que representa la variabilidad entre los grupos dividida entre la variabilidad dentro de los grupos. Un valor grande de la F indica que hay más variabilidad entre los grupos (causados por la variable independiente) que la que hay dentro de cada grupo (atribuida al azar).

Un valor significativo en la F implica que se rechaza la hipótesis nula, es decir, que al menos una media es diferente. Para determinar qué grupo es diferente se deben llevar a cabo pruebas post-hoc o realizar comparaciones específicas. 

El ANOVA de un factor requiere el cumplimiento de varios supuestos: las muestras son independientes, la variable dependiente está normalmente distribuida en cada grupo, y las varianzas en cada grupo son iguales. Debido a que la ANOVA se considera como una prueba robusta, variaciones en el cumplimiento de los supuestos de normalidad y homogeneidad de varianzas no afectan de manera importante los resultados si el tamaño de las muestras es igual. 

**Caso de uso**
Una cadena de comida rápida planea agregar un nuevo producto a su menú, pero están indecisos entre tres posibles campañas de mercadotecnica. Como un experimento, el producto fue introducido en varias ubicaciones seleccionadas aleatoriamente utilizando diferentes campañas. Se registraron las ventas del nuevo producto por las primeras cuatro semanas. El archivo "marketing.csv" contiene las siguientes variables:  
- MarketID: identificador del mercado
- MarketSize: tamaño del mercado de acuerdo a las ventas
- LocationID: identificador de la ubicación de la tienda
- AgeOfStore: antigüedad de la tienda en años
- Promotion: promoción (1 de 3) que fue probada
- week: semana en que se llevó a cabo la promoción.
- SalesInThousands: ventas para una ubicación específica (LocationID), promoción (Promotion) y semana (week).

Para comparar las ventas de acuerdo a las diferentes promociones, utilizaremos una ANOVA  
Hipótesis nula: todas las medias son iguales.  
Hipótesis alternativa: al menos un par es diferente.

In [None]:
import pandas as pd
import numpy as np

In [None]:
df = pd.read_csv('https://github.com/adan-rs/AnalisisDatos/raw/main/data/marketing.csv')

In [None]:
df.info()

In [None]:
df['Promotion'].value_counts()

In [None]:
df.sample(4)

## Supuesto de igualdad de varianzas

In [None]:
from scipy.stats import levene

def compare_variances(data, group_column, measure_column, groups=None, alpha=0.05):
    """
    Realiza e interpreta una prueba de Levene para comparar varianzas entre múltiples grupos.   
    Args:
        data: DataFrame con los datos
        group_column: Nombre de la columna que identifica los grupos
        measure_column: Nombre de la columna con la variable a comparar
        groups: Lista de grupos a comparar (si es None, usa todos los grupos encontrados)
        alpha: Nivel de significancia (default: 0.05)
    Returns:
        p-value
    """
    # Identificar grupos si no se especifican
    grupos_disponibles = data[group_column].unique()
    if len(grupos_disponibles) < 2:
        raise ValueError(f"La columna {group_column} debe tener al menos dos grupos")
    
    # Usar grupos especificados o todos los disponibles
    grupos = groups if groups is not None else grupos_disponibles
    
    # Verificar que todos los grupos especificados existen
    grupos_invalidos = set(grupos) - set(grupos_disponibles)
    if grupos_invalidos:
        raise ValueError(f"Grupos no encontrados en los datos: {grupos_invalidos}")
    
    # Obtener datos de cada grupo
    datos_grupos = [data[data[group_column] == grupo][measure_column] for grupo in grupos]
    
    # Calcular estadísticas por grupo
    stats = pd.DataFrame({
        'n': [len(datos) for datos in datos_grupos],
        'varianza': [datos.var() for datos in datos_grupos],
        'desv_std': [datos.std() for datos in datos_grupos]
    }, index=grupos)
    
    # Realizar prueba de Levene
    stat, p_value = levene(*datos_grupos)
    
    # Preparar interpretación
    es_significativo = p_value < alpha
    interpretacion = (f"Prueba de Levene para {len(grupos)} grupos\n"
                     f"Estadístico de Levene: {stat:.4f}\n"
                     f"Valor p: {p_value:.4f}\n\n"
                     "Estadísticas por grupo:\n")
    
    # Añadir estadísticas de cada grupo
    for grupo in grupos:
        n = stats.loc[grupo, 'n']
        var = stats.loc[grupo, 'varianza']
        std = stats.loc[grupo, 'desv_std']
        interpretacion += f"{grupo}: n={n}, varianza={var:.2f}, desv. estándar={std:.2f}\n"
    
    # Añadir conclusión
    interpretacion += f"\nConclusión: {'Se rechaza' if es_significativo else 'No se rechaza'} "
    interpretacion += "la hipótesis nula de igualdad de varianzas"
    interpretacion += (" (hay diferencias significativas en las varianzas entre los grupos)" 
                      if es_significativo 
                      else "\n (no hay evidencia de diferencias significativas en las varianzas)")
    
    print(interpretacion)
    return p_value

In [None]:
resultados_levene = compare_variances(df,'Promotion', 'SalesInThousands')

## Supuesto de normalidad

In [None]:
from scipy import stats
import pandas as pd

def test_ks_normality(df, group_column, measure_column):
    """
    Realiza la prueba de Kolmogorov-Smirnov para evaluar normalidad por grupos
    Args:
        df: DataFrame con los datos
        group_col: Nombre de la columna de agrupación
        value_col: Nombre de la columna con valores a evaluar
    Returns:
        DataFrame con resultados de la prueba por grupo
    """
    results = []
    for group in df[group_column].unique():
        data = df[df[group_column] == group][measure_column]
        stat, pval = stats.kstest(data, 'norm', args=(data.mean(), data.std()))
        results.append({'grupo': group,'estadistico_ks': stat.round(4),'valor_p': pval.round(4)})
        
    return pd.DataFrame(results)

In [None]:
normalidad = test_ks_normality(df,'Promotion', 'SalesInThousands')
normalidad

Sin embargo, varios estudios muestran que la prueba ANOVA es robusta ante violaciones de la normalidad si:
- Los grupos tienen un tamaño similar
- Hay por lo menos 40 observaciones en cada grupo.

## ANOVA

In [None]:
from scipy.stats import f_oneway

def realizar_anova(df, group_column, measure_column, alpha=0.05):
    """
    Realiza prueba ANOVA de una vía para comparar medias entre grupos.
    Parámetros:
    df (pandas.DataFrame): DataFrame con los datos
    grupo_col (str): Nombre de la columna que contiene los grupos
    valor_col (str): Nombre de la columna con los valores a comparar
    alpha (float): Nivel de significancia (default 0.05)
    Retorna:
    p-value
    """
    # Crear valores por grupo
    grupos = df[group_column].unique()
    valores_grupos = [df[df[group_column] == grupo][measure_column] for grupo in grupos]
    
    # Realizar prueba ANOVA
    statistic, p_value = f_oneway(*valores_grupos)
    
    # Determinar resultado
    resultado = "Se rechaza la hipótesis nula: hay al menos una diferencia significativa entre los grupos." if p_value < alpha else "No se puede rechazar la hipótesis nula: no hay suficiente evidencia para afirmar que hay diferencias significativas entre los grupos."

    print(f'Estadistico {statistic:.4f}')
    print(f'Valor p: {p_value:.4f}')
    print(resultado)
    
    return  p_value

In [None]:
resultado = realizar_anova(df,'Promotion', 'SalesInThousands')

La tabla ANOVA no indica qué grupo es diferente al resto, sin embargo, las pruebas post-hoc son útiles para detectar qué grupo es diferente al resto. 
- LSD/DMS (Diferencia menos significativa): Es el equivalente a múltiples pruebas t, no se hacen correcciones y los resultados no son precisos.
- Bonferroni: Corrige el nivel de significancia dividiéndolo entre el número de grupos. Es preferible cuando son pocas comparaciones. 
- Tukey: Preferible cuando son muchas comparaciones. Es deseable que el tamaño de cada grupo sea igual. 
- REGWQ (Ryan-Einot-Gabriel-Welsh): Recomendable, pero se debe evitar cuando las muestras son de diferente tamaño.
- Dunnett: Es apropiada cuando se desea comparar con un grupo de control.
- Gabriel: Apropiada cuando el tamaño de las muestras es ligeramente diferente.
- GT2 de Hochberg: Apropiadas cuando el tamaño de las muestras es muy diferente
- Games- Howell: Recomendable cuando las varianzas son diferentes.

La librería statsmodel permite realizar la prueba de Tukey, Bonferroni y Dunnet

In [None]:
def post_hoc_test(data, group_column, value_column, test_type='tukey', control_group=None, alpha=0.05):
    """
    Realiza pruebas post hoc múltiples: Tukey o Bonferroni.
    Parámetros:
    data: DataFrame que contiene los datos
    group_column: Nombre de la columna que contiene los grupos
    value_column: Nombre de la columna que contiene los valores a comparar
    test_type: Tipo de prueba ('tukey', 'bonferroni')
    alpha : Nivel de significancia (por defecto 0.05)
    Retorna:
    Objeto con resultados de la prueba seleccionada
    """
    from statsmodels.stats.multicomp import MultiComparison
    from statsmodels.stats.multicomp import pairwise_tukeyhsd
    
    mc = MultiComparison(data[value_column], data[group_column])
    
    if test_type.lower() == 'tukey':
        print(mc.tukeyhsd(alpha=alpha))
    
    elif test_type.lower() == 'bonferroni':
        print(mc.allpairtest(stats.ttest_ind, method='bonf')[0])
    
    else:
        raise ValueError("Tipo de prueba no válido. Usar 'tukey' o 'bonferroni'")

In [None]:
resultado_tukey = post_hoc_test(df, "Promotion", "SalesInThousands", test_type='tukey')
resultado_tukey

In [None]:
resultado_bonferroni = post_hoc_test(df, "Promotion", "SalesInThousands", test_type='bonferroni')
resultado_bonferroni

Ejemplo de redacción de conclusiones: 

>Se realizó un ANOVA de un factor para analizar cómo ________ influye en _________. Los resultados muestran que _________tiene un efecto significativo en __________, F(_,_) = ___, p = ___. Las comparaciones post-hoc utilizando el método de Tukey HSD indican que la media de ______ es significativamente diferente a la media de _________ y _______

## Prueba Kruskal-Wallis

In [None]:
from scipy.stats import kruskal
import pandas as pd

def kruskal_test(df: pd.DataFrame, group_col: str, value_col: str, alpha: float = 0.05) -> dict:
    """
    Realiza la prueba de Kruskal-Wallis para comparar múltiples grupos.
    Args:
        df: DataFrame con los datos
        group_col: Nombre de la columna que contiene los grupos
        value_col: Nombre de la columna con los valores a comparar
        alpha: Nivel de significancia (por defecto 0.05)  
    Returns:
        dict: Diccionario con los resultados de la prueba
    """
    # Obtener grupos únicos
    grupos = [df[df[group_col] == g][value_col] for g in df[group_col].unique()]
    
    # Realizar prueba Kruskal-Wallis
    statistic, p_value = kruskal(*grupos)
    
    # Preparar resultados
    resultados = {
        'estadistico': statistic,
        'p_valor': p_value,
        'alfa': alpha,
        'decision': 'Se rechaza H0' if p_value < alpha else 'No se rechaza H0',
        'interpretacion': ('Hay evidencia de diferencias significativas entre los grupos.' 
                         if p_value < alpha 
                         else 'No hay suficiente evidencia para afirmar diferencias significativas entre los grupos.')}
    
    return resultados

In [None]:
# Ejemplo de uso:
resultados = kruskal_test(df, 'Promotion', 'SalesInThousands')
print(f"Estadístico: {resultados['estadistico']:.4f}")
print(f"Valor p: {resultados['p_valor']:.4f}")
print(f"Decisión: {resultados['decision']}")
print(f"Interpretación: {resultados['interpretacion']}")