# Explicación del Test Chi-Cuadrado ( $\chi^2$ )

El Test Chi-Cuadrado es una prueba estadística no paramétrica utilizada para determinar si existe una asociación significativa entre dos variables categóricas. También se emplea para evaluar si la distribución observada de una variable difiere significativamente de una distribución esperada.

## Hipótesis

El Test Chi-Cuadrado se basa en las siguientes hipótesis:

* **Hipótesis Nula ( $H_0$ ):** No existe asociación entre las variables categóricas. La distribución observada es igual a la distribución esperada (o las variables son independientes).
* **Hipótesis Alternativa ( $H_1$ ):** Existe una asociación significativa entre las variables categóricas. La distribución observada es diferente de la distribución esperada (o las variables son dependientes).

## Fórmula

El estadístico Chi-Cuadrado se calcula utilizando la siguiente fórmula:

$$ \chi^2 = \sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i} $$

Donde:

* $O_i$ : Frecuencia observada en la categoría $i$.
* $E_i$ : Frecuencia esperada en la categoría $i$.
* $n$ : Número total de categorías o celdas.

## Frecuencias Esperadas

Las frecuencias esperadas ($E_i$) se calculan de manera diferente dependiendo del tipo de aplicación del test:

### Para una Prueba de Bondad de Ajuste:

Si se está comparando una distribución observada con una distribución teórica conocida (por ejemplo, una distribución uniforme), las frecuencias esperadas se calculan basándose en las proporciones teóricas. Por ejemplo, si se espera que las categorías tengan la misma proporción, entonces:

$$ E_i = \text{Número total de observaciones} \times \frac{1}{\text{Número de categorías}} $$

### Para una Prueba de Independencia (Tablas de Contingencia):

Cuando se evalúa la independencia entre dos variables categóricas en una tabla de contingencia, la frecuencia esperada para cada celda se calcula como:

$$ E_{fila,columna} = \frac{(\text{Suma de Fila}) \times (\text{Suma de Columna})}{\text{Tamaño total de la muestra}} $$

## Grados de Libertad (gl)

Los grados de libertad son un parámetro crucial para determinar el valor crítico del Chi-Cuadrado y se calculan de la siguiente manera:

### Para una Prueba de Bondad de Ajuste:

$$ gl = k - 1 $$

Donde $k$ es el número de categorías.

### Para una Prueba de Independencia (Tablas de Contingencia):

$$ gl = (filas - 1) \times (columnas - 1) $$

Donde 'filas' es el número de filas y 'columnas' es el número de columnas en la tabla de contingencia.

## Interpretación

Una vez calculado el valor de $\chi^2$, se compara con un valor crítico obtenido de una tabla de distribución Chi-Cuadrado, utilizando los grados de libertad apropiados y un nivel de significancia ( $\alpha$ ) predefinido (comúnmente 0.05).

* **Si $\chi^2_{calculado} > \chi^2_{crítico}$ (o si el p-valor < $\alpha$ ):** Se rechaza la hipótesis nula. Esto sugiere que existe una asociación significativa entre las variables o que la distribución observada es significativamente diferente de la esperada.
* **Si $\chi^2_{calculado} \le \chi^2_{crítico}$ (o si el p-valor $\ge \alpha$ ):** No se rechaza la hipótesis nula. Esto sugiere que no hay evidencia suficiente para afirmar una asociación significativa o que la distribución observada no difiere significativamente de la esperada.

## Supuestos

Para que los resultados del Test Chi-Cuadrado sean válidos, se deben cumplir ciertos supuestos:

* **Datos Categóricos:** Las variables deben ser de naturaleza categórica (nominales u ordinales).
* **Observaciones Independientes:** Cada observación debe ser independiente de las demás.
* **Frecuencias Esperadas Suficientemente Grandes:** Generalmente, se recomienda que al menos el 80% de las frecuencias esperadas sean mayores o iguales a 5, y ninguna frecuencia esperada debe ser menor a 1. Si este supuesto no se cumple, puede ser necesario agrupar categorías o utilizar una prueba alternativa (como la prueba exacta de Fisher).

## Cuándo usar el Test Chi-Cuadrado

* **Prueba de Bondad de Ajuste:** Para determinar si una muestra de datos categóricos se ajusta a una distribución de probabilidad teórica.
* **Prueba de Independencia:** Para determinar si hay una relación estadísticamente significativa entre dos variables categóricas en una tabla de contingencia.

# Explicación de la V de Cramer

La **V de Cramer** (también conocida como Phi de Cramer o Coeficiente V de Cramer) es una medida de asociación entre dos variables nominales en una tabla de contingencia. Es una de las medidas de asociación más comunes y se utiliza para cuantificar la fuerza de la relación entre las variables después de haber realizado un Test Chi-Cuadrado de independencia.

## Relación con el Test Chi-Cuadrado ( $\chi^2$ )

La V de Cramer se deriva directamente del estadístico Chi-Cuadrado. Mientras que el Test Chi-Cuadrado nos indica si existe una asociación significativa entre las variables (es decir, si podemos rechazar la hipótesis nula de independencia), la V de Cramer nos dice **qué tan fuerte es esa asociación**.

El valor del Chi-Cuadrado es sensible al tamaño de la muestra y al número de categorías. Un valor alto de $\chi^2$ no siempre significa una asociación fuerte, especialmente en muestras grandes. La V de Cramer normaliza el valor de $\chi^2$ para que sea interpretable como una medida de fuerza de asociación, independientemente del tamaño de la muestra y las dimensiones de la tabla.

## Fórmula

La fórmula para calcular la V de Cramer es la siguiente:

$$ V = \sqrt{\frac{\chi^2}{N \times \min(k-1, r-1)}} $$

Donde:

* $\chi^2$ : Es el valor del estadístico Chi-Cuadrado obtenido del Test Chi-Cuadrado de independencia.
* $N$ : Es el número total de observaciones (tamaño de la muestra).
* $k$ : Es el número de columnas en la tabla de contingencia.
* $r$ : Es el número de filas en la tabla de contingencia.
* $\min(k-1, r-1)$ : Representa el mínimo entre (número de columnas - 1) y (número de filas - 1). Este término es crucial porque asegura que la V de Cramer esté acotada entre 0 y 1.

## Rango e Interpretación

La V de Cramer siempre toma un valor entre 0 y 1:

* **$V = 0$ :** Indica que no hay asociación entre las variables (independencia perfecta).
* **$V = 1$ :** Indica una asociación perfecta entre las variables.

La interpretación de la fuerza de la asociación basada en la V de Cramer es subjetiva, pero a menudo se utilizan las siguientes pautas generales (aunque pueden variar según el campo de estudio):

| Valor de V de Cramer | Fuerza de la Asociación |
| :------------------- | :---------------------- |
| 0.00 - 0.10          | Muy débil o ninguna     |
| 0.10 - 0.30          | Débil                   |
| 0.30 - 0.50          | Moderada                |
| 0.50 - 0.70          | Fuerte                  |
| 0.70 - 1.00          | Muy fuerte              |

## Cuándo usar la V de Cramer

La V de Cramer es particularmente útil cuando:

* Se ha realizado un Test Chi-Cuadrado de independencia y se ha encontrado una asociación significativa.
* Se desea cuantificar la fuerza de esa asociación, más allá de solo saber si existe o no.
* Se comparan las asociaciones entre diferentes pares de variables en diferentes tablas de contingencia, ya que la V de Cramer permite una comparación más justa al normalizar el estadístico Chi-Cuadrado.

En resumen, el Test Chi-Cuadrado nos dice "si" hay una relación, y la V de Cramer nos dice "qué tan fuerte" es esa relación.

# Tabla Resumen: Test Chi-Cuadrado ($\chi^2$) y V de Cramer


| Característica         | Test Chi-Cuadrado ($\chi^2$)                                        | V de Cramer                                                           |
| :--------------------- | :------------------------------------------------------------------ | :-------------------------------------------------------------------- |
| **Propósito Principal** | Determinar si existe una **asociación estadísticamente significativa** entre dos variables categóricas (o si una distribución observada difiere de una esperada). | Cuantificar la **fuerza o magnitud de la asociación** entre dos variables categóricas. |
| **Tipo de Prueba** | Prueba de hipótesis (inferencial).                                 | Medida de tamaño del efecto (descriptiva/interpretativa).             |
| **Hipótesis** | **$H_0$:** No hay asociación / Independencia. <br> **$H_1$:** Hay asociación / Dependencia. | No aplica directamente (es una medida de fuerza, no una prueba de hipótesis en sí misma). |
| **Fórmula** | $$ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} $$                        | $$ V = \sqrt{\frac{\chi^2}{N \times \min(k-1, r-1)}} $$                 |
| **Variables** | Dos variables categóricas (nominales u ordinales).                | Dos variables categóricas (nominales u ordinales).                    |
| **Rango de Valores** | De 0 a infinito. El valor depende del tamaño de la muestra y el número de categorías. | De 0 a 1.                                                             |
| **Interpretación** | **P-valor < $\alpha$:** Rechazar $H_0$, hay asociación significativa. <br> **P-valor $\ge \alpha$:** No rechazar $H_0$, no hay evidencia de asociación significativa. | **0:** Sin asociación. <br> **1:** Asociación perfecta. <br> Valores intermedios indican la fuerza (débil, moderada, fuerte). |
| **Sensibilidad a $N$** | Muy sensible al tamaño de la muestra ($N$). Un $N$ grande puede producir un $\chi^2$ significativo incluso con una asociación débil. | No sensible al tamaño de la muestra. Normaliza el $\chi^2$ para permitir comparaciones entre estudios. |
| **Dependencia** | Es la base para el cálculo de la V de Cramer.                      | Se deriva del valor de $\chi^2$. Necesita que el $\chi^2$ haya sido calculado previamente. |
| **Análogo Cuantitativo** | N/A (es una prueba de significancia).                               | Se puede ver como un análogo al coeficiente de correlación de Pearson para variables categóricas. |
| **Rol en el Análisis** | Responde a la pregunta: "¿Existe una relación?"                   | Responde a la pregunta: "¿Qué tan fuerte es esa relación?"            |