# Medición de la Fuerza: V de Cramer

Mientras que Chi-cuadrado nos dice si existe una relación (p-valor < 0.05), no nos dice si esa relación es débil o fuerte. La **V de Cramer** es el estándar para medir la "fuerza de asociación" entre variables categóricas, escalando el resultado entre **0 y 1**.

### 1. Relación con Chi-cuadrado
La V de Cramer se deriva directamente del estadístico $\chi^2$. Su fórmula es:

$$V = \sqrt{\frac{\chi^2}{n \times \min(c-1, r-1)}}$$

Donde:
* $\chi^2$: Es el valor obtenido en la prueba de Chi-cuadrado.
* $n$: Tamaño total de la muestra (número de registros).
* $r$: Número de filas en la tabla de contingencia.
* $c$: Número de columnas en la tabla de contingencia.

> **¿Por qué dividir por el mínimo?** Porque esto normaliza el resultado para que el tamaño de la tabla (cuántas categorías tienes) no infle artificialmente la fuerza de la relación.

---

### 2. Interpretación: Escala de Jacob Cohen
Cohen (1988) propuso una guía para interpretar el "Tamaño del Efecto" (*Effect Size*). Sin embargo, Cohen advirtió que la interpretación **depende de los Grados de Libertad (gl)**, que se calculan como $df = \min(c-1, r-1)$.

| Fuerza de Asociación | df = 1 | df = 2 | df = 3 |
| :--- | :---: | :---: | :---: |
| **Pequeña** | 0.10 | 0.07 | 0.06 |
| **Mediana** | 0.30 | 0.21 | 0.17 |
| **Grande** | 0.50 | 0.35 | 0.29 |



---

### 3. Interpretación: Escala de Rea y Parker (1992)
Muchos analistas de datos prefieren la escala de Rea y Parker porque es más detallada y no depende tanto de los grados de libertad para una lectura rápida:

| Valor de V | Interpretación |
| :--- | :--- |
| **0.00 a 0.10** | Asociación despreciable / insignificante |
| **0.10 a 0.20** | Asociación débil |
| **0.20 a 0.40** | Asociación moderada |
| **0.40 a 0.60** | Asociación fuerte |
| **0.60 a 0.80** | Asociación muy fuerte |
| **0.80 a 1.00** | Asociación superior / perfecta |

---

### 4. Aplicación en tu Modelo de ML
Si estás filtrando variables para tu modelo:
1.  **P-valor de $\chi^2$ > 0.05:** Elimina la variable (no hay relación probada).
2.  **P-valor < 0.05 y V de Cramer < 0.10:** Considera eliminarla. Aunque hay relación, es tan débil que solo añadirá ruido o complejidad innecesaria a tu modelo de Machine Learning.
3.  **V de Cramer > 0.30:** ¡Excelente! Es una característica (*feature*) con alto poder predictivo.