In [1]:
# calculate the pearson's correlation between two variables
from numpy.random import randn
from numpy.random import seed
from scipy.stats import pearsonr

# seed random number generator
seed(1)

# prepare data
data1 = 10 * randn(10000) + 50
data2 = data1 + (10 * randn(10000) + 50)

# calculate pearson's correlation
corr, _ = pearsonr(data1, data2)
print('Pearsons correlation: %.3f' % corr)

Pearsons correlation: 0.712


In [3]:
# calculate the Cohen's d between two samples
from numpy.random import randn, seed
from numpy import mean, var
from math import sqrt

# Function to calculate Cohen's d for independent samples
def cohend(d1, d2):
    # Calculate the size of samples
    n1, n2 = len(d1), len(d2)
    # Calculate the variance of the samples (ddof=1 → muestra)
    s1, s2 = var(d1, ddof=1), var(d2, ddof=1)
    # Calculate the pooled standard deviation
    s = sqrt(((n1 - 1) * s1 + (n2 - 1) * s2) / (n1 + n2 - 2))
    # Calculate the means of the samples
    u1, u2 = mean(d1), mean(d2)
    # Calculate the effect size
    return (u1 - u2) / s

# Seed random number generator
seed(1)

# Prepare data: two samples with different means
data1 = 10 * randn(10000) + 60
data2 = 10 * randn(10000) + 55

# Calculate Cohen's d
d = cohend(data1, data2)
print('Cohen\'s d: %.3f' % d)

Cohen's d: 0.500


# 📏 Interpretación de Cohen's d (Tamaño del Efecto)

**Cohen's d** mide la diferencia entre dos medias en unidades de desviación estándar.

| Tamaño del Efecto | Valor de `d`       | Interpretación                            |
|--------------------|--------------------|--------------------------------------------|
| 🟢 **Pequeño**     | `d ≈ 0.20`         | Hay una diferencia, pero es sutil          |
| 🟡 **Mediano**     | `d ≈ 0.50`         | Diferencia moderada y apreciable           |
| 🔴 **Grande**      | `d ≈ 0.80` o más   | La diferencia es clara y significativa     |

> 📌 Estos valores son una guía general, no reglas estrictas. Dependen del contexto del estudio.

## 📊 Otros Métodos Populares para Medir el Tamaño del Efecto

Además de **Cohen’s d**, existen otras métricas muy utilizadas para cuantificar la **diferencia entre tratamientos** o grupos:

- **🔁 Odds Ratio (OR)**  
  Mide las **probabilidades (odds)** de que ocurra un resultado en un grupo (tratamiento) comparado con otro.  
  > Útil en estudios de caso-control o ensayos clínicos.

- **📈 Relative Risk Ratio (RR)**  
  Mide las **probabilidades absolutas (riesgos)** de que ocurra un evento en un grupo respecto a otro.  
  > Comúnmente usado en epidemiología y estudios prospectivos.

> 📌 Ambas métricas se usan para analizar si un tratamiento o condición **aumenta o disminuye** la probabilidad de un evento.
