# Simulacion de la distribucion hipergeometrica

Definimos la distribución hipergeométrica como sigue:
$$ P(X = k) = \frac{{\binom{K}{k} \binom{N-K}{n-k}}}{{\binom{N}{n}}} $$

Donde:
- $N$ es el número total de elementos
- $K$ es el número total de elementos de la clase que nos interesa
- $n$ es el número de elementos que se seleccionan

En una urna hay 6 bolas rojas, 5 azules y 4 verdes. Se extraen 2. Si $X$ la cantidad de bolas rojas extraídas e $Y$ la cantidad de azules.

$$ P(X = x, Y = y) = \frac{{6 \choose x} {5 \choose y} {4 \choose 2 - x - y}}{{15 \choose 2}} $$

In [1]:
from scipy.stats import hypergeom

# Parámetros de la distribución hipergeométrica
N_total = 15  # Tamaño total de la población (total de bolas en la urna)
N_rojas = 6   # Número de bolas rojas en la urna
N_azules = 5  # Número de bolas azules en la urna
n_extracciones = 2  # Número de extracciones

# Crear objetos de la distribución hipergeométrica para X (bolas rojas) e Y (bolas azules)
distribucion_X = hypergeom(N_total, N_rojas, n_extracciones)
distribucion_Y = hypergeom(N_total, N_azules, n_extracciones)

# Generar muestras aleatorias de X y Y
muestra_X = distribucion_X.rvs(size=10)  # Generar 10 muestras aleatorias de X
muestra_Y = distribucion_Y.rvs(size=10)  # Generar 10 muestras aleatorias de Y

print("Muestras aleatorias de X (bolas rojas):", muestra_X)
print("Muestras aleatorias de Y (bolas azules):", muestra_Y)


Muestras aleatorias de X (bolas rojas): [0 0 0 2 1 0 2 1 0 0]
Muestras aleatorias de Y (bolas azules): [1 1 1 1 1 0 0 1 1 1]


In [2]:
# calcular la probabilidad de la variable aleatoria X (bolas rojas) y Y (bolas azules)
probabilidad_X = distribucion_X.pmf(muestra_X)
probabilidad_Y = distribucion_Y.pmf(muestra_Y)

In [3]:
probabilidad_X

array([0.34285714, 0.34285714, 0.34285714, 0.14285714, 0.51428571,
       0.34285714, 0.14285714, 0.51428571, 0.34285714, 0.34285714])