### 13_DISTRIBUCIÓN HIPERGEOMÉTRICA

In [None]:
# Graficar la función masa de probabilidad
import numpy as np
from scipy.stats import hypergeom
import matplotlib.pyplot as plt


def plot_hipergeom(N, K, n):
    """Dibuja la función masa, con los argumentos:
    N = Tamaño de la población
    K = Éxitos en la población
    n = Tamaño de la muestra
    """
    k = np.arange(0, min(n, K) + 1)  # Valores posibles
    pmf = hypergeom.pmf(k, N, K, n)  # Probabilidades hipergeométrica
    cdf = hypergeom.cdf(k, N, K, n)  # Acumuladas hipergeométrica

    plt.figure(figsize=(10, 6))
    plt.bar(k, pmf, alpha=0.6, color="blue", label="PMF")
    plt.plot(k, cdf, "r-", label="CDF")
    plt.title(f"Distribución Hipergeométrica (N={N}, K={K}, n={n})")
    plt.xlabel("k éxitos en la muestra")
    plt.ylabel("Probabilidad")
    plt.legend()
    plt.show()

In [None]:
plot_hipergeom(20, 7, 5)

### Control de calidad

In [None]:
N = 100  # La población son las piezas de la caja
K = 10  # El éxito es que sea defectuoso
n = 8  # La muestra que se escoge para inspeccionar

plot_hipergeom(N, K, n)

In [None]:
# Probabilidad de exactamente dos defectuosos
prob_2_defect = hypergeom.pmf(2, N, K, n)
print(f"La probabilidad de exactamente dos defectuosos es {prob_2_defect:.4f}")

In [None]:
k = np.arange(0, 9)  # Todos los valores de 0 a 10
k2 = 2  # El valor 2
k_2 = np.delete(k, 2)  # Todos los valores menos el 2

# Dibujamos diferenciando P[X=2]
plt.figure(figsize=(10, 6))
plt.bar(k2, hypergeom.pmf(k2, N, K, n), alpha=0.6, color="red", label="$P[X=2]$")
neq = "$P[X \\neq 2]$"
plt.bar(
    k_2, hypergeom.pmf(k_2, N, K, n), alpha=0.6, color="blue", label="$P[X \\neq 2]$"
)
plt.title(f"Distribución Hipergeométrica (N={N}, K={K}, n={n})")
plt.xlabel("k defectuosos en la muestra")
plt.ylabel("Probabilidad")
plt.legend()
plt.show()

### Genética

In [None]:
# Definimos los parámetros
N = 200  # Población
K = 50  # El éxito es que tenga el alelo
n = 10  # La muestra que se escoge para inspeccionar

""" Dibujamos la función de probabilidad (pmf) y distribución (cdf)
    con la función definida antes """
plot_hipergeom(N, K, n)

In [None]:
prob_more_3 = 1 - hypergeom.cdf(3, N, K, n)
print(f"La probabilidad de más de 3 personas con el alelo es {prob_more_3:.4f}")

In [None]:
# Dos arrays con los valores menores o iguales que 3 y mayores que 3
k_up_3 = np.arange(0, 4)
k_more_3 = np.arange(4, 11)

# Probabilidades
pmf_up_3 = hypergeom.pmf(k_up_3, N, K, n)
pmf_more_3 = hypergeom.pmf(k_more_3, N, K, n)

# Graficamos
plt.figure(figsize=(10, 6))
plt.bar(k_up_3, pmf_up_3, alpha=0.6, color="blue", label="$P[X\leq3]$")
plt.bar(k_more_3, pmf_more_3, alpha=0.6, color="red", label="$P[X > 3]$")
plt.title(f"Distribución Hipergeométrica (N={N}, K={K}, n={n})")
plt.xlabel("k personas con el alelo en la muestra")
plt.ylabel("Probabilidad")
plt.legend()
plt.show()

### Simulación en ciencias del deporte

In [None]:
import numpy as np
from scipy.stats import hypergeom
import matplotlib.pyplot as plt
import seaborn as sns

# Definimos los parámetros de la distribución
N = 50  # Total de jugadores disponibles
K = 20  # Tiradores efectivos
n = 12  # Tamaño del equipo

# Simulación de 1000 selecciones de equipo
num_simulations = 1000
results = []

for _ in range(num_simulations):
    # Crear población
    population = np.array(["Tirador"] * K + ["No_tirador"] * (N - K))
    np.random.shuffle(population)
    # Seleccionar equipo
    team = population[:n]
    triple_players = np.sum(team == "Tirador")
    results.append(triple_players)

# Creamos arrays con las listas
results = np.array(results)
mean_triple_players = np.mean(results)

# Visualización
plt.figure(figsize=(10, 6))
sns.histplot(results, stat="probability")
plt.axvline(
    mean_triple_players,
    color="r",
    linestyle="--",
    label=f"Media: {mean_triple_players:.2f}",
)
plt.title("Distribución de Tiradores por Equipo")
plt.xlabel("Número de Tiradores")
plt.ylabel("Probabilidad")
plt.legend()
plt.show()

# Comparación con valores teóricos
k = np.arange(0, n + 1)
pmf_k = hypergeom.pmf(k, N, K, n)

print(f"\nMedia teórica: {n * (K/N):.2f}")
print(f"Media simulada: {mean_triple_players:.2f}")