In [62]:
import numpy as np
from scipy.stats import binom
from scipy.stats import hypergeom

# Distribución de Bernoulli
Solo tiene dos posibles resultados:
* Éxito (1)
* Fracaso (0)
Con probabilidades:
* P(1)=p
* P(0)=1−p

## Binomial en Bernoulli
##### La binomial es la suma de muchos ensayos Bernoulli independientes
##### La binomial calcula ¿Cuántos éxitos (fallas, defectos, paros) ocurren en un número n de ensayos?
##### Binomial = suma de Bernoullis independientes

## Hipergeométrica en Bernoulli
##### Los ensayos Bernoulli NO son independientes porque extraes sin reemplazo de una población finita

### LA MEDIA Y VARIANZA DE UNA VARIABLE BERNOULLI
#### La media de una variable bernoulli es P
#### El valor esperado es P
#### La varianza de una variable bernoulli es P(1-P)

In [63]:
pop = [1, 2, 3, 4, 5, 6]

In [64]:
def utility(random_var):
    if random_var in [3, 4, 5, 6]:
        return 1
    else:
        return 0

In [65]:
trials = 100000
outcomes = []
for _ in range(trials):
    outcomes.append(utility(np.random.choice(pop)))

In [66]:
sum(outcomes) / trials

0.66836

In [67]:
4/6

0.6666666666666666

0.66498 es el valor esperado, que es aproximadamente 4/6 que es la probabilidad de exito que es el valor esperado para el caso de lanzar dados.

# REGULARIDADES

### DISTRIBUCIÓN BINOMIAL:
1. Tiene n intentos independientes
2. Cada intento solo puede ser éxito / fracaso -- 1 / 0
3. La probabilidad de éxito p es constante


**Ejemplo aplicado: Paradas mensuales de una bomba Warman**
Estimar, para una bomba Warman, cuántas paradas (k) no planificadas ocurren en un año y la probabilidad de que haya ≥3 paradas en ese año. Se tiene una probabilidad mensual de parada p = 0.15 (15%) en n = 12 (meses).

In [68]:
#Datos del problema
n=12
p=0.15
k = np.arange(0, n+1)

# PMF y CDF
pmf = binom.pmf(k, n, p)
cdf = binom.cdf(k, n, p)

In [69]:
#Cálculo de  pmf para k <= 6 (¿Cual es la probabilidad de que ocurran exactamente 6 paradas en un año?)
print("PMF (prob de que exactamente ocurran k paradas en un año es):")
for i in range(6):
    print(f"p({i} paradas) = {pmf[i]:.4f}")

PMF (prob de que exactamente ocurran k paradas en un año es):
p(0 paradas) = 0.1422
p(1 paradas) = 0.3012
p(2 paradas) = 0.2924
p(3 paradas) = 0.1720
p(4 paradas) = 0.0683
p(5 paradas) = 0.0193


CONCLUSION PMF:
* “Lo más probable es que la bomba Warman tenga entre 1 y 2 paradas no planificadas al año. Esto cubre aproximadamente el 58% de los escenarios posibles.”

In [70]:
#Cálculo de  CDF para k <= 3 (¿Cual es la probabilidad de tener como máximo 2 paradas en el año?)
max_2paradas = cdf[2]
print(f"La probabilidad de que ocurran como máximo 2 paradas en un año es = {max_2paradas:.4f}")


La probabilidad de que ocurran como máximo 2 paradas en un año es = 0.7358


CONCLUSION CDF:
* Existe alrededor de 74% de probabilidad de que la bomba tenga como máximo 2 paradas en el año.
Con esto podemos planificar el presupuesto base y la programación anual

In [71]:
# Calculo de 1 - CDF(2) (¿Cual es la probabilidad de tener 3 o más paradas en el año?)
mas_de_3paradas = 1 - cdf[2]
print(f"La probabilidad de tener 3 o más paradas en el año es = {mas_de_3paradas:.4f}")

La probabilidad de tener 3 o más paradas en el año es = 0.2642


CONCLUSION DE 1 - CDF:
* Hay aproximadamente 26% de probabilidad de que la bomba sufra 3 o más paradas, lo cual ya se considera un escenario operativo crítico.
Para este caso recomendamos mantener 1 motor de repuesto y un plan de contingencia, ya que estos eventos ocurren con suficiente frecuencia como para justificarlo


### DISTRIBUCION HIPERGEOMETRICA
1. se extraen elemento sin reemplazo
2. La población total N es conocida
3. Hay un número de éxitos K dentro de la población
4 Las probabilidades cambian despues de cada extracción

| Concepto | Binomial | Hipergeometrica|
|----------|----------|----------------|
| ¿Reemplazo? | Sí | No |
| Probabilidad constante | Sí | No |
| Poblacion | Infinita o no relevante | Finita conocida |

¿Cambia la probabilidad después de sacar un elemento? — Si sí, es hipergeométrica; si no, es binomial.

**Ejemplo práctico: Cambio de Liners Molino SAG**
En el almacén de recambios del molino SAG hay N = 180 liners. Control de calidad detectó D = 12 liners defectuosos en el stock. Para un cambio programado se retiran n = 20 liners al azar sin devolverlos.
* ¿Cuál es la probabilidad de que en la selección haya exactamente k liners defectuosos? (PMF)
* ¿Cuál es la probabilidad de que haya al menos 1 defectuoso (umbral de rechazo del lote)? (CDF)

In [72]:
#datos del problema
N = 180 #Total de liners en stock
D = 12 #liners defectuosos en stock
n = 20 #Liners seleccionados para cambio
k = np.arange(0, n+1) #Valores posibles de liners defectuosos en la selección

#Definicion de PMF y CDF
pmf = hypergeom.pmf(k, N, D, n)
cdf = hypergeom.cdf(k, N, D, n)

In [73]:
# Cálculo de  pmf para k = 0 (¿Cual es la probabilidad de que no haya defectuosos en la selección?)
P_exactamente_0 = pmf[0]  # prob de 0 defectuosos
print(f"P(0 defectuosos en la selección) = {P_exactamente_0:.3f}")

P(0 defectuosos en la selección) = 0.232


CONCLUSION P(X = 0)
* Hay 23% de probabilidad de que, al escoger 20 liners del almacén, ninguno esté defectuoso.

In [None]:
# Cálculo de 1 - CDF(0) (¿Cual es la probabilidad de que haya 1 o mas defectuosos en la selección?)
P_al_menos_1 = 1 - cdf[0] # prob de X>=1 defectuoso
print(f"P(1 o más defectuoso) = {P_al_menos_1:.3f}")

P(1 o más defectuoso) = 0.768



CONCLUSION P(X ≥ 1)
* Hay 77% de probabilidad de que en la selección aparezca al menos un liner defectuoso.

In [75]:
# Cálculo de  pmf para k = 2 (¿Cual es la probabilidad de que haya exactamente 2 defectuosos en la selección?)
P_exactamente_2 = pmf[2]  # prob de exactamente 2 defectuosos
print(f"P(exactamente 2 defectuosos) = {P_exactamente_2:.3f}")

P(exactamente 2 defectuosos) = 0.260


CONCLUSION P(X=2)
* La probabilidad de encontrar exactamente 2 liners defectuosos en la selección de 20 es ≈ 24.4% — es uno de los escenarios más probables (junto con 1 defecto).

In [76]:
# Cálculo de  pmf para k = 4 (¿Cual es la probabilidad de que haya 4 o más defectuosos en la selección?)
P_mas_de_3 = 1 - cdf[3]   # prob de >=4 defectuosos
print(f"P(4 o más defectuosos) = {P_mas_de_3:.3f}")

P(4 o más defectuosos) = 0.031



CONCLUSION P(X ≥ 4)
* Solo hay 3% de probabilidad de un escenario grave (4 o más defectuosos) — es poco frecuente pero no imposible.