# 🧠 Distribuciones de probabilidad

---

## Objetivos académicos

1. **Comprender los conceptos fundamentales de probabilidad** y su aplicación en la cuantificación de la incertidumbre y el riesgo en diferentes contextos.

2. **Identificar y aplicar las principales distribuciones de probabilidad** (binomial y normal) para modelar fenómenos aleatorios tanto discretos como continuos.

3. **Resolver problemas prácticos utilizando fórmulas y funciones estadísticas en Python**, interpretando resultados y visualizando distribuciones de probabilidad.

4. **Distinguir entre eventos independientes y dependientes**, y calcular probabilidades compuestas en situaciones reales.

---

## Configuración

In [None]:
import matplotlib.pyplot as plt
from scipy.stats import binom, norm
import numpy as np
import pandas as pd

## Probabilidad clásica

----



La probabilidad estudia la incertidumbre y permite cuantificar el **riesgo** o **posibilidad** de que ocurra un evento.


Predecimos usando la **frecuencia relativa** o **modelos probabilísticos** basados en experimentos repetidos.

---

- **Probabilidad clásica:**  

---


  $$
  P(A) = \frac{\text{número de casos favorables}}{\text{número de casos posibles}}
  $$

 🎲 Ejemplos clásicos:

---

1. **¿Cuál es la probabilidad de sacar un número par al lanzar un dado?**  
   Casos favorables: 2, 4, 6 ⇒ 3  
   Casos posibles: 6  
   $$
   P(\text{par}) = \frac{3}{6} = 0.5
   $$

2. **¿Cuál es la probabilidad de sacar un 4?**  
   $$
   P(4) = \frac{1}{6}
   $$

3. **¿Cuál es la probabilidad de sacar un número mayor que 4?**  
   Casos favorables: 5, 6 ⇒ 2  
   $$
   P(>4) = \frac{2}{6} = \frac{1}{3}
   $$

---

**Eventos independientes**

---

Dos eventos $A$ y $B$ son **independientes** si la ocurrencia de uno no afecta al otro.

$$
P(A \cap B) = P(A) \cdot P(B)
$$


 🧪 Ejemplos:

---

1. **Lanzar una moneda y un dado:**  
   $$
   P(\text{cara y número par}) = 0.5 \cdot 0.5 = 0.25
   $$

2. **Sacar una bola roja de una urna y lanzar una moneda:**  
   $$
   P(\text{roja y águila}) = \frac{2}{5} \cdot 0.5 = \frac{1}{5}
   $$



## Distribuciónes de probabilidad

Una **distribución de probabilidad** es un modelo matemático que describe cómo se distribuyen los valores posibles de una variable aleatoria.


  >Una distribución de probabilidad es como un mapa que nos dice qué tan probable es cada resultado posible de una situación con incertidumbre.
  >Imagina que lanzas un dado: la distribución nos diría qué tan probable es sacar un 1, un 2, un 3… hasta un 6.

---


### Distribución binomial
---

Modela el número de éxitos en $n$ ensayos independientes con probabilidad $p$ de éxito.

$$
P(X = k) = C(n, k) \cdot p^k \cdot (1 - p)^{n - k}
$$


Esta distribución se usa cuando:

* La variable aleatoria es discreta.
* Haces el mismo experimento varias veces (como lanzar una moneda o responder preguntas de opción múltiple).
* Cada intento tiene solo dos resultados: éxito o fracaso.
* La probabilidad de éxito es la misma cada vez.
* Los intentos son independientes entre sí.

#### Ejemplos de variables aleatorias modeladas con una distribución binomial



1. **Salud:**  
   > Número de pacientes que presentan efectos secundarios tras recibir una vacuna (de un grupo de $n$ vacunados).

2. **Economía:**  
   > Número de clientes que aceptan una oferta promocional en una campaña de marketing (de $n$ clientes contactados).

3. **Ciencias:**  
   > Número de experimentos exitosos en una serie de pruebas de laboratorio (de $n$ intentos).

4. **Ingenierías:**  
   > Número de componentes electrónicos defectuosos en un lote de $n$ piezas producidas.

5. **Biología:**  
   > Número de semillas que germinan en una muestra de $n$ semillas plantadas, con una probabilidad conocida de germinación.

6. **Química:**  
   > Número de reacciones que producen el producto deseado en $n$ repeticiones de un experimento químico.

7. **Educación:**  
   > Número de estudiantes que aprueban un examen estandarizado (de $n$ estudiantes que lo presentan).

8. **Agricultura:**  
   > Número de plantas que sobreviven después de un tratamiento específico (de $n$ plantas tratadas).

9. **Tecnología:**  
   > Número de correos electrónicos que son marcados como spam por un filtro automático (de $n$ correos recibidos).

10. **Deportes:**  
    > Número de tiros acertados por un jugador en una serie de $n$ lanzamientos libres, con probabilidad constante de acierto.

---



#### Intuición tras el modelo
---

Considera el siguiente caso: 

> Una fabrica sabe que cierto producto sale de la linea de producción con defectos un 15 % de las veces. El producto se vende en u paquete con de 3 piezas. Representa la distribución para la cantidad de piezas defectuosas en un paquete.

1. La variable aleatoria $x$ es la cantidad de piezas defectuosas en el paquete, la cual puede tomar valores entre 0 y 3.
2. La variable aleatoria es discreta.
3. Una pieza está defectuosa o no.
4. Se conoce una probabilidad $p$ de que la pieza sea defectuosa.
5. El estado de una pieza no depende del anterior ni afecta al siguiente (son independientes).


Analicemos el caso de que $x=1$, es decir que haya un producto defectuoso dentro del paquete. Dado que los eventos son independientes la probabilidad estaría dada por  $p\cdot(1-p)(1-p)$, aqui puedes darte cuenta que esto solo consideran una sola posibilidad, cuando en realidad existen varias formas en las que puede haber exactamente una pieza defectuosa en el paquete: la primera, la segunda o la tercera pieza pueden ser la defectuosa. Por lo tanto, debemos considerar todas las **combinaciones** posibles. En este caso, hay 3 formas diferentes de que una sola pieza sea defectuosa y las otras dos no. Así, la probabilidad total de que haya exactamente una pieza defectuosa es:

$$
P(x=1) = C(3,1) \cdot p \cdot (1-p)^2
$$

donde $C(3,1)$ representa el número de maneras de elegir una pieza defectuosa entre tres. Este razonamiento se generaliza para cualquier número de piezas defectuosas en el paquete, utilizando la fórmula de la distribución binomial.



#### 🛡️🏢 Ejemplo 1:
---

Supón que una aseguradora sabe que, en promedio, el 10% de los clientes presentan un reclamo por accidente de auto cada año. Si seleccionamos al azar 6 clientes, sea $X$ la variable aleatoria que representa el número de clientes que presentan al menos un reclamo en el año.

Responde lo siguiente usando la fórmula de la binomial:

$$
P(X = k) = C(n, k) \cdot p^k \cdot (1-p)^{n-k}
$$

Donde $n = 6$, $p = 0.1$.

---




In [None]:
def get_pmf_binomial(n, p,labels=True):
    # Inicializamos listas vacías
    x_vals = []
    probabilidades = []

    # Llenamos las listas usando un ciclo for
    for k in range(n + 1):
        x_vals.append(k)
        prob = binom.pmf(k, n, p)
        probabilidades.append(prob)

    # Graficamos
    plt.figure(figsize=(8, 5))
    bars = plt.bar(x_vals, probabilidades, color="skyblue", edgecolor="black")

    # Agregar etiquetas de valor a cada barra
    if labels:
        for i in range(len(x_vals)):
            plt.text(x_vals[i], 1.01*probabilidades[i] , f"{probabilidades[i]:.2f}",
                    ha='center', va='bottom', fontsize=10)

    plt.title(f"Distribución Binomial: PMF (n = {n}, p = {p})")
    plt.xlabel("Éxitos (X)")
    plt.ylabel("Probabilidad P(X = x)")
    plt.xticks(x_vals)
    plt.ylim(0, 1.05*max(probabilidades) )  # margen superior para las etiquetas
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    plt.show()

In [None]:
get_pmf_binomial(6, 0.1)


1. **¿Cuál es la probabilidad de que exactamente 2 clientes presenten un reclamo este año?**  
   $$
   P(X = 2) = C(6, 2) \cdot (0.1)^2 \cdot (0.9)^{4} \approx 0.0984
   $$

2. **¿Cuál es la probabilidad de que menos de 3 clientes presenten un reclamo?**  
   $$
   P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)
   $$
   $$
   = C(6, 0) \cdot (0.1)^0 \cdot (0.9)^{6} + C(6, 1) \cdot (0.1)^1 \cdot (0.9)^{5} + C(6, 2) \cdot (0.1)^2 \cdot (0.9)^{4} \approx 0.9841
   $$

3. **¿Cuál es la probabilidad de que más de 4 clientes presenten un reclamo?**  
   $$
   P(X > 4) = 1 - P(X \leq 4)
   $$
   $$
   = 1 - \sum_{k=0}^{4} C(6, k) \cdot (0.1)^k \cdot (0.9)^{6-k} \approx 0.9407
   $$

4. **¿Cuál es la probabilidad de que entre 2 y 4 clientes (excluyendo los extremos) presenten un reclamo?**  
   $$
   P(2 < X < 4) = P(X = 3)
   $$
   $$
   = C(6, 3) \cdot (0.1)^3 \cdot (0.9)^{3} \approx 0.0138
   $$

   *(Si quieres incluir ambos extremos: $P(2 \leq X \leq 4) = P(X=2) + P(X=3) + P(X=4)$)*

---

**Solución con paquete estadístico**



| Método | Descripción | Ejemplo |
|--------|-------------|---------|
| `binom.pmf(k, n, p)` | Probabilidad de que ocurra exactamente $k$ éxitos | `binom.pmf(3, 5, 0.5)` → $P(X = 3)$ |
| `binom.cdf(k, n, p)` | Probabilidad acumulada de hasta $k$ éxitos | `binom.cdf(3, 5, 0.5)` → $P(X \leq 3)$ |
| `binom.sf(k, n, p)` | Probabilidad de más de $k$ éxitos | `binom.sf(3, 5, 0.5)` → $P(X > 3)$ |


---


In [None]:
n=6
p =0.1


1. **¿Cuál es la probabilidad de que exactamente 2 clientes presenten un reclamo este año?**  
   $$
   P(X = 2) = \text{binom.pmf}(2, 6, 0.1)
   $$


In [None]:
binom.pmf(2, n, p)

2. **¿Cuál es la probabilidad de que menos de 3 clientes presenten un reclamo?**  
   $$
   P(X < 3) = P(X \leq 2) = \text{binom.cdf}(2, 6, 0.1)
   $$

In [None]:
binom.cdf(2, n, p)

3. **¿Cuál es la probabilidad de que más de 4 clientes presenten un reclamo?**  
   $$
   P(X > 4) = \text{binom.sf}(4, 6, 0.1)
   $$

In [None]:
binom.sf(4, n, p)

4. **¿Cuál es la probabilidad de que entre 2 y 4 clientes (excluyendo los extremos) presenten un reclamo?**  
   $$
   P(2 < X < 4) = P(X = 3) = \text{binom.pmf}(3, 6, 0.1)
   $$
   *(Si quieres incluir ambos extremos: $P(2 \leq X \leq 4) = \text{binom.cdf}(4, 6, 0.1) - \text{binom.cdf}(1, 6, 0.1)$)*


In [None]:
binom.pmf(3, n, p)

In [None]:
binom.cdf(4, n, p) - binom.cdf(1, n, p)

#### 💾🏭 Ejemplo 2:

---

En una línea de producción de chips de memoria, la probabilidad de que un chip individual sea defectuoso es de 0.02 (2%). Se toma una muestra aleatoria de 100 chips producidos en un día.

Sea $(X)$ la variable aleatoria que representa el número de chips defectuosos en la muestra. Asumimos que la producción de cada chip es independiente de los demás.

In [None]:
get_pmf_binomial(100, 0.02,False)

Calcula las siguientes probabilidades:

* Exactamente 3 chips son defectuosos.

In [None]:
#Exactamente 3 chips son defectuosos
binom.pmf(3, 100, 0.02)

* Menos de 2 chips son defectuosos (cola izquierda).
.

In [None]:
#Menos de 2 chips son defectuosos
binom.cdf(1, 100, 0.02)

* Más de 5 chips son defectuosos (cola derecha).


In [None]:
#Más de 5 chips son defectuosos
binom.sf(5, 100, 0.02)

* Entre 2 y 4 chips (inclusive) son defectuosos.


In [None]:
# Entre 2 y 4 chips
binom.cdf(4, 100, 0.02) - binom.cdf(1, 100, 0.02)

In [None]:
binom.pmf(2, 100, 0.02) + binom.pmf(3, 100, 0.02) + binom.pmf(4, 100, 0.02)

* Al menos 1 chip es defectuoso

In [None]:
# Al menos 1 chip es defectuoso
binom.sf(0, 100, 0.02)

La **distribución binomial** es un modelo fundamental para variables *aleatorias discretas*, ya que describe el número de éxitos en una cantidad fija de ensayos independientes con igual probabilidad de éxito. Sin embargo, cuando el número de ensayos $n$ es grande y la probabilidad de éxito $p$ no es demasiado cercana a 0 ni a 1, la distribución binomial puede aproximarse a otra distribución para valores continuos

In [None]:
get_pmf_binomial(20, 0.5,labels=False)

###  Distribución normal
---

Es continua, simétrica y en forma de campana. Se define por su media $\mu$ y desviación estándar $\sigma$.

![](https://practicum-content.s3.amazonaws.com/resources/S01_18_4_1691759849.png)


#### 📏 Regla empírica:
- 68% de los datos están dentro de 1 $\sigma$
- 95% dentro de 2 $\sigma$
- 99.7% dentro de 3 $\sigma$


>El puntaje Z (o valor Z) nos dice cuántas desviaciones estándar está un dato por encima o por debajo del promedio.
>Es como una regla para saber qué tan lejos está un valor de lo normal.

$$ Z= \frac{x-\mu}{\sigma} $$


$$
P(Z < z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz
$$

#### Usandp scipy

```python
from scipy.stats import norm
```

| Método | Descripción |
|--------|-------------|
| `norm.pdf(x, mu, sigma)` | Densidad en el valor $x$ |
| `norm.cdf(x, mu, sigma)` | Probabilidad acumulada hasta $x$ $P(X < x)$|
| `norm.sf(x, mu, sigma)` | Probabilidad de que sea mayor a $x$ $P(X > x)$ |
| `norm.ppf(q, mu, sigma)` | Valor de $x$ tal que $P(X \leq x) = q$ |


##### 🎯 Ejemplo:
---


La estatura de los estudiantes de una clase se distribuye normalmente con media $\mu = 170$ cm y desviación estándar $\sigma = 10$ cm.

**a) ¿Cuál es la probabilidad de que un estudiante mida menos de 180 cm?**

1. Calculamos el puntaje Z:  
   $$
   z = \frac{180 - 170}{10} = 1
   $$

2. Buscamos $P(Z < 1)$ en la tabla Z:  
   $$
   P(Z < 1) \approx 0.8413
   $$

**Respuesta:** Aproximadamente el 84.13% de los estudiantes miden menos de 180 cm.

---

In [None]:
# Parámetros
mu = 170
sigma = 10

In [None]:

x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)
y = norm.pdf(x, mu, sigma)

# Gráfico a)
plt.figure(figsize=(8, 4))
plt.plot(x, y, color='orange')
plt.fill_between(x, y, where=(x <= 180), color='skyblue', alpha=0.6)
plt.axvline(180, color='blue', linestyle='--')
plt.title('a) P(X < 180 cm)')
plt.xlabel('Estatura (cm)')
plt.ylabel('Densidad')
plt.grid(True)
plt.show()

**b) ¿Cuál es la probabilidad de que un estudiante mida más de 185 cm?**

1. Calculamos el puntaje Z:

$$
z = \frac{185 - 170}{10} = 1.5
$$

2. Buscamos $P(Z > 1.5)$:

$$
P(Z > 1.5) = 1 - P(Z < 1.5) = 1 - 0.9332 = 0.0668
$$

**Respuesta:** Aproximadamente el **6.68%** de los estudiantes miden más de 185 cm.

---

In [None]:
# Parámetros
x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)
y = norm.pdf(x, mu, sigma)

# Gráfico b)
plt.figure(figsize=(8, 4))
plt.plot(x, y, color='orange')
plt.fill_between(x, y, where=(x >= 185), color='lightcoral', alpha=0.6)
plt.axvline(185, color='red', linestyle='--')
plt.title('b) P(X > 185 cm)')
plt.xlabel('Estatura (cm)')
plt.ylabel('Densidad')
plt.grid(True)
plt.show()

In [None]:
# probabilidad de que un estudiante mida más de 185 cm
norm.sf(185, 170, 10)

**c) ¿Cuál es la probabilidad de que un estudiante mida entre 160 cm y 180 cm**?

1. Calculamos ambos puntajes Z:

$$
z_1 = \frac{160 - 170}{10} = -1, \quad z_2 = \frac{180 - 170}{10} = 1
$$

2. Buscamos $P(-1 < Z < 1)$:

$$
P(-1 < Z < 1) = P(Z < 1) - P(Z < -1) = 0.8413 - 0.1587 = 0.6826
$$

**Respuesta:** Aproximadamente el **68.26%** de los estudiantes miden entre 160 cm y 180 cm.

In [None]:
x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)
y = norm.pdf(x, mu, sigma)

# Gráfico c)
plt.figure(figsize=(8, 4))
plt.plot(x, y, color='orange')
plt.fill_between(x, y, where=(x >= 160) & (x <= 180), color='mediumseagreen', alpha=0.6)
plt.axvline(160, color='green', linestyle='--')
plt.axvline(180, color='green', linestyle='--')
plt.title('P(160 cm < X < 180 cm)')
plt.xlabel('Estatura (cm)')
plt.ylabel('Densidad')
plt.grid(True)
plt.show()

## En resumen: 

1. **La probabilidad permite cuantificar la incertidumbre y el riesgo**  
   Se utilizan conceptos como la probabilidad clásica, la frecuencia relativa y los modelos probabilísticos para predecir la ocurrencia de eventos en situaciones de incertidumbre.

2. **Existen diferentes tipos de eventos y reglas para calcular probabilidades**  
   Se diferencia entre eventos independientes y dependientes, y se aplican reglas como la multiplicación de probabilidades para eventos independientes.

3. **Las distribuciones de probabilidad modelan fenómenos aleatorios**  
   Se estudian las distribuciones binomial (para variables discretas) y normal (para variables continuas), explicando cuándo y cómo se utilizan para describir el comportamiento de variables aleatorias.

4. **La resolución de problemas prácticos se apoya en fórmulas y herramientas estadísticas**  
   Se resuelven ejercicios aplicando fórmulas matemáticas y funciones de Python (`scipy.stats`), interpretando los resultados y visualizando las distribuciones.

5. **La distribución normal es fundamental en estadística**  
   Se destaca su forma de campana, la importancia del puntaje Z y la regla empírica (68-95-99.7%), mostrando cómo calcular probabilidades para intervalos y valores específicos.