# **distribuciones**

**_Autor:_** Isaac Mesa Gómez

**_Clase:_** Probabilidad y Colas

**_Fecha:_** Septiembre 29, 2024

---

Código utilizado en la clase Probabilidad y Colas para el día Septiembre 29, 2024

<strong style='color:#ec5252;'><em>Nota:</em></strong> Las densidades de probabilidad se acumulan por la izquierda $$P(X>k) = 1 - P(X<k)$$ $$P(K_1 < X < K_2) = P(K_2) - P(K_1)$$

<strong style='color:#ec5252;'><em>Nota 2:</em></strong> CUando se hablen de __distribución de probabilidad__ pensar en tablas con los valores 

### ☁️ Distribución Binomial

- Función de densidad (masa de probabilidad): `dbinom(x, size, prob)`
- Función de distribución acumulada: `pbinom(q, size, prob)`
- Función cuantil: `qbinom(p, size, prob)`
- Generación de números aleatorios: `rbinom(n, size, prob)`

Para identificar si un problema tiene una distribución binomial, es necesario verificar si cumple con las siguientes características:

__1.__ __Número fijo de ensayos__: El experimento se realiza un número determinado de veces, __n__, que es constante.

__2.__ __Dos resultados posibles__: Cada ensayo tiene solo dos resultados posibles, que generalmente se etiquetan como éxito o fracaso.

__3.__ __Probabilidad constante__: La probabilidad de éxito, __p__, es la misma en cada ensayo, al igual que la probabilidad de fracaso, __q=1−p__.

__4.__ __Ensayos independientes__: Los resultados de un ensayo no afectan a los resultados de los otros ensayos; es decir, los ensayos son independientes entre sí.

La función de probabilidad es: $$P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}$$

donde: 

- $P(X = k):$ Probabilidad de obtener exactamente  k éxitos en  n ensayos.
- $\binom{n}{k}:$ Coeficiente binomial, calculado como  \frac{n!}{k!(n-k)!}, que representa el número de formas de elegir  k éxitos en  n ensayos.
- $n$: Número total de ensayos o repeticiones del experimento.
- $k$: Número de éxitos deseados en los  n ensayos.
- $p$: Probabilidad de éxito en un solo ensayo.
- $(1 - p)$: Probabilidad de fracaso en un solo ensayo.

<strong style='color:#ec5252;'><em>Nota:</em></strong> Media y varianza: $$\mu = n p \\ \sigma^2 = n p (1 - p)$$

### ☁️ Distribución de Poisson

- Función de densidad (masa de probabilidad): `dpois(x, lambda)`
- Función de distribución acumulada: `ppois(q, lambda)`
- Función cuantil: `qpois(p, lambda)`
- Generación de números aleatorios: `rpois(n, lambda)`

<strong style='color:#ec5252;'><em>Nota:</em></strong> Poner cuidado con el $\lambda$, en `R` escribir $ \lambda = \lambda * t$

<strong style='color:#ec5252;'><em>Nota 2:</em></strong> Cuando se hablan de Poisson, siempre acumular por izquierda 

Un problema tiene una distribución de Poisson si cumple con las siguientes características clave:

__1.__ __Número de eventos en un intervalo__: La distribución de Poisson modela el número de veces que ocurre un evento en un intervalo de tiempo, espacio o cualquier otra dimensión continua. El intervalo puede ser tiempo, distancia, área, etc.

__2.__ __Eventos independientes__: Los eventos deben ser independientes entre sí; es decir, la ocurrencia de un evento no afecta la ocurrencia de otros eventos.

__3.__ __Tasa de ocurrencia constante__: La tasa a la que ocurren los eventos es constante en el intervalo considerado. Esta tasa se denota como λ (media de eventos por unidad de tiempo, espacio, etc.).

__4.__ __Eventos raros__: La probabilidad de que dos o más eventos ocurran simultáneamente es muy pequeña o despreciable.

La función de probabilidad es: $$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}$$

Y donde: 

$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}$

- $P(X = k)$: Probabilidad de observar exactamente $k$ eventos en un intervalo.
- $\lambda$: Tasa media de ocurrencia de eventos por unidad de tiempo, espacio, u otra dimensión.
- $k$: Número de eventos observados en el intervalo.
- $e$: Constante de Euler, aproximadamente $2.71828$.
- $k!$: Factorial de $k$, es decir, el producto de todos los enteros positivos desde 1 hasta $k$.

<strong style='color:#ec5252;'><em>Nota:</em></strong> Media y varianza: $$\mu = \lambda \\
\sigma^2 = \lambda$$

### ☁️ Distribución Hipergeométrica

- Función de densidad (masa de probabilidad): `dhyper(x, m, n, k)`
- Función de distribución acumulada: `phyper(q, m, n, k)`
- Función cuantil: `qhyper(p, m, n, k)`
- Generación de números aleatorios: `rhyper(nn, m, n, k)`

Un problema tiene una distribución hipergeométrica si cumple con las siguientes características:

__1.__ __Población finita__: El problema involucra una población finita de tamaño $N$, en la cual hay dos tipos de elementos: éxitos y fracasos.

__2.__ __Número fijo de éxitos en la población__: Hay un número fijo $K$ de elementos que son considerados "éxitos" en la población, mientras que los restantes $N−K$ son "fracasos".

__3.__ __Muestreo sin reemplazo__: Se selecciona una muestra de tamaño n de la población sin reemplazar los elementos, lo que significa que cada elemento seleccionado afecta las probabilidades futuras.

__4.__ __Éxitos en la muestra__: El problema se centra en encontrar la probabilidad de obtener exactamente $k$ éxitos en la muestra de tamaño $n$.


La función de probabilidad es: $$P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}$$

- $P(X = k)$: Probabilidad de obtener exactamente $k$ éxitos en una muestra de tamaño $n$.
- $\binom{K}{k}$: Número de formas de elegir $k$ éxitos de una población de $K$ elementos exitosos.
- $\binom{N - K}{n - k}$: Número de formas de elegir $n - k$ fracasos de los $N - K$ elementos fracasados.
- $\binom{N}{n}$: Número total de formas de elegir $n$ elementos de una población de tamaño $N$.
- $N$: Tamaño total de la población.
- $K$: Número total de elementos exitosos en la población.
- $n$: Tamaño de la muestra.
- $k$: Número de éxitos en la muestra.

<strong style='color:#ec5252;'><em>Nota:</em></strong> Media y varianza: $$\mu = \frac{n K}{N} \\
\sigma^2 = \frac{n K (N - K) (N - n)}{N^2 (N - 1)}$$

### ☁️ Distribución Normal (Y estandar):

- Función de densidad: `dnorm(x, mean, sd)`
- Función de distribución acumulada: `pnorm(q, mean, sd)`
- Función cuantil: `qnorm(p, mean, sd)`
- Generación de números aleatorios: `rnorm(n, mean, sd)`

<strong style='color:#ec5252;'><em>Nota:</em></strong>  La Distribución Normal Estándar es un caso especial de la distribución normal con media = 0 y desviación estándar = 1

La función de probabilidad es: $$f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{1}{2} \left( \frac{x - \mu}{\sigma} \right)^2}$$

- $f(x)$: Función de densidad de probabilidad para el valor $x$.
- $\mu$: Media de la distribución (centro de la curva).
- $\sigma$: Desviación estándar de la distribución (controla el ancho de la curva).
- $e$: Constante de Euler, aproximadamente $2.71828$.
- $\pi$: Constante pi, aproximadamente $3.14159$.

### ☁️ Distribución Exponencial:

- Función de densidad: `dexp(x, rate)`
- Función de distribución acumulada: `pexp(q, rate)`
- Función cuantil: `qexp(p, rate)`
- Generación de números aleatorios: `rexp(n, rate)`

Función de probabilidad: $$f(t) = \lambda e^{-\lambda t}, \quad t \geq 0$$

- $f(t)$: Función de densidad de probabilidad para el tiempo $t$.
- $\lambda$: Tasa de ocurrencia de eventos por unidad de tiempo, donde $\lambda > 0$.
- $e$: Constante de Euler, aproximadamente $2.71828$.

La probabilidad de que no ocurra un evento en un intervalo de tiempo: $$P(T > t) = e^{-\lambda t}$$

- $P(T > t)$: Probabilidad de que el evento no ocurra en el intervalo de tiempo $t$.
- $T$: Variable aleatoria que representa el tiempo hasta que ocurre el evento.

<strong style='color:#ec5252;'><em>Nota:</em></strong> Media y varianza: $$\mu = \frac{1}{\lambda} \\
\sigma^2 = \frac{1}{\lambda^2}$$

### ☁️ Distribución Uniforme

- Función de densidad: `dunif(x, min, max)`
- Función de distribución acumulada: `punif(q, min, max)`
- Función cuantil: `qunif(p, min, max)`
- Generación de números aleatorios: `runif(n, min, max)`


$$f(x) = \begin{cases} 
\frac{1}{b - a} & \text{si } a \leq x \leq b \\
0 & \text{en otro caso}
\end{cases}$$

- $f(x)$: Función de densidad de probabilidad para el valor $x$.
- $a$: Límite inferior de la distribución (mínimo).
- $b$: Límite superior de la distribución (máximo).
- $b - a$: Ancho del intervalo sobre el cual la variable aleatoria es uniforme.

$P(X \leq x) = \frac{x - a}{b - a}$, para $a \leq x \leq b$

- $P(X \leq x)$: Probabilidad de que la variable aleatoria $X$ tome un valor menor o igual a $x$.

<strong style='color:#ec5252;'><em>Nota:</em></strong> Media y varianza: $$\mu = \frac{a + b}{2} \\
\sigma^2 = \frac{(b - a)^2}{12}$$

### ☁️ <strong style='color:#ec5252;'><em>Aproximaciones de Distribuciones:</em></strong>

### Aproximación Binom por medio de una Poisson

La aproximación de una distribución binomial a una distribución de Poisson es una técnica útil en estadística cuando se cumplen ciertas condiciones.

Condiciones para la aproximación:

1. El número de ensayos (_n_) es grande, generalmente _n_ > 20.
2. La probabilidad de éxito (_p_) en cada ensayo es pequeña, típicamente _p_ < 0.05.
3. El producto _np_ (que es la media de la distribución binomial) es moderado, usualmente _np_ < 10.

<strong style='color:#ec5252;'><em>Nota:</em></strong> En esta asociación hay que tener presente que $ \lambda = np$ ya que se asocia el promedio más directamente