# Distribución de Bernoulli

- Supongamos una variable aleatoria $\mathcal X$ que tiene dos valores posibles: 1 y 0. 
- Supongamos que la probabilidad de que la variable aleatoria $\mathcal X$ tiene una probabilidad p de tomar el  valor 1 y una probabilidad q=1-p de tomar el valor 0.
- Se dice entonces que la variable aleatoria $\mathcal X$ tiene distribución de Bernoulli con parámetro p: 

$$ \mathcal X \sim Be(p) $$

- Podemos estimar el valor de p repitiendo un número grande n de veces el experimento:

$$ \hat{p} = \lim_{n\to\infty} \frac{\#1}{n} $$

donde #1 es la cantidad de veces que la variable aleatoria tomó el valor '1' durante los n experimentos.

## Ejemplo:

"Lanzar una moneda, probabilidad de conseguir que salga cruz".

Se trata de un solo experimento, con dos resultados posibles: el éxito (p) se considerará sacar cruz. Valdrá 0,5. El fracaso (q) que saliera cara, que vale (1 - p) = 1 - 0,5 = 0,5.

La variable aleatoria X medirá "número de cruces que salen en un lanzamiento", y sólo existirán dos resultados posibles: 0 (ninguna cruz, es decir, salir cara) y 1 (una cruz).

Por tanto, la v.a. X se distribuirá como una Bernoulli, ya que cumple todos los requisitos.

$$X \sim Be(0,5)$$

$$P(X = 0) = 0,5$$

$$P(X = 1) = 0,5$$


## Ejemplo:

"Lanzar un dado y salir un 6".

Cuando lanzamos un dado tenemos 6 posibles resultados:

$$\Omega = \{1, 2, 3, 4, 5, 6\}$$

Estamos realizando un único experimento (lanzar el dado una sola vez).

Se considera éxito sacar un 6, por tanto, la probabilidad será 1/6.

$$p = 1/6$$

Se considera éxito sacar un 6, por tanto, se considera fracaso sacar cualquier otro resultado.

$$q = 1 - p = 1- 1/6 = 5/6$$

La variable aleatoria X medirá "número de veces que sale un 6", y solo existen dos valores posibles, 0 (que no salga 6) y 1 (que salga un 6).

Por tanto, la variable aleatoria X se distribuye como una Bernoulli de parámetro $p = \frac{1}{6} $

$$X \sim Be(1/6)$$

# Distribución binomial

Si definimos ahora la variable aleatoria $\mathcal X $ como la suma de n variables aleatorias $X_i \sim Be(p)$ independientes e idénticamente distribuídas, decimos que $\mathcal X$ tiene distribución binomial de parámetros n y p:

$$\mathcal X \sim B(n,p)$$

donde:

$$\mathcal X = \sum_n{\mathcal X_i}$$

Como los valores posibles de $\mathcal X_i$ son 1 (éxito) y 0 (fracaso) entonces $\mathcal X$ será la cantidad de éxitos luego de reproducir el experimento n veces.

La probabilidad de obtener una salida específica en particular con #éxitos y #fracasos:

$$P(\#éxitos, \#fracasos)=p^{(\#éxitos)}.q^{(\#fracasos)}=p^{(\#éxitos)}.(1-p)^{(n-\#éxitos)}$$

Por lo que su función de probabilidad se podrá obtener contando el número de casos para cada número de éxitos:

$$\!f(x)={n \choose x}p^x(1-p)^{n-x}, \,\,\,\,0\leq p\leq 1$$

donde $x = \{0, 1, 2, \dots , n\},$

siendo $\!{n \choose x} = \frac{n!}{x!(n-x)!} \,\!$ las combinaciones de $n \,\!$ en $x \,\!$ ($n \,\!$ elementos tomados de $x \,\!$ en $x \,\!$)

## Ejemplo

Supongamos que se lanza un dado (con 6 caras) 51 veces y queremos conocer la probabilidad de que el número 3 salga 20 veces. En este caso tenemos una X ~ B(51, 1/6) y la probabilidad sería P(X=20):

$$\!P(X=20)={51 \choose 20}(1/6)^{20}(1-1/6)^{51-20}=0.0000744 \,\!$$


# Distribución categórica

La distribución categórica es una generalización de la distribución de Bernoulli. La misma aplica cuando tenemos un solo experimento con k posibles resultados o categorías ($x_1,x_2,...,x_k$) con probabilidades:

$p_1,p_2,...,p_k$ de forma que $\sum_{i=1}^{k}p_i=1$.

Para estimar los parámetros $p_i$ de una distribución categórica se puede realizar el experimento n veces y a partir de ello calcular las $p_i$ como:

$$\hat{p_i}=\lim_{n\to\infty} \frac{\#categoría_i}{n}$$

donde $\#categoría_i$ es la cantidad de veces que salió la categoría i como resultado del experimento.

## Ejemplos:

- Dado: 6 categorías con probabilidad $\frac{1}{6}$.
- Abrir un libro en una página al azar y escoger también al azar una palabra. En este caso la cantidad de categorías es la cantidad de palabras definida en un vocabulario de referencia.

# Distribución Multinomial

La distribución multinomial es equivalente a la distribución binomial pero en vez de cada uno de los experimentos tener dos salidas posibles, ahora tiene k categorías posibles como resultado.


La probabilidad de haber obtenido un resultado en particular luego de haber corrido el experimento categórico N veces es:

$$P=p_1^{x_1}\cdots p_k^{x_k}$$

Si contamos cuántas veces podemos tener cada uno de los resultados, la función de probabilidad de la distribución multinomial es como sigue:

$$ \begin{align}
f(x_1,\ldots,x_k;n,p_1,\ldots,p_k) & {} = \Pr(X_1 = x_1\mbox{ y }\dots\mbox{ y }X_k = x_k) \\  \\
& {} = \begin{cases} { \displaystyle {n! \over x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}}, \quad &
\mbox{cuando } \sum_{i=1}^k x_i=n \\  \\
0 & \mbox{En otros casos} \end{cases}
\end{align}
$$

Para enteros no negativos x<sub>1</sub>, ..., x<sub>k</sub>.