# Probabilidad 2 | Grupo 9043
### Distribución multinomial
#### Por: Jorge Iván Reyes Hernández
15-03-2022

Un grupo de adultos que quieren obtener su primer permiso para conducir contiene un $50 \%$ de conductores de bajo riesgo, un $30 \%$ de conductores de riesgo moderado y un $20 \%$ de conductores de alto riesgo.
Como estos conductores no tienen antecedentes, la compañía decide atenderlos de manera aleatoria. Este mes, la companía de seguros recibe a cuatro conductores (seleccionados al azar) que buscan obtener su primer permiso para conducir. 
Calcula la probabilidad de que este grupo de 4 conductores contenga al menos dos conductores de alto riesgo más que los de bajo riesgo.

1. 0.006
2. 0.012
3. 0.018
4. 0.049
5. 0.073

__Solución__

El problema nos habla de un grupo de conductores entre los cuales hay conductores de 3 tipos: de bajo riesgo, de riesgo moderado y de alto riesgo. Entonces es natural modelar el problema con una distribución multinomial.

Sean $X, Y, Z$ el número de conductores de bajo riesgo, de riesgo moderado y de alto riesgo en el grupo seleccionado, respectivamente.

Notemos que $X, Y$ y $Z$ son variables aleatorias, pues no sabemos cuántos condutores de cada tipo habrá en el grupo de 4 conductores seleccionado.

Como el grupo seleccionado es de 4 conductores, los posibles valores para $X, Y$ y  $Z$ (es decir, sus soportes) son:

- $sop(X) = \{0,1,2,3,4\}$
- $sop(Y) = \{0,1,2,3,4\}$
- $sop(Z) = \{0,1,2,3,4\}$

In [7]:
# Importamos las librerias a usar

import numpy as np
import scipy.stats as stats
from itertools import product


In [5]:
# Definimos los soportes

sop_x = np.arange(0, 5)
sop_y = np.arange(0, 5)
sop_z = np.arange(0, 5)


array([0, 1, 2, 3, 4])

Por ejemplo, si de los 4 conductores seleccionados hay 2 de bajo riesgo, $X=2$, y dos de riesgo moderado, $Y = 2$, entonces debe haber 0 de alto riesgo, $Z=0$.

Es decir, se debe cumplir que $X+Y+Z=4$.

Como ya se mencionó, el modelo apropiado para este problema es multinomial con $n = 4$:
$$
    f_{X,Y,Z} (x,y,z) = \mathbb{P}(X=x, Y=y, Z=z) = \frac{n!}{x!y!z!} p_1^x p_2^y p_3^z
$$
Además conocemos quiénes son $p_1, p_2 \text{ y } p_3$, pues por hipótesis sabemos que de entre todos los conductores interesados en sacar su primer permiso para conducir, el $50\%$ es de bajo riesgo, el $30\%$ es de riesgo moderado y el $20\%$ es de alto riesgo, es decir:
- $p_1 = 0.5$
- $p_2 = 0.3$
- $p_3 = 0.2$


In [6]:
# Definimos las p_i's
p_1 = 0.5
p_2 = 0.3
p_3 = 0.2

Por otro lado, nos interesa calcular la probabilidad de que en el grupo de 4 personas haya al menos dos conductores de alto riesgo más que los de bajo riesgo, es decir, nos interesa
$$
\mathbb{P}(Z\geq X+2)
$$

In [18]:
# Calculamos la probabilidad
prob = 0
for (x,y,z) in product(sop_x, sop_y, sop_z):
    if z >= x + 2 and x + y + z == 4:
            prob += stats.multinomial.pmf((x,y,z), n=4, p=(p_1, p_2, p_3))
        
print(prob)


0.04879999999999997


__Segunda forma de calcular el soporte__

In [2]:
# Definimos soporte de f, no de X, Y y Z

sop_f = [(x,y,z) for (x,y,z) in product(sop_x, sop_y, sop_z) if x + y + z == 4]


In [None]:
# Calculamos la probabildad

prob = 0
for (x,y,z) in sop_f:
    if z >= x + 2:
        prob += stats.multinomial.pmf((x,y,z), n=4, p=(p_1, p_2, p_3))

print(prob)
