# Probabilidad

En este Notebook revisaremos algunos conceptos básicos de Probabilidad. Para ello utilizaremos la librería random principalmente.

In [None]:
import random
from tqdm import tqdm
import numpy as np

In [None]:
r = random.random()
print(r)

0.6394267984578837


Juguemos al dado.

In [None]:
random.randint(1,6)

1

¿Cuál es la probabilidad de que $x = 1$ en un dado?

In [None]:
I = []

for _ in tqdm(range(10000000)):
   x = random.randint(1,6)
   if x == 1:
      I.append(1)
   else:
      I.append(0)

I = np.array(I)

print(np.mean(I))

100%|██████████| 10000000/10000000 [00:08<00:00, 1131416.75it/s]


0.1664879


In [None]:
1/6

0.16666666666666666



Probabilidad de que sea par y sea menor a 5.

In [None]:
I = []

for _ in range(1000000):
   x = random.randint(1,6)
   if x % 2 == 0 and x < 5:
      I.append(1)
   else:
      I.append(0)

I = np.array(I)

print(np.mean(I))

0.333448


**Unión de probabilidades**

$$\Pr(A\cup B) = \Pr(A) + \Pr(B) - \Pr(A \cap B)$$

Calculemos la probabilidad de que sea 1 o sea 5.

In [None]:
I = []

for _ in range(1000000):
   x = random.randint(1,6)
   if x == 1 or x == 5:
      I.append(1)
   else:
      I.append(0)

I = np.array(I)

print(np.mean(I))

0.333815


**Probabilidad condicional**

$$ \Pr(A | B) = \frac{\Pr(A \cap B)}{\Pr(B)}$$

$$\Pr(A \cap B) =  \Pr(A | B)\Pr(B)$$


Independencia: $\Pr(A | B) = \Pr(A)$

**Teorema de Bayes**

$$ \Pr(A | B) = \frac{\Pr(B | A) \Pr(A)}{\Pr(B)}$$

¿Cuál es la probabilidad de que $x = 1$ dado que $x = 2$?

In [None]:
I = []

for _ in range(1000000):
   x = random.randint(1,6)
   if x == 2:
      if x == 1:
          I.append(1)
      else:
          I.append(0)
   # NO USAR :else:
   #   I.append(0)

I = np.array(I)

print(np.mean(I))

0.0


¿Cuál es la probabilidad de que $x_{n} = 1$ dado que $x_{n-1} = 2$?



In [None]:
I = []

xp = random.randint(1,6)

for _ in range(1000000):
   x = random.randint(1,6)
   if xp == 2:
      if x == 1:
          I.append(1)
      else:
          I.append(0)
   xp = x

I = np.array(I)

print(np.mean(I))

0.16802956108991499


In [None]:
I = []
I2 = []
I3 = []

xp = random.randint(1,6)

for _ in range(1000000):
   x = random.randint(1,6)
   if x == 1:
      I3.append(1)
      if xp == 2:
          I.append(1)
      else:
          I.append(0)
   else:
      I3.append(0)

   if xp == 2:
      I2.append(1)
   else:
      I2.append(0)


   xp = x

I = np.array(I)
I2 = np.array(I2)
I3 = np.array(I3)

print((np.mean(I)* np.mean(I3) ) / np.mean(I2))

0.16678393803260744


*Matriz de confusión*

|P|N|
|----------|----------|
| tp   | fn  |
| fp   | tn  |

tp: verdaderos positivos
tn: verdaderos negativos
fn: falsos negativos
fp: falsos positivos


Supongamos que nuestro detector de spam tiene la siguiente matriz de confusión:


| P | N |
|----------|----------|
| 940   | 90   |
| 60    | 10  |


¿Cuál es la probabilidad de que dado que un correo se detecta como spam en realidad lo es?

