In [None]:
import random

## 1.1 Conceptos básicos

¿Qué es la probabilidad?

Es el área de las matemáticas que estudia o describe métodos para inferir la frecuencia con la que suceden efectos

Permite cuantificar la incertidumbre en las decisiones o en los fenómenos

Por ejemplo,

* La probabilidad de que el día de mañana llueva
* La probabilidad de que una acción suba o baje
* La probabilidad de éxito de un tratamiento


Experimento

Es un fenómeno del cuál conocemos sus resultados posibles, pero no podemos saber cuál de ellos va a ocurrir.

Por ejemplo:

* ¿Hay o no hay un sismo en la CDMX?
* Degustación de café a 50 personas. Los resultados posibles serían, por ejemplo, el número de personas a las que les gusta el café
* El precio del dólar el día de mañana

Al conjunto de resultados posibles de un experimento le llamamos **espacio muestral**

Un **evento** es un subconjunto de resultados dentro del espacio muestral

Por ejemplo,

* Supongamos que estamos interesados en cuántas victorias tendrás Los Dodgers en la temporada de N partidos. El espacio muestral es el conjunto de resultados posibles, es decir, {0, 1, 2, ..., N}. Un evento, dentro del espacio muestral es que tengan más de 50 victorias {51, 52, ..., N}

* El número de clientes dentro de una tienda en una semana. El espacio muestral es el conjunto de todos los números naturales. Un evento puede ser el que el número de clientes sea menor al de la semana pasada.

Los eventos pueden ser **mutuamente excluyentes**. Esto quiere decir que no pueden ocurrir al mismo tiempo.

Por ejemplo,

* Estamos preguntando a un grupo de personas su nacionalidad. El espacio muestral es el conjunto de todas las nacionalidades en el mundo. Consideremos dos eventos, A: El evento que Juan sea mexicano, B: el evento que Juan sea Canadiense. Es evidente que A y B no pueden ocurrir al mismo tiempo (no consideremos naturalizaciones). Al contrario, C: Carlos es mexicano, D: Daniel es español, C y D si pueden ocurrir al mismo tiempo.

## 1.2 Axiomas de probabilidad

1. La probabilidad de un evento siempre está entre 0 y 1.

2. La probabilidad del espacio muestral es 1, se le conoce como el evento seguro. Por otro lado, el evento imposible tiene probabilidad 0.

Ejemplo:

Si consideramos el experimento que consiste en cuantificar las ganancias durante un año de una empresa, el espacio muestral es el conjunto de los números reales.

Al hablar de la probabilidad del espacio muestral hablamos de la probabilidad de que la empresa tenga una ganancia (independientemente si es negativa o positiva), la cual es 1.

Otro ejemplo:

Consideremos que estamos midiendo la altura de una persona. El espacio muestral es el conjunto de los reales positivos. Entonces, la probabilidad de que la altura sea mayor o igual que 0, es 1. Ese es el evento seguro. El evento imposible es que la altura sea negativa, y eso ocurre con probabilidad 0.

3. Si consideramos una sucesión infinita de eventos mutuamente excluyentes, entonces la probabilidad de que al menos uno de esos eventos ocurra es igual a la suma de las probabilidades individuales.

Cuando trabajamos con eventos, podemos hablar de tres operaciones principales:

1. Union de eventos: Quiere decir, que al menos uno de los eventos ocurre.
Por ejemplo, si tengo dos eventos: A: el día de mañana llueve, B: el día de mañana está nublado. La unión ocurre si el día de mañana llueve o está nublado.

2. Intersección de eventos: Quiere decir que los dos eventos ocurren simultáneamente
Por ejemplo, considerando los eventos anteriores, la intersección ocurre si el día de mañana llueve y además está nublado.
Para los eventos mutuamente excluyentes, no existe la intersección, o se dice que es el conjunto vacío

3. El complemento. El complemento de un evento, son todos los resultados que no están dentro del evento pero sí en el espacio muestral.
Por ejemplo, en el evento A: el precio del dolar es menor a 18 pesos, el complemento será: el dólar es mayor o igual a 18 pesos.

## 1.3 Probabilidad clásica (frecuentista)

La probabilidad clásica nos dice que la probabilidad de un evento se calcula como:
  
$$P(A) = \frac{\text{número de resultados favorables}}{\text{número de resultados totales}}$$

A: El Real Madrid consigue más de 80 puntos en la siguiente temporada.

Una forma de calcular la probabilidad, es utilizando la historia. El número de resultados totales consiste en contar de todas las temporadas (bajo las mismas condiciones que la siguiente temporada). Los resultados favorables serán aquellas temporadas donde el Real Madrid consiguió más de 80 puntos.

Por ejemplo, si hay 50 temporadas, y en 37 de ellas el Real Madrid consiguió más de 80 puntos, entonces la probabilidad será:

$$P(A)=\frac{37}{50}$$


Cuál es la probabilidad de que un tramiento contra la caída del cabello tenga éxito.

Una forma de estimar la probabilidad es aplicar el tratamiento a 100 personas. Si de esas 100 personas, 60 tuvieron resultados exitosos, la probabilidad de éxito del tratamiento será de $0.6$

Para una mejor estimación de la probabilidad, el número de personas en la prueba debería ser muy grande.

In [None]:
## El tamaño de una muestra garantiza mayor precisión en las estimaciones

## Simulemos el lanzamiento de una moneda.
M = 50000
suma = 0
for i in range(0,M):
    suma = suma + random.randint(0,1)

p = suma/M
print('La probabilidad de cara es:',p)

La probabilidad de cara es: 0.49568


## 1.4 Probabilidad Condicional

Imaginen que están midiendo el número de ventas de un celular en la semana.

Supongan, que en las primeras 10 semanas del año, en cada semana se vendieron alrededor de 125 celulares. Pero saben que en Navidad las ventas se duplican.

Si calculan la probabilidad de que las ventas de una semana (cualquier semana) sean mayores a 150, seguramente la probabilidad rondaría entre 0.3

Pero imaginen que tienen un dato adicional, que la semana que quieren estudiar es una semana en la cual cae Navidad. ¿Cómo será la probabilidad? Seguramente rondaría en 0.7

La probabilidad condicional consiste en agregar información adicional al cálculo de nuestras probabilidades marginales.

Es importante, contar con la mayor cantidad de información cuando hacemos una estimación de probabilidades.

La fórmula para calcular probabilidad condicional es:

$$ P(A|B) = \frac{P(A\cap B)}{P(B)} = \frac{P(B|A)P(A)}{P(B)}$$

Se está realizando una prueba de COVID en una empresa pues hay un brote debido a una reunión que se celebro en navidad y a la que fue el 70% de la empresa. Se sabe que de la empresa, el 30% de las personas están enfermas y fueron a la reunión. Entonces, cuál es la probabilidad de que un empleado sea positivo si sabemos que asistió a la reunión
A: Está enfermo
B: Fue a la reunión

$$P(A|B) = \frac{P(A\cap B)}{P(B)} = \frac{0.3}{0.7} = \frac{3}{7}$$

Consideremos que en una empresa hay tres empleados, A trabajó un 60% del tiempo, B trabajó un 30% del tiempo y C trabajó un 10% del tiempo. Ustedes, como gerente, tratan de investigar quién cometió un robo dentro de la empresa. Si solo se guiaran por el tiempo en que trabajó cada empleado, sería fácil señalar al empleado A pues es más probable que el haya cometido el robo pues estuvo más tiempo dentro de la empresa.

Luego de investigaciones, el gerente se da cuenta que fue un error de inventario y por ello A menciona que es necesario revisar el desempeño de cada trabajador, A se equivocó en un 0.5 de las veces, B se equivoca en un 0.1 de las veces y C se equivoca en un 0.7 de las veces.

A: El empleado A fue el detonante del robo
M: El error fue de inventario

Al inicio, suponiamos que P(A) = 0.6, P(B) = 0.3, P(C) = 0.1
Con la información nueva, es necesario recalcular las probabilidades

* P(A|M) = P(M|A)P(A)/P(M)
* P(B|M) = P(M|B)P(B)/P(M)
* P(C|M) = P(M|C)P(C)/P(M)

Nos falta estimar la probabilidad de que el error sea de inventario, pero asumamos que en la compañía se tiene una probabilidad de errores de inventario de 0.05

* P(A|M) = (0.05)(0.6)/(0.05)
* P(B|M) = (0.01)(0.3)/(0.05)
* P(C|M) = (0.07)(0.1)/(0.05)

In [None]:
pa = (0.5)*(0.6)/(0.05)
pb = (0.1)*(0.3)/(0.05)
pc = (0.7)*(0.1)/(0.05)

In [None]:
print('La probabilidad de que A haya sido es:',pa)
print('La probabilidad de que B haya sido es:',pb)
print('La probabilidad de que C haya sido es:',pc)

La probabilidad de que A haya sido es: 5.999999999999999
La probabilidad de que B haya sido es: 0.6
La probabilidad de que C haya sido es: 1.3999999999999997


## 1.5 Teorema de Bayes

Sean $B_1, B_2, ..., B_n$ eventos mutuamente excluyentes y además su unión es igual al espacio muestral (es un partición) y sea A un evento que tiene probabilidad mayor a 0.

El teorema de Bayes establece lo siguiente:

$$P(B_k|A) = \frac{P(B_k)P(A|B_k)}{\sum{P(B_i)P(A|B_i)}}$$

Un ejemplo de una partición, es dividir a los alumnos en una escuela en "Reprobados" y "Aprobados"
Otro ejemplo de partición son las ventas de una tienda, B1 = Las ventas fueron mayores a la semana pasada, B2 = Las ventas fueron iguales a la semana pasada y B3 = Las ventas fueron menores a la semana pasada.

Ejemplo:

Consideremos que una prueba de sangre en un laboratorio es 95% precisa para detectar una enfermedad. Además, la prueba da un falso positivo del 1%. Si el 0.5% de la población tiene la enfermedad, cuál es la probabilidad que una persona que dio positivo tenga realmente la enfermedad.

* A: La persona tiene la enfermedad
* T: La persona dio positivo en la prueba

$$P(A|T) = \frac{P(T|A)P(A)}{P(T)} = \frac{P(T|A)P(A)}{P(T|A)P(A) + P(T|A^c)P(A^c)}$$
$$P(A|T) = \frac{(0.95)(0.005)}{(0.95)(0.005)+(0.01)(0.995)}$$
$$P(A|T) = 0.3231$$