# Ejemplos de cálculo de probabilidad

Para ganar más intuición sobre el uso de las probabilidades y sobre la manera en la que se calculan, veremos algunos ejemplos e ilustraremos cómo se pueden calcular por medio de Python

## Correlaciones de eventos

Vamos a considerar tres eventos aleatorios, como se muestran a continuación:

- $A$ = {El resultado de lanzar un dado es 4}
- $B$ = {El resultado de lanzar un dado es par}
- $C$ = {El resultado de lanzar un dado es impar}

Una cosa es preguntarnos sobre las probabilidades de cada uno de estos eventos sin tener que condicionar esto a la ocurrencia previa de otros eventos. Veamos la diferencia entre la probabilidad condicionada de alguno u otro evento y las probabilidades sin condicionar y ver qué conceptos surgen.

## Código Python para la lección

El flujo de trabajo de instancias que genera esta clase en Python es el siguiente:
1. La instancia recibe como parámetros de entrada una lista y una función de condición:
    - *Lista:* La lista que se recibe como parámetro de entrada será un vector que contenga todas las posibles ocurrencias
    - *Función:* Esta función contendrá una condición con la que definirá cada ocurrencia como exitosa o no exitosa.

2. Para fines de consulta futuros, se almacena la condición para la instancia en un atributo de ésta, el cuál se llamará `condition`, igual que el parámetro de entrada.

3. Se asigna el vector de ocurrencias totales como un atributo del objeto, llamado `total_ocurr`. Este contendrá exactamente el mismo vector de entrada cuando se crea la instancia.

4. Se crea una *list comprehension* en la que se valida cada valor del atributo `total_ocurr` de la instancia por medio de la función `condition` recibida en la inicialización y sólo se toman los valores que cumplan con la condición. El resultado de esta lista se asigna al atributo `success_ocurr` de la instancia.

5. Se hace un cálculo de la probabilidad de sucesos exitosos `success_ocurr` sobre los sucesos totales `total_occur` basados en la condición `condition` provista en la inicialización. El resultado sera un número flotante entre 0 y 1 donde 0 es la imposibilidad de sucesos exitosos y 1 la totalidad de sucesos existosos. Este valor se asigna al atributo `prob` de la instancia.

6. En caso de que el vector de entrada o el vector de salida estén vacío, directamente se generará un vector vacío como sucesos exitosos y también se devolverá el resultado en 0 para el cálculo decimal de la probabilidad.

7. Para fines visuales, se formatea en texto la descripción de la cantidad de los sucesos marcados como exitosos sobre la cantidad de sucesos totales. Esto se asigna al atributo `prob_repr` de la instancia.

In [11]:
# Se define una clase en la que se genera una instancia llamada Probability
class Probability():

    # Inicialización para una nueva instancia tipo Probability
    def __init__(
        # Se recibe la lista de todas las posibles ocurrencias y la función de condición como parámetros
        self, total_ocurr: list, condition):

        # Se almacena la condición que define los sucesos como exitosos o no existosos
        self.condition = condition

        # Asignación del vector de sucesos totales a la instancia
        self.total_ocurr = total_ocurr

        # Validación de existencia de sucesos
        if len(self.total_ocurr):
            # Generación de vector de sucesos existosos
            self.success_ocurr = [i for i in self.total_ocurr if condition(i)]
        else:
            # Se genera el vector de sucesos exitosos como vacío por defecto en caso de no haber sucesos totales.
            self.success_ocurr = []

            # Validación de existencia de sucesos exitosos para evitar errores por división con 0
        if len(self.success_ocurr):
            # Cálculo decimal de la probabilidad basados en la condición provista
            self.prob = len(self.success_ocurr) / len(self.total_ocurr)
        else:
            # Cálculo decimal para evitar división en cero
            self.prob = 0.0

        # Formateo en texto para representación de la probabilidad en una división
        self.prob_repr = f"{len(self.success_ocurr)}/{len(self.total_ocurr)}"

Se declara el espacio muestral del dado

In [3]:
dice_sample_space = [1, 2, 3, 4, 5, 6]

Se declaran las funciones de condición para los ejemplos de $A$, $B$ y $C$ respectivamente

In [4]:
# Es 4
is_4 = lambda x: x == 4

# Es par
is_pair = lambda x: x % 2 == 0

# Es impar
not_pair = lambda x: x % 2 == 1

Se crean las 3 instancias de los casos de $A$, $B$ y $C$

In [5]:
# El resultado de lanzar un dado es 4
a = Probability(dice_sample_space, is_4)

# El resultado de lanzar un dado es par
b = Probability(dice_sample_space, is_pair)

# El resultado de lanzar un dado es impar
c = Probability(dice_sample_space, not_pair)

In [6]:
def show_stats(case: Probability, name: str):
    print(f"----Descripción del caso {name}----")
    print(f"El espacio muestral de {name} es de {len(case.total_ocurr)} ocurrencias")
    print(f"Los sucesos exitosos son: {case.success_ocurr}")
    print(f"La probabilidad calculada a dos decimales es de {case.prob:.2f}")
    print(f"La fracción de la probabilidad calculada es {case.prob_repr}\n\n")

Se procede a mostrar el resultado de los tres casos

In [7]:
show_stats(a, "A")
show_stats(b, "B")
show_stats(c, "C")

----Descripción del caso A----
El espacio muestral de A es de 6 ocurrencias
Los sucesos exitosos son: [4]
La probabilidad calculada a dos decimales es de 0.17
La fracción de la probabilidad calculada es 1/6


----Descripción del caso B----
El espacio muestral de B es de 6 ocurrencias
Los sucesos exitosos son: [2, 4, 6]
La probabilidad calculada a dos decimales es de 0.50
La fracción de la probabilidad calculada es 3/6


----Descripción del caso C----
El espacio muestral de C es de 6 ocurrencias
Los sucesos exitosos son: [1, 3, 5]
La probabilidad calculada a dos decimales es de 0.50
La fracción de la probabilidad calculada es 3/6




## Cálculo de probabilidades

Dados nuestros tres eventos, consideremos en primer lugar una probabilidad sencilla, es decir, ¿Cuál es la probabilidad de que suceda $A$ sin ninguna información adicional? Es fácil ver que, con un dado, las posibilidades son 6 mientras que 4 es el único suceso exitoso, es decir, tenemos una probabilidad de $\frac{1}{6}$.

$$P(A) = \frac{1}{6}$$

In [8]:
show_stats(a, "A")

----Descripción del caso A----
El espacio muestral de A es de 6 ocurrencias
Los sucesos exitosos son: [4]
La probabilidad calculada a dos decimales es de 0.17
La fracción de la probabilidad calculada es 1/6




Entendiendo esto, veamos que sucede si ahora nos preguntamos cuál es la probabilidad de que suceda $A$ sabiendo que ya ha sucedido B, es decir, que el resultado del dado sea 4 sabiendo que éste ya es un número par?

$$ P(A|B) = ? $$

Gramaticalmente estamos traduciendo que hemos lanzado el dado y sólo sabemos que el resultado es un número par y esa condición está reduciendo el espacio muestral así que el número de posibilidades ya no es 6 sino 3:

$$ \{2, 4, 6\} $$

In [9]:
# Asignamos como espacio muestral los sucesos exitosos de B que son números pares
#   y la condición que A tiene que validar en todos sus posibles sucesos
case1 = Probability(b.success_ocurr, a.condition)

# Impresión de resultados
show_stats(case1, "A dado B")

----Descripción del caso A dado B----
El espacio muestral de A dado B es de 3 ocurrencias
Los sucesos exitosos son: [4]
La probabilidad calculada a dos decimales es de 0.33
La fracción de la probabilidad calculada es 1/3




$$ P(A|B) = \frac{1}{3} $$

En el caso de $P(A|B)$, de estos 3 sucesos, sólo uno corresponde a 4. Signica que esta probabilidad condicional que da como resultado $\frac{1}{3}$ y que es mayor que $\frac{1}{6}$ en el caso de $A$ por sí solo, evidencía que el hecho de que $B$ haya ocurrido aumentó la probabilidad de que ocurra $A$ y entonces es cuando decimos que los eventos $A$ y $B$ están **positivamente correlacionados**. Este es el concepto de **correlación**. En este caso, la ocurrencia de un evento incrementa la probabilidad de ocurrencia del otro.

¿Qué sucede si por otro lado nos preguntamos sobre cuál es la probabilidad de suceda $A$ sabiendo que ha sucedido $C$?

$$ P(A|C) = ? $$

In [10]:
# Asignamos como espacio muestral los sucesos exitosos de C que son números impares
#   y la condición que A tiene que validar en todos sus posibles sucesos
case2 = Probability(c.success_ocurr, a.condition)

# Impresión de resultados
show_stats(case2, "A dado C")

----Descripción del caso A dado C----
El espacio muestral de A dado C es de 3 ocurrencias
Los sucesos exitosos son: []
La probabilidad calculada a dos decimales es de 0.00
La fracción de la probabilidad calculada es 0/3




Si ya sabemos que sucedió $C$, es decir, el resultado es impar a lo que corresponden las ocurrencias $\{1, 3, 5\}$ y la condición de $A$ es que el resultado sea 4, esto significa que 4 no está dentro de las ocurrencias de $C$ lo que nos indica que estos dos eventos son excluyentes. Por lo tanto, la condición de $C$ reduce el espacio muestral a 3 pero los eventos exitosos para $A$ son 0, dándonos una probabilidad de 0 en 3.

$$ P(A|C) = \frac{0}{3} $$

En este caso, lo que estamos observando es que la ocurrencia de C ha reducido dramáticamente la probabilidad de $A$ y entonces podemos decir que $A$ y $C$ están negativamente correlacionados.

Sin embargo, tenemos que considerar que, el hecho de que dos eventos sean excluyentes no significa que sean independientes. Todo lo contrario, son altamente dependientes. 

Con esta demostración, evidenciamos cuando dos eventos están positivamente correlacionados o negativamente correlacionados.