In [28]:
import numpy as np
import pandas as pd
import math

## Introducción a la teoría de probabilidad

- Las probabilidades son una medida del grado de incertidumbre asociado con cada uno de los eventos previamente enunciados.

- Los valores de probabilidad se encuentran en una escala de 0 a 1. 

- La **teoría de probabilidades** permite construir modelos matemáticos de los fenómenos. Estos **modelos** se clasifican en:
    - Determinísticos.
    - Probabilísticos.

## Modelos determinísticos.

Cuando se realiza el modelo matemático de un fenómeno y en este se pueden manejar los factores que intervienen en su estudio con el propósito de predecir sus resultados, se llamará modelo determinístico.

Ejemplo: Cuando tenemos una inversión $c$ a una tasa $r$, podemos calcular su **Valor Futuro**. 

El modelo es **determinístico**, puesto que tiene una inversión fija $c$ a una tasa fija $r$; por tanto, es posible predecir el resultado que ocurrirá al cabo de $n$ años mediante el uso de la siguiente fórmula:

$$ C_{n} = C_{0} \times (1 + r)^{n}$$

In [29]:
#Función de interes compuesto
def interes(capitalInicial,i,n):
    valorFinal = capitalInicial*(1+i)**n
    return valorFinal

#Valore de cálculo
capital = 120000
i= 0.08
n = 5
 #Implementación
print(interes(capital,i,n))

176319.36921600008


## Modelos probabilisticos.

En los modelos probabilisticos no es posible predecir sus resultados.

- En el lanzamiento de una moneda equilibrada 10 veces no podemos predecir el resultado que va a ocurrir en el siguiente lanzamiento.
- En una línea de producción, al realizar el control de calidad de los artículos se detecta cierta cantidad de productos defectuosos; no es posible determinar por anticipado si un artículo en particular será defectuoso (sólo su probabilidad).

## Experimentos.

Al reproducir cualquier fenómeno, ya sea de manera determinística o probabilística, estamos experimentando.

Llamaremos experimento aleatorio al proceso de obtención de una observación en que se cumple alguna de las siguientes condiciones: 
    a) Todos los resultados posibles son conocidos. 
    b) Antes de realizar el experimento el resultado es desconocido. 
    c) Es posible repetir el experimento en condiciones ideales.

## Espacio muestral:

El **espacio muestral** es el conjunto de todos los resultados posibles de un experimento, la colección de todos los posibles eventos. La forma en que se subdivide el espacio muestral depende del tipo de probabilidades que se va a determinar.

#### Ejemplos:

1) Arrojar una moneda: Cara, ceca (cruz)  
2) Arrojar un dado: 1, 2, 3, 4, 5, 6  
3) Sacar una carta de un mazo de poker: 

![poker](img/poker.jpg)

Hay varias formas alternativas de observar un espacio muestral:

- Clasificación cruzada de los eventos en una tabla llamada tabla de contingencias o tabla de probabilidad.
- Representación gráfica de los diversos eventos como uniones o intersecciones de círculos en un diagrama de Venn.

Una tabla de contingencia es aquella en la que las filas figuran todos los resultados posibles de una de las características de la variable y en columnas todos los resultados posibles de otra característica de la variable, y en cada celda figura los sucesos o eventos conjuntos.
La tabla de contingencias o probabilidades ofrece una representación clara del número de posibles resultados de la variable pertinente, en especial si hay dos o más sucesos o eventos que se consideran simultáneamente.

![tabla](img/tablaest.png)

Un **diagrama de Venn** es una segunda forma de presentar un espacio muestral. Es un diagrama asociado con la teoría de conjuntos de las matemáticas en el cual se describen los eventos que pueden ocurrir en una observación o experimento en particular. Una figura cerrada representa el espacio muestral, mientras que porciones del área, dentro del espacio representan eventos simples o compuestos particulares. En el diagrama se representan gráficamente los eventos como “uniones” o “intersecciones” de círculos.

![Venn](img/Venn.png)

## Reglas de conteo, combinaciones y permutaciones

Al asignar probabilidades es necesario saber identificar y contar los resultados experimentales.
A continuación tres reglas de conteo que son muy utilizadas.

### Experimentos de pasos múltiples

La primera regla de conteo sirve para experimentos de pasos múltiples. Considere un experimento que consiste en lanzar dos monedas. Defina los resultados experimentales en términos de las caras y cruces que se observan en las dos monedas. ¿Cuántos resultados experimentales tiene este experimento? El experimento de lanzar dos monedas es un experimento de dos pasos: el paso 1 es lanzar la primera moneda y el paso 2 es lanzar la segunda moneda. Si se emplea H para denotar cara y T para denotar cruz, (H, H) será el resultado experimental en el que se tiene cara en la primera moneda y cara en la segunda moneda. Si continúa con esta notación, el espacio muestral (S) en este experimento del lanzamiento de monedas será el siguiente:

![exp](img/resulexp.png)


Por tanto, hay cuatro resultados experimentales. En este caso es fácil enumerar todos los resultados experimentales. La regla de conteo para experimentos de pasos múltiples permite determinar el número de resultados experimentales sin tener que enumerarlos.
Si considera el experimento del lanzamiento de dos monedas como la sucesión de lanzar primero una moneda y después lanzar la otra, siguiendo la regla de conteo (2)(2) = 4, entonces hay cuatro resultados distintos. El número de resultados experimentales de seis monedas es (2)(2)(2)(2)(2)(2) = 64.

Si el experimento consistiera en arrojar una moneda (H, T) y un dado (1, 2, 3, 4, 5, 6), las posibilidades son (H, 1), (H, 2), ..., (H, 6), (T, 1), (T, 2), ..., (T, 6).

Es decir, hay dos opciones para la moneda y para cada una de estas dos opciones hay seis posibilidades para el dado.

De esta manera, las posibilidades son $2 \times 6 = 12$

En general, para una serie de $N$ pasos en los que cada paso tiene $m_{i}$ posibilidades, tenemos:


$$\prod_{i=1}^{N} x_{i} = x_{1} \times x_{2} \times ... \times x_{N}$$

In [30]:
def resultados_posibles(dimension_espacios_muestrales):
    resultado = 1
    for i in dimension_espacios_muestrales:
        resultado *= i
    return resultado

In [31]:
resultados_posibles([2, 2])

4

In [32]:
resultados_posibles([2, 6])

12

In [33]:
resultados_posibles([2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

1024

In [34]:
np.prod([2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

1024

## Permutaciones

Supongamos que tengo 3 objetos, A, B y C, quiero elegir 2 de esos tres objetos y ordenarlos. ¿Cuántas posibilidades tengo?

Para comenzar, puedo elegir cualquiera de los tres:

- A
- B
- C

Como segundo objeto solamente tengo 2 opciones. Por ejemplo, si elegí primero A, el segundo objeto puede ser B o C. Mis seis posibilidades, entonces, son:

- (A, B)
- (A, C)
- (B, A)
- (B, C)
- (C, A)
- (C, B)

Si tengo 5 elementos y los voy eligiendo de a uno, en el primer paso tengo 5 opciones, en el segundo 4, en el tercero 3, etc.

Esto me da la fórmula: $5 \times 4 \times 3 \times 2 \times 1 = 5! = 120$

Si sólo elijo 2 objetos entre 5, en el primer paso tengo 5 opciones y en el segundo, 4. Es decir, $5 \times 4$

Quedan 3 objetos que no elegí, que a su vez podrían haberme dado $3 \times 2 \times 1$ posibilidades más

- Tengo 5 elementos que me dan 120 órdenes posibles. 
- De esos 5, elijo 2, que me dan $5 \times 4 = 20$ posibiles ordenamientos
- Descarto $5 - 2 = 3$ elementos que me dan $3 \times 2 \times 1 = 6$ posibilidades

Para reconstruir las 120 posibilidades, debería combinar cada una de mis $5 \times 4 = 20$ posibilidades entre los dos objetos elegidos con las $3! = 6$ posibilidades entre los tres objetos descartados. Eso me da un total de $5 \times 4 \times 3 \times 2 \times 1 = 5! = 120$.

Es decir, $120 = 5! = 5 \times 4 \times 3!$

Si divido ambos lados por $3!$, obtengo $\frac{5!}{3!} = 20$

El número $3!$ lo obtuve de los $5 - 2 = 3$ elementos que descarté. Por lo tanto, la fórmula para este caso es:

$$permutaciones = \frac{5!}{(5 - 2)!} = 20$$

y, en general, si tengo $N$ elementos de los cuales quiero elegir $k$ para ordenar, el número de permutaciones es:

$$permutaciones = \frac{N!}{(N - k)!}$$

In [35]:
def factorial(n):
    if n == 0:
        return 1
    else:
        while n >= 0:
            return n*factorial(n-1)

In [46]:
factorial(5)

120

In [37]:
math.factorial(5)

120

In [40]:
def permutaciones(N, k):
    return factorial(N) // factorial(N - k)

In [50]:
permutaciones(5, 2)

20

In [83]:
permutaciones(5, 3)

60

## Combinaciones

Ahora bien, ¿qué pasa si quiero elegir k elementos entre N disponibles pero no importa el orden.

Vimos que si tengo 3 objetos, A, B y C, y quiero elegir 2, tengo 6 posibilidades. 

Sin embargo, si el orden no importa, las opciones (A, B) y (B, A), (A, C) y (C, A) y (B, C) y (C, B) no deberían contarse como diferentes. Por lo tanto, ahora ya no tengo 6 posibilidades sino 3.

De la misma manera, si tengo 5 elementos, A, B, C, D y E y elijo de a 3, tengo 60 **permutaciones** pero hay $3! = 6$ repeticiones del trío compuesto por las letras A, B y C, por ejemplo: (A, B, C), (A, C, B), (B, A, C), (B, C, A), (C, A, B), (C, B, A). Lo mismo ocurre para las otras combinaciones de letras.

De esta manera, debemos eliminar esas repeticiones. Las permutaciones son:

$$P_{3}^{5} = \frac{5!}{(5 - 3)!} = 60$$

Pero, dado que, en este caso, cada una está repetida $3! = 6$ veces, dividimos el número de permutaciones por esa cantidad de repeticiones y obtenemos:

$$C_{3}^{5} = \frac{ P_{3}^{5}}{3!} =  \frac{5!}{3!(5 - 3)!} = 10 $$

En general, el número de combinaciones es:

$$C_{k}^{N} = \frac{ P_{k}^{N}}{k!} =  \frac{N!}{k!(N - k)!}$$

In [94]:
def combinaciones(N, k):
    return factorial(N) // (factorial(k) * factorial(N - k))

In [95]:
combinaciones(6, 4)

15

## Interpretaciones de la probabilidad.

No existe una forma única de **asignación de probabilidades**.

Recuerda estas reglas generales a la hora de asiganr probabilidades:

    - La probabilidad asignada a cada resultado experimental debe estar entre 0 y 1, inclusive.
    - La suma de las probabilidades de los resultados experimentales debe ser igual a 1.0.

## Corriente clásica

Si se consideran **espacios muestrales uniformes**, es decir, cada resultado posible, cada elemento del espacio muestral, tiene la misma probabilidad. 

De esta manera, las probabilidad de un suceso es el cociente entre el número de casos del suceso y el número total de casos del experimento.

Si lanzamos una **moneda al aire**, tenemos dos resultados posibles: H o T. 

Como la suma de las probabilidades para todos los eventos posibles tiene que ser 1 y se asume que cada evento tiene la misma probabilidad:
    - la probabilidad de obtener H es 0.5
    - la probabilidad de obtener T es 0.5

Si lanzamos un dado, cada lado tiene una probailidad de obtener cada lado es de 0.16666, (1/6) * 6 = 1.

## Corriente frecuentista

¿Qué pasa si los eventos no tienen la misma probabilidad pero no sabemos cuál le corresponde a cada uno?

Podemos repetir un experimento y tomar nota de la **frecuencia relativa** que obtenemos para cada elemento del espacio muestral.

Por ejemplo, si tenemos un dado cargado, podemos tirar el dado muchas veces y registrar qué numero sale. Calculamos la frecuencia relativa: el cociente entre la cantidad de veces que salió un número y la cantidad total de datos que tenemos.

La probabilidad de cada evento, por lo tanto, está relacionada con esa frecuencia y, bajo ciertas condiciones, la frecuencia y la probabilidad serán muy parecidas.

No es posible repetir una gran cantidad de veces algunos fenómenos, por ejemplo:

    a) Para calcular la probabilidad de que el lanzamiento de un cohete resulte exitoso, evidentemente no es posible realizar una gran cantidad de lanzamientos de cohetes; por tanto, la probabilidad se obtiene en forma frecuentista del éxito de un lanzamiento.

    b) ¿Cómo calcular la probabilidad de que Manuel viva 70 años? ¿Cuáles serían las repeticiones?

    c) Para calcular la probabilidad de que Juan Pérez se case este año, tampoco podemos realizar una gran cantidad de repeticiones del experimento.

### Ejemplo

Considere, por ejemplo un estudio sobre los **tiempos de espera en el departamento de rayos x** de un hospital pequeño. 

Durante **20 días** (N) sucesivos un empleado registra el **número de personas** que están esperando el servicio a las 9:00 a.m.; los resultados son los siguientes:

N = 20 (días)
S = {0, 1, 2, 3, 4} (Cantidad de pacientes a las 9:00 A.M.

Frecuencias observadas:

O pacientes --> 2/20  
1 pacientes --> 5/20  
2 pacientes --> 6/20  
3 pacientes --> 4/20  
4 pacientes --> 3/20

Con el método de la frecuencia relativa, la probabilidad que se le asignará a cada resultado experimental para pacientes esperan el servicio, será:

prob(O) = 2/20 = 0.10  
prob(1) = 5/20 = 0.25  
prob(2) = 6/20 = 0.30  
prob(3) = 4/20 = 0.20  
prob(4) = 3/20 = 0.15  

La suma total de las probilidades es igual a 1.

## Corriente subjetivista:

En la corriente subjetivista (interpretación de la probabilidad que es muy empleada en el estudio del análisis de decisiones) se asignan probabilidades a eventos basándose en el conocimiento o experiencia que cada persona tiene sobre el experimento; por tanto, la probabilidad asignada está sujeta al conocimiento que el científico tenga con respecto al fenómeno estudiado. De este modo, para un mismo experimento las probabilidades asignadas por diferentes personas pueden ser distintas.

Por ejemplo, si en una empresa se está programando la logística de distribución de material final, la asignación de probabilidad de que los recorridos se realicen con éxito al no tener información de datos históricos, se puede asignar de forma subjetiva.

## Corriente bayesiana:

En la corriente bayesiana se asignan probabilidades a los eventos después del experimento. Es decir, la asignación de probabilidades está basada en el conocimiento de la ocurrencia de eventos que estén en dependencia con el evento de estudio. Por ejemplo, si queremos asignar una probabilidad al evento de que el día 3 de septiembre llueva y tenemos la siguiente información:

a) Los días 1 y 2 de septiembre no llovió. b) Los días 1 y 2 de septiembre llegó un huracán a 400 kilómetros de distancia y llovió ambos días.
Es obvio suponer que la asignación de probabilidades en ambos casos es muy diferente, ya que tenemos información que hace cambiar nuestra asignación de probabilidades. En tal situación decimos que la información obtenida influyó en la asignación de probabilidades.

## El Espacio de muestreo:

Se expresa con la letra S y consiste en el conjunto de **todos los resultados posibles de un experimento**. 

- Si el experimento consiste en el **lanzamiento de una moneda**, entonces el espacio de muestreo será

$$S= {H, T}$$



- Si en lugar de considerar el lanzamiento de una moneda, **lanzamos dos monedas**

$$S = {H-T, T-H, H-H, T-T}$$

## Problema:

**Situación 1 - La coincidencia de cumpleaños**:
Vamos a una fiesta a la que concurren un total de 50 personas. Allí un amigo nos desafía afirmando que en la fiesta debe haber por lo menos 2 personas que cumplen años el mismo día y nos apuesta 100 pesos a que está en lo correcto. Es decir, que si él acierta deberíamos pagarle los 100 pesos; o en caso contrario, el nos pagará los 100 pesos. ¿Deberíamos aceptar la apuesta?


#### Solución

Supongamos que el grupo sólo tiene **una persona**, en ese caso, hay una **probabilidad del 100%** (p = 1) que esta persona **no comparte** un cumpleaños puesto que no hay nadie más quien compartir. 

Podemos añadir una **segunda persona** al grupo. ¿Cuáles son las **posibilidades de que tenga un cumpleaños diferente** de esa persona? Hay 364 otros días en el año, así que las posibilidades son **364/365**. 

Agregamos una **tercera persona** al grupo, ahora hay 363/365 días. 

Para obtener la **probabilidad general de que no hay cumpleaños compartidos** entre $n$ personas simplemente multiplicamos las probabilidades individuales.

$$prob(no exista) = \frac{365}{365} \times \frac{364}{365} \times \frac{363}{365} \times ... \times \frac{365 - n + 1}{365}$$

La probabilidad de que existan dos personas que cumplan años en la misma fecha es $1 - prob(no existan)$

In [96]:
prob = 1.0
asistentes = 23

for i in range(asistentes):
    prob = prob * (365-i)/365

print("Probabilidad de que compartan una misma fecha de cumpleaños es {0:.2f}"
      .format(1 - prob))

Probabilidad de que compartan una misma fecha de cumpleaños es 0.51
