# Estadística para Data Science: Cuaderno clase 5 P1


In [84]:
# Importando librerías

import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import scipy.stats as stats
import seaborn as sns


## Recordando la clase anterior, Probabilidad y Estadística

En la pregunta:
- ¿Que posibilidad hay que al lanzar una "moneda justa" cinco veces, me salgan 5 caras seguidas?

"la verdad del funcionamiento del mundo" es conocida, y la pregunta pasa por el "tipo de eventos" que sucederán. El punto crítico es que las preguntas probabilísticas parten con un **modelo** conocido del mundo, y usamos ese modelo para hacer cálculos. Este modelo subyacente puede ser muy simple. Por ejemplo, en la primera pregunta, podríamos escribir el modelo de esta forma:

$$
P(\mbox{cara}) = 0.5
$$


Que se puede leer como "la probabilidad de que salga cara es de 0.5". Al usar este modelo para responder la pregunta, no estoy respondiendo si saldrá cara o sello en el siguiente lanzamiento, y no sé realmente qué es lo que va a pasar si lanzo una moneda justa diez veces. A lo mejor salen 5 caras, a lo mejor salen 2 o a lo mejor ninguna. Esa es la clave: En teoría de probabilidades, el **modelo** es conocido, pero los **datos** no. 


Eso es probabilidad. ¿Qué pasa con la estadística? Las preguntas estadísticas van para el otro lado. En estadística, **no sabemos** "la verdad sobre el mundo". Lo único que tenemos son datos y es desde los datos que queremos **aprender** "la verdad sobre el mundo". La pregunta estadística que haríamos analizando el mismo caso análogo sería:

- Lancé una moneda 5 veces y saco 5 caras, ¿sera una "moneda justa" la que estoy lanzando?
Ahora lo único que tenemos son datos. Lo que **sé** es que yo tiré 5 veces la moneda y salió cara todo el tiempo. Y lo que quiero **inferir** es si puedo concluir que lo que vi fueron 5 lanzamientos de una moneda justa o si puedo sospechar que pasa algo distinto. Los datos se verían así:
```
C C C C C
```
Y lo que estoy tratando de hacer es ver a cual "modelo del mundo" debería ponerle mi confianza. Si la moneda es justa, entonces el modelo que debería adoptar es el de $P(\mbox{cara}) = 0.5$. Si la moneda no es justa, entonces el modelo sería $P(\mbox{heads}) \neq 0.5$. En otras palabras, el problema de inferencia sería averiguar cuál de estos modelos es el correcto. Claramente, la pregunta estadística no es la misma que la probabilística, pero están profundamente conectadas entre sí. 



## Propiedades y definiciones básicas de Probabilidad

Veamos dos tipos de ejemplos muy clásicos (lanzar una moneda y un dado) y vamos definiendo propiedades y términos.

* Un **outcome** o **muestreo** es un posible resultado de algún **experimento** (proceso aleatorio).
* El **espacio muestral** es el set de todos los posibles outcomes
* Un **evento** es un conjunto de outcomes. Un **espacio de eventos** es el conjunto de todos los eventos posibles.

Si lanzamos un dado de 6 caras entonces:
* Espacio muestral: {1,2,3,4,5,6}
* Ejemplos de eventos serían:
- El outcome es 1 : {1}
- El outcome es menor o igual a 3 : {1,2,3}
- El outcome es par : {2,4,6}

**Experimento compuesto**
Un experimento compuesto tiene multiples outcomes. Por ejemplo, si lanzamos un dado y tiramos una moneda

* Espacio muestral: $\{1,2,3,4,5,6\} \times \{C,S\}=\{(1,C), (2,C), (3,C), (4,C), (5,C), (6,C), (1,S), (2,S), (3,S), (4,S), (5,S), (6,S) \}$
* Ejemplos de eventos:
- El dado sale 2 y la moneda Sello: $\{(2,S)\}$
- El dado sale 4 y la moneda no sabemos: $\{4 \} \times \{C,S\} = \{(4,C), (4,S)\}$

**Función de Probabilidad**
Una **función de probabilidad** $P(E)$ mapea un evento a un número real entre 0 y 1 igual a la proporción de veces que el outcome ocurriría si es que observáramos el proceso aleatorio (experimento) un número infinito de veces. 
* Si corremos muchos experimentos, $E$ debería suceder en una proporción cercana a la $P(E)$ teórica, cada vez más cercana mientras más experimentos se corran. Esto se llama **Ley de los grandes números**.
Vamos a mostrar empíricamente esto con código en la siguiente celda. Pensemos en el caso donde lanzamos un dado y queremos saber la probabilidad de que el outcome sea 4.


In [85]:

# importamos la librería random
import random

def muestreo_aleatorio(n, em):
    n=n
    em=em
    muestreo = [random.choice(em) for i in range(n)]
    muestreo = pd.Series(muestreo)
    return(muestreo)

Lancemos 10 dados con la función `muestreo_aleatorio`

In [73]:
# creamos una lista con el espacio muestral del lanzamiento de 1 dado, 
em_dado = [1,2,3,4,5,6]


In [86]:
    
muestreo_aleatorio(10,em_dado)

0    1
1    4
2    5
3    1
4    1
5    6
6    1
7    2
8    1
9    5
dtype: int64

Ahora lanza 20 monedas con Cara y Sello

In [89]:
em_moneda = ["Cara","Sello"]

l1_moneda_20 = muestreo_aleatorio(20,em_moneda)

l1_moneda_20

0     Sello
1     Sello
2     Sello
3      Cara
4     Sello
5     Sello
6      Cara
7      Cara
8      Cara
9      Cara
10     Cara
11    Sello
12    Sello
13     Cara
14     Cara
15     Cara
16    Sello
17    Sello
18     Cara
19    Sello
dtype: object

In [100]:
# Como lo que retorna es un objeto de clase pandas, podemos ocupar los métodos de esta librería
l1_moneda_20.value_counts()[['Cara','Sello']]

Cara     10
Sello    10
dtype: int64

In [93]:
# Mejor todavía, podemos extraer solo el número de Caras fácilmente
l1_moneda_20.value_counts()

Sello    10
Cara     10
dtype: int64

In [94]:
l1_dado_20 = muestreo_aleatorio(n=20, em= em_dado)


In [102]:
l1_dado_20.value_counts()[[1,2]]

1    9
2    4
dtype: int64

## Axiomas de Probabilidad

$$P(E)\geq 0$$

$$P(E)+P(E^C)=1$$

$$P(E\cup F)=P(E)+P(F)-P(E\cap F) $$





### Regla de la adición
La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier evento en particular es igual a la suma de las probabilidades individuales, si es que los eventos son mutuamente excluyentes, es decir, que dos no pueden ocurrir al mismo tiempo.

Por un lado, si $ A\cap B=\varnothing $, es decir que son mutuamente excluyentes, entonces
$P(A \cup B)=P(A)+P(B)$

Por otro lado, si $ A\cap B\neq \varnothing $ , es decir que no son mutuamente excluyentes, entonces
$P(A\cup B)=P(A)+P(B)-P(A\cap B)$
Siendo: $P(A)=$ probabilidad de ocurrencia del evento A, $P(B)$probabilidad de ocurrencia del evento B, y $P(A\cap B)=$ probabilidad de ocurrencia simultánea de los eventos A y B.

### Regla de la multiplicación
La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más eventos estadísticamente independientes es igual al producto de sus probabilidades individuales.

$P(A\cap B)=P(A)P(B)$, si A y B son independientes.

$P(A\cap B)=P(A)P(B|A)$, si A y B son dependientes.

siendo $P(B|A)$ la probabilidad de que ocurra B habiéndose dado o verificado el evento A.