# Funciones de distribución discreta y continua

## Configuramos nuestro notebook

In [None]:
import numpy as np
import pandas as pd
import scipy.stats

import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

## Dos conceptos claves: Valor esperado o media y varianza.

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)

## Distribucion de probabilidad discreta

Se denomina [distribución de variable discreta](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad#Distribuciones_de_variable_discreta) a aquella cuya función de probabilidad solo toma valores positivos en un conjunto de valores de ***X*** finito o infinito numerable. A dicha función se le llama función de masa de probabilidad.

Mas detalles en [distribución de probabilidad discreta de qwe.wiki](https://es.qwe.wiki/wiki/Probability_distribution#Discrete_probability_distribution)

![image.png](attachment:image.png)

1. **Rango**: El rango de la función debe cumplir y contener a todos los valores de x. La probabilidad de los eventos debe ser mayor a 0 y no debe superar el valor de 1.
2. **Probabilidad**: El valor puntual de la probabilidad de la variable X será puntualmente la probabilidad de xi
3. **Probabilidad acumulada**: Es la suma de todas las probabilidades de obtener un valor igual o menor a un xi. 
4. **Regla de completitud de Espacio**: Debemos contemplar todos los valores posibles que puede tomar nuestra variable aleatoria x. Luego la sumatoria de todas las probabilidades de todos los valores que toma x debe sumar siempre 1.
5. **Valor esperado**: Es el promedio
6. **Varianza**: Es una medida de dispersión al cuadrado que relacion el valor esperado y el valor real. 

La [distribución binomial](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial#Propiedades) es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. 

La función binomial tiene esta formula:

![image.png](attachment:image.png)

**¿Qué es una distribución binomial?**

- Es una distribución de probabilidades de variables aleatorias discretas
- Estas pueden tomar valores x={0,1,2,3… n}
- Lo que se busca con esta distribución es contar el numero de éxitos de repetir n veces un experimento.

**¿Cuándo se debe usar la distribución binomial?**

- Cuando hay un experimento que se repite n veces (el n en este caso es 8)
- Ese resultado solo puede tener dos resultados
- Las probabilidades de estos sucesos son CONSTANTES (en este caso p=0.3)

**Tenemos entonces definido**:

- n como el número de casos totales, es decir se probara 8 veces
- Tenemos p = 0.3 y (1-p) = 0.7 -> p=probabilidad de que el evento sea favorable o Éxito
- k seria el for, es decir este numero i que va de 0 a 8

**Como leer y entender el grafico**:

El grafico se lee de la siguiente manera:

- La probabilidad de que la variable aleatoria (VAD) tome el valor de 0 en 8 intentos es 0.05

![image-3.png](attachment:image-3.png)

In [None]:
from scipy.stats import binom

p = 0.3 # Probabilidad de exito
n = 8 # Numero de intentos

x = list(range(0, 9, 1))
y = list([])

for i in x: 
  y.append(binom.pmf(i, p=p, n=n))

fig, ax = plt.subplots()
ax.bar(x, y)
ax.set_ylabel('Probabilidad discreta')

print('Sumatoria de todos los valores de la funcion de probabilidad discreta binomial: ', np.sum(y))

Calculamos la media y la varianza asociadas a la variable aleatoria X

In [None]:
media = np.average(x, weights = y)
media

![image.png](attachment:image.png)

In [None]:
errores = (x - media)
varianza = np.average(errores**2, weights=y)
varianza

In [None]:
media, varianza

In [None]:

p = 0.3 # Probabilidad de exito
n = 8 # Numero de intentos

x = list(range(0, n + 1, 1))
y = list([])

for i in x: 
  y.append(binom.pmf(i, p=p, n=n))

fig, ax = plt.subplots()
ax.bar(x, y)
ax.set_ylabel('Probabilidad discreta')

ax.axvline(x = media, c='r', linestyle='--', label='Valor esperado')
ax.axvline(x = (media + 3*np.sqrt(varianza)), c='b', linestyle='--', label='Desviacion estandar +3')
ax.axvline(x = (media - 3*np.sqrt(varianza)), c='g', linestyle='--', label='Desviacion estandar -3')

ax.legend()

## Distribucion de probabilidad continua

Se denomina [variable continua](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad#Distribuciones_de_variable_continua) a aquella que puede tomar cualquiera de los infinitos valores existentes dentro de un intervalo. En el caso de variable continua la distribución de probabilidad es la integral de la función de densidad.

Mas detalles en [distribución de probabilidad continua de qwe.wiki](https://es.qwe.wiki/wiki/Probability_distribution#Continuous_probability_distribution)

![image.png](attachment:image.png)

Igual que para los casos de distribucion de probabilidad discreta pero son integrales para una sumatoria de infinitos numero y no una sumatoria de numeros discretos.

In [None]:
p = 0.3 # Probabilidad de exito
N = 100 # Numero de intentos

x = list(range(0, N+1, 1))
y = list([])

for i in x: 
  y.append(binom.pmf(i, p=p, n=N))

fig, ax = plt.subplots()
ax.plot(x, y)
ax.set_title('Probabilidad continua')


In [None]:
p = 0.3 # Probabilidad de exito
N = 100 # Numero de intentos

x = list(range(0, N+1, 1))
y = list([])

for i in x: 
  y.append(binom.cdf(i, p=p, n=N))

fig, ax = plt.subplots()
ax.plot(x, y)
ax.set_title('Distribucion de probabilidad continua acumulada')

Curtosis:

Nos da indicios de como están distribuidos los datos.

- Si los datos son mas uniformes y se acercan mas a la media entonces estamos en presencia de una distribución leptocúrtica (coeficiente de curtosis > 0)
- Si los datos están muy dispersos y la curva no presenta una cima pronunciada, estamos en presencia de una distribución platicúrtica (coef. de curtosis < 0)
- Si los datos presentan un comportamientos normal la curtosis es igual a 0 (mesocúrtica)

![image.png](attachment:image.png)

Simetría
La simetría hace referencia a que tan iguales son las dos partes de la distribución.

- Si la distribución es simétrica sus Medidas de tendencia central (media, mediana y moda) serán iguales.

![image-2.png](attachment:image-2.png)


In [None]:
mean, var, skew, kurt = binom.stats(N, p, moments='mvsk')
mean, var, skew, kurt

Las **distribuciones de probabilidad continuas**, como la distribución normal, describen valores en un rango o escala y se muestran como figuras sólidas en la galería de distribuciones. Las distribuciones continuas son en realidad abstracciones matemáticas, ya que suponen la existencia de cada valor intermedio posible entre dos números. Es decir, una distribución continua asume que hay un número infinito de valores entre dos puntos de la distribución.

Las **distribuciones de probabilidad discretas** describen valores distintos, normalmente números enteros, sin valores intermedios, y se muestran como una serie de columnas verticales.Una distribución discreta, por ejemplo, puede describir como 0, 1, 2, 3 o 4 el número de veces que aparece “cara” al tirar una moneda a cara o cruz.

Link a la explicacion de los diferentes tipos de distribuciones

https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwj07Ovzgf7qAhXMneAKHWiBAvkQFjANegQIDBAc&url=https%3A%2F%2Falejandrobanegas.jimdo.com%2Fapp%2Fdownload%2F10702368660%2FOracle%2B(2015)%2BDistribuciones%2Bde%2Bprobabilidad%2Bcontinuas%2By%2Bdiscretas.pdf%3Ft%3D1444423505&usg=AOvVaw12FZGw__hMhAhAZ-h9Ub0i