# Estadísticos descriptivos
Consiste en calcular estadísticas que nos permitan encontrar una descripción de los datos. Existen varias medidas para encontrar como se describir una distribución.

![image.png](attachment:image.png)

## Estadísticos de tendencia central
Son estadíticos que nos indican hacia que medidas tienden los datos. Si tenemos una lista de datos podemos calcular estas estidisticas de la siguiente forma:

In [11]:
import numpy as np
import statistics as stats
datos = [100,150,150,200,250,300,325,400,415,500,600,1000]
media = np.mean(datos)
median = np.median(datos)
moda = stats.mode(datos)
print("media:",media)
print("mediana:",median)
print("moda:",moda)

media: 365.8333333333333
mediana: 312.5
moda: 150


### Media
Indica el valor promedio o a el que más tienden los valores de una población <br><br>
$\dfrac{\sum x_i}{n}, \ \ n=número \ de \ datos$ 
### Mediana
Para cantidades de datos impares es el dato central y para cantidades de datos pares es el promedio entre los dos datos más centrales.
### Moda
Es el valor más frecuente de una población. Puede haber más de una moda.

In [12]:
Rango = max(datos) - min(datos)
IQR = np.percentile(datos,75) - np.percentile(datos,25) 
des = np.std(datos)
print("Rango:",Rango)
print("IQR:",IQR)
print("desviación estandar:",des)

Rango: 900
IQR: 248.75
desviación estandar: 239.6771555423856


## Estadisticos de dispersión
Son estadísticos que nos permiten saber la variabilidad de una variable.

### Rango
Es la diferencia entre el valor maximo y el valor minimo de un listado de datos.

### IQR 
Diferencia entre el cuartil superior y el cuartil 3 y el cuartil 1 de los datos.

### Desviación estandar
Indica la variación media de los datos. <br><br>
$s = \sqrt{\dfrac{1}{n} \sum_{i=2}^{n}(x_i - \bar{x})^2}$

## Estadísticos de forma
Nos indican la forma que tiene la distribución.

In [8]:
from scipy.stats import stats as st
kurtosis = st.kurtosis(datos)
skew = st.skew(datos)
print("Kurtosis:",kurtosis)
print("skew:",skew)

Kurtosis: 1.4285722765161841
skew: 1.3623858394083481


### Coeficiente de asimetria
Nos indica si los datos están más concentrados a la derecha o a la izquierda de la media. Se calcula como: <br><br>
$\dfrac{1}{N}*\dfrac{\sum_{i=1}^{n}(x_i-\bar{x})^3}{\sigma^3}$

![image.png](attachment:image.png)

### Coeficiente de kurtosis
Indica la concentración de una variable alrededor de una zona central. <br><br>
$\dfrac{1}{N} * \dfrac{\sum_{i=1}^{n} (x_i-\bar{x})^4}{\sigma^4}-3$

![image.png](attachment:image.png)

## Notas extra

In [14]:
import pandas as pd
cuartiles_datos = pd.qcut(datos,4)
cuartiles_datos.categories

IntervalIndex([(99.999, 187.5], (187.5, 312.5], (312.5, 436.25], (436.25, 1000.0]],
              closed='right',
              dtype='interval[float64]')