# Estadistica

## Medidas de Dispersión
Para calcular la varianza se puede usar la funcion np.var() de numpy, que calcula la varianza de un array o lista de valores. La desviación estándar se puede calcular con np.std(). Ejemplo:

In [None]:
import numpy as np

# Datos de ejemplo
data = [10, 12, 23, 23, 16, 23, 21, 16]

# Calcular varianza
varianza = np.var(data, ddof=1) # ddof=1 para varianza muestral no toda la poblacion.
print(varianza)

# Calcular desviación estándar
desviacion_estandar = np.std(data)
print(desviacion_estandar)

## Quantiles
Para calcular los quantiles se puede usar la función np.quantile() de numpy. Esta función toma un array de datos y un valor entre 0 y 1 que representa el quantil deseado. Por ejemplo, para calcular el primer cuartil (Q1), el segundo cuartil (Q2 o mediana) y el tercer cuartil (Q3), se puede hacer lo siguiente:

In [None]:
import numpy as np

# Datos de ejemplo
data = [10, 12, 23, 23, 16, 23, 21, 16]

# Calcular quantiles
q1 = np.quantile(data, 0.25)
q2 = np.quantile(data, 0.5)  # Mediana
q3 = np.quantile(data, 0.75)
print(f"Q1: {q1}, Q2: {q2}, Q3: {q3}")

# Tambien se puede usar la funcion linspace para obtener los quantiles de manera mas general.
quantiles = np.linspace(0, 1, 5)  # Cuatro quantiles (0%, 25%, 50%, 75%, 100%)
quantiles_values = np.quantile(data, quantiles)
print(f"Quantiles: {quantiles_values}")

## Outliers
Para detectar outliers, se puede usar el método del rango intercuartil (IQR). Los outliers son aquellos valores que están por debajo de Q1 - 1.5 * IQR o por encima de Q3 + 1.5 * IQR. Aquí hay un ejemplo de cómo hacerlo:

In [2]:
from scipy.stats import iqr
import numpy as np

# Datos de ejemplo
data = [10.0, 12.0, 23.0, 23.0, 16.0, 23.0, 21.0, 16.0, 100.0]  # Incluyendo un outlier (100)
data_np = np.array(data)

# Calcular Q1, Q3 y IQR
iqr_value = iqr(data_np)

lower_threshold = np.quantile(data_np, 0.25) - 1.5 * iqr_value
upper_threshold = np.quantile(data_np, 0.75) + 1.5 * iqr_value

print(data_np[(data_np < lower_threshold) | (data_np > upper_threshold)])  # Imprime los outliers

[100.]


## Distribuciones Discretas
