# Estadística Descriptiva en Python

La estadística descriptiva es una rama de la estadística que se encarga de recolectar, analizar, interpretar y presentar datos de manera organizada y efectiva. Su principal objetivo es proporcionar resúmenes simples y comprensibles acerca de las características principales de un conjunto de datos, sin llegar a hacer inferencias o predicciones sobre una población más amplia.

# Medidas de Tendencia Central

Las medidas de tendencia central describen cómo se centralizan o agrupan los datos en un conjunto. Son esenciales en estadística y análisis de datos porque nos proporcionan un resumen de la información.

# Medidas de Dispersión

Las medidas de dispersión describen cómo de variados son los datos en un conjunto. Nos muestran cuánto se extienden o varían los datos alrededor de la media.

# Medidas de Posición

Las medidas de posición nos indican la ubicación de un valor dentro de un conjunto de datos.

# Medidas de Forma

Las medidas de forma describen cómo se distribuyen los valores en un conjunto de datos en relación con la tendencia central.

# Visualización de Datos

Para comprender mejor la distribución de los datos, podemos usar histogramas, diagramas de dispersión y gráficos de cajas.

In [None]:

import statistics as stats
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import skew, kurtosis

# Datos de ejemplo
data = [10, 20, -15, 0, 50, 10, 5, 100]

# Media
mean = stats.mean(data)
print(f"Media: {mean}")

# Mediana
median = stats.median(data)
print(f"Mediana: {median}")

# Moda
mode = stats.mode(data)
print(f"Moda: {mode}")

# Visualización
plt.figure(figsize=(8,5))
sns.histplot(data, bins=5, kde=True, color='blue')
plt.axvline(mean, color='red', linestyle='dashed', label=f"Media: {mean}")
plt.axvline(median, color='green', linestyle='dashed', label=f"Mediana: {median}")
plt.axvline(mode, color='purple', linestyle='dashed', label=f"Moda: {mode}")
plt.legend()
plt.title("Distribución de los datos y medidas de tendencia central")
plt.show()


In [None]:

# Rango
range_ = max(data) - min(data)
print(f"Rango: {range_}")

# Varianza y desviación estándar
variance = stats.variance(data)
std = stats.stdev(data)
print(f"Varianza: {variance}")
print(f"Desviación estándar: {std}")

# Visualización
plt.figure(figsize=(8,5))
sns.boxplot(x=data, color="orange")
plt.title("Diagrama de Caja - Medidas de Dispersión")
plt.show()


In [None]:

# Percentiles y cuantiles
percentiles = np.percentile(data, [25, 50, 75])
print(f"Percentiles 25, 50, 75: {percentiles}")

# Visualización
plt.figure(figsize=(8,5))
sns.histplot(data, bins=5, kde=True, color='blue')
for p in percentiles:
    plt.axvline(p, linestyle='dashed', color='red', label=f"Percentil {p}")
plt.legend()
plt.title("Percentiles en la Distribución de Datos")
plt.show()


In [None]:

# Asimetría (Skewness)
skewness = skew(data)
print(f"Asimetría (Skewness): {skewness}")

# Curtosis (Kurtosis)
kurt = kurtosis(data)
print(f"Curtosis: {kurt}")

# Visualización
plt.figure(figsize=(8,5))
sns.histplot(data, bins=5, kde=True, color='blue')
plt.title("Distribución de datos - Medidas de Forma")
plt.show()
