# Descriptive Statistics

En esta sección exploramos medidas descriptivas fundamentales como la media, mediana, varianza, desviación estándar, y coeficiente de variación, junto con las propiedades de la varianza.

## Media

La **media** es la medida de tendencia central que se calcula como el promedio aritmético de un conjunto de valores. Representa el punto de equilibrio de los datos.

### Fórmula matemática:
$$
\large \mu = \frac{1}{n} \sum_{i=1}^{n} x_i
$$

Donde:
- $n$ es el número total de valores.
- $x_i$ son los valores individuales.

### Cálculo en Python:
```python
import numpy as np

# Datos de ejemplo
data = [10, 20, 30, 40, 50]

# Usando numpy
mean_numpy = np.mean(data)
print(f"Media: {mean_numpy:.2f}")
```

## Mediana

La **mediana** es el valor que divide un conjunto de datos ordenados en dos partes iguales. Es menos sensible a valores extremos en comparación con la media.

### Fórmula matemática:
- Si el número de valores es impar: $\text{Mediana} = x_{(n+1)/2}$
- Si el número de valores es par: $\text{Mediana} = \frac{x_{n/2} + x_{(n/2)+1}}{2}$

### Cálculo en Python:
```python
# Usando numpy
median_numpy = np.median(data)
print(f"Mediana: {median_numpy:.2f}")
```

## Varianza

La **varianza** mide la dispersión de los datos con respecto a la media. Se calcula como el promedio de los cuadrados de las diferencias entre cada valor y la media.

### Fórmula matemática:
$$
\large \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2
$$

### Cálculo en Python:
```python
# Usando numpy
variance_numpy = np.var(data)
print(f"Varianza: {variance_numpy:.2f}")
```

## Desviación Estándar

La **desviación estándar** es la raíz cuadrada de la varianza y proporciona una medida de la dispersión en las mismas unidades que los datos originales.

### Fórmula matemática:
$$
\large \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2}
$$

### Cálculo en Python:
```python
# Usando numpy
std_numpy = np.std(data)
print(f"Desviación Estándar: {std_numpy:.2f}")
```

## Propiedades de la Varianza

1. La varianza nunca es negativa: $\sigma^2 \geq 0$.
2. Si todos los valores son iguales, la varianza es 0.
3. Multiplicar todos los valores por una constante $c$ multiplica la varianza por $c^2$: $\text{Var}(cX) = c^2 \cdot \text{Var}(X)$.

### Fórmulas matemáticas:

- Si $X$ e $Y$ son variables independientes:
$$
\large \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)
$$

- Si $c$ es una constante:
$$
\large \text{Var}(cX) = c^2 \cdot \text{Var}(X)
$$

## Coeficiente de Variación

El **coeficiente de variación** (CV) es una medida relativa de dispersión que expresa la desviación estándar como un porcentaje de la media. Es útil para comparar la variabilidad entre diferentes conjuntos de datos con distintas unidades o magnitudes.

### Fórmula matemática:
$$
\large \text{CV} = \frac{\sigma}{\mu} \times 100
$$

Donde:
- $\sigma$ es la desviación estándar.
- $\mu$ es la media.

### Cálculo en Python:
```python
# Coeficiente de variación usando numpy
cv = (std_numpy / mean_numpy) * 100
print(f"Coeficiente de Variación: {cv:.2f}%")
```

### Notas:
- El CV no tiene sentido cuando la media es cero o cercana a cero.
- Es una medida sin unidades que permite comparaciones entre distintos contextos.