# Descriptive Statistics

En esta sección exploramos medidas descriptivas fundamentales como la media, mediana, varianza y desviación estándar, y revisamos algunas propiedades importantes de la varianza.

## Media

La **media** es la medida de tendencia central que se calcula como el promedio aritmético de un conjunto de valores. Representa el punto de equilibrio de los datos.

### Fórmula matemática:
$$
\mu = \frac{1}{n} \sum_{i=1}^{n} x_i
$$

Donde:
- $n$ es el número total de valores.
- $x_i$ son los valores individuales.

### Cálculo en Python:
```python
from scipy.stats import tmean
import pandas as pd

# Datos de ejemplo
data = [10, 20, 30, 40, 50]

# Usando scipy
mean_scipy = tmean(data)

# Usando pandas
df = pd.DataFrame({'values': data})
mean_pandas = df['values'].mean()
```

## Mediana

La **mediana** es el valor que divide un conjunto de datos ordenados en dos partes iguales. Es menos sensible a valores extremos en comparación con la media.

### Fórmula matemática:
- Si el número de valores es impar: $\text{Mediana} = x_{(n+1)/2}$
- Si el número de valores es par: $\text{Mediana} = \frac{x_{n/2} + x_{(n/2)+1}}{2}$

### Cálculo en Python:
```python
from numpy import median

# Usando numpy
median_numpy = median(data)

# Usando pandas
median_pandas = df['values'].median()
```

## Varianza

La **varianza** mide la dispersión de los datos con respecto a la media. Se calcula como el promedio de los cuadrados de las diferencias entre cada valor y la media.

### Fórmula matemática:
$$
\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2
$$

### Cálculo en Python:
```python
from scipy.stats import tvar

# Usando scipy
variance_scipy = tvar(data)

# Usando pandas
variance_pandas = df['values'].var(ddof=0)  # ddof=0 para la varianza poblacional
```

## Desviación Estándar

La **desviación estándar** es la raíz cuadrada de la varianza y proporciona una medida de la dispersión en las mismas unidades que los datos originales.

### Fórmula matemática:
$$
\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2}
$$

### Cálculo en Python:
```python
from scipy.stats import tstd

# Usando scipy
std_scipy = tstd(data)

# Usando pandas
std_pandas = df['values'].std(ddof=0)  # ddof=0 para la desviación estándar poblacional
```

## Propiedades de la Varianza

1. La varianza nunca es negativa: $\sigma^2 \geq 0$.
2. Si todos los valores son iguales, la varianza es 0.
3. Multiplicar todos los valores por una constante $c$ multiplica la varianza por $c^2$: $\text{Var}(cX) = c^2 \cdot \text{Var}(X)$.

### Fórmulas matemáticas:

- Si $X$ e $Y$ son variables independientes:
$$
\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)
$$

- Si $c$ es una constante:
$$
\text{Var}(cX) = c^2 \cdot \text{Var}(X)
$$