# 📊 Estadística Básica para Análisis Predictivo

## 📌 Objetivo
Explicar los conceptos fundamentales de estadística descriptiva utilizados como base para el análisis predictivo. Incluye definiciones, fórmulas y ejemplos computacionales.

## 1. Media (Promedio)
La media es la suma de todos los valores dividida entre el número de observaciones.

**Fórmula:**

$$
\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i
$$

In [None]:

import numpy as np
valores = [8, 6, 7, 5, 9]
media = np.mean(valores)
media


## 2. Mediana
La mediana es el valor que divide la distribución en dos mitades iguales (cuando los datos están ordenados).

In [None]:
np.median(valores)

## 3. Moda
La moda es el valor que más se repite en un conjunto de datos.

In [None]:

from scipy import stats
stats.mode(valores, keepdims=True).mode[0]


## 4. Varianza
La varianza mide la dispersión promedio respecto a la media.

**Fórmula:**

$$
\text{Var}(X) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2
$$

In [None]:
np.var(valores)

## 5. Desviación estándar
Es la raíz cuadrada de la varianza. Mide la dispersión en las mismas unidades que los datos.

In [None]:
np.std(valores)

## 6. Rango intercuartílico (IQR)
Es la diferencia entre el tercer y el primer cuartil. Representa el rango del 50% central de los datos.

In [None]:
iqr = np.percentile(valores, 75) - np.percentile(valores, 25)
iqr

## 7. Correlación de Pearson
Mide la relación lineal entre dos variables.

**Fórmula:**

$$
\rho_{X,Y} = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}
$$

In [None]:

x = [1, 2, 3, 4, 5]
y = [2, 4, 5, 4, 5]
np.corrcoef(x, y)[0, 1]


## 8. Visualización básica

In [None]:

import matplotlib.pyplot as plt

plt.hist(valores, bins=5, edgecolor='black')
plt.title("Histograma de valores")
plt.xlabel("Valor")
plt.ylabel("Frecuencia")
plt.show()
