# Tipos de Distancia en Machine Learning

En Machine Learning, los tipos de distancia son fundamentales para medir la similitud o disimilitud entre puntos de datos. Estos se utilizan en algoritmos de clasificación, clustering y regresión. A continuación, se presentan los tipos de distancia más comunes y sus aplicaciones.

## 1. Distancia Euclidiana (Euclidean Distance)

**Definición**: La distancia euclidiana mide la longitud de la línea recta entre dos puntos en el espacio. Para dos puntos \( A = (x_1, y_1) \) y \( B = (x_2, y_2) \), se calcula como:

$$
\text{Distancia Euclidiana} = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}
$$

**Aplicación**: Utilizada en algoritmos como K-Nearest Neighbors (KNN) y clustering (K-Means), especialmente cuando los datos tienen coordenadas continuas en un espacio vectorial.

---

## 2. Distancia de Manhattan (Manhattan Distance)

**Definición**: También llamada **distancia L1** o **distancia del taxista**, calcula la distancia entre dos puntos solo en rutas horizontales y verticales. La fórmula es:

$$
\text{Distancia Manhattan} = |x_2 - x_1| + |y_2 - y_1|
$$

**Aplicación**: Común en problemas donde se analizan redes de cuadrícula o en redes neuronales convolucionales (CNN), ya que es menos sensible a valores extremos que la distancia euclidiana.

---

## 3. Distancia de Minkowski (Minkowski Distance)

**Definición**: Es una generalización de las distancias Euclidiana y Manhattan, controlada por un parámetro \( p \):

$$
\text{Distancia Minkowski} = \left( |x_2 - x_1|^p + |y_2 - y_1|^p \right)^{1/p}
$$

Cuando \( p = 2 \) es equivalente a Euclidiana y cuando \( p = 1 \) es Manhattan.

**Aplicación**: Se usa para probar distintas métricas de distancia en clustering o clasificación, ajustándose entre L1 y L2.

---

## 4. Distancia de Hamming (Hamming Distance)

**Definición**: Calcula el número de posiciones en las que dos secuencias de igual longitud difieren. Para cadenas binarias de longitud \( n \):

$$
\text{Distancia Hamming} = \sum_{i=1}^n \delta(x_i, y_i)
$$

donde \( \delta(x_i, y_i) = 1 \) si \( x_i \neq y_i \), y 0 en caso contrario.

**Aplicación**: Utilizada en procesamiento de texto, datos categóricos, y en problemas de detección y corrección de errores (códigos de Hamming).

---

## 5. Distancia Coseno (Cosine Distance)

**Definición**: Calcula el ángulo entre dos vectores, en lugar de su diferencia en magnitud. Para dos vectores \( A \) y \( B \):

$$
\text{Distancia Coseno} = 1 - \cos(\theta) = 1 - \frac{A \cdot B}{\|A\| \|B\|}
$$

**Aplicación**: Ideal para espacios de alta dimensionalidad, como el análisis de texto (representaciones TF-IDF) y en sistemas de recomendación.

---

## 6. Distancia de Mahalanobis (Mahalanobis Distance)

**Definición**: Mide la distancia entre un punto y una distribución en lugar de otro punto, tomando en cuenta la correlación entre variables:

$$
\text{Distancia Mahalanobis} = \sqrt{(X - \mu)^T S^{-1} (X - \mu)}
$$

donde \( S \) es la matriz de covarianza.

**Aplicación**: Útil en detección de anomalías y clasificación en datos con variables correlacionadas.

---

## 7. Distancia de Jaccard (Jaccard Distance)

**Definición**: Mide la disimilitud entre dos conjuntos como la relación de la intersección y la unión:

$$
\text{Distancia Jaccard} = 1 - \frac{|A \cap B|}{|A \cup B|}
$$

**Aplicación**: Usada en problemas de comparación de conjuntos, en sistemas de recomendación y clasificación en datos binarios o categóricos.

---
