## Profundidades Estadísticas: Mahalanobis, Half-Space de Tukey y Espacial (Spatial Depth)



### 1. Profundidad de Mahalanobis (Mahalanobis Depth - MHD)

* **Definición:** La profundidad de Mahalanobis se define como una función de profundidad de Tipo C, basada en la distancia de Mahalanobis. Utiliza una medida de localización $\mu(F)$ y una medida de covarianza $\Sigma(F)$ de la distribución $F$. La profundidad de Mahalanobis de un punto $x$ con respecto a la distribución $F$ se define como:

   $$ MHD(x; F) = \left(1 + d^2_{\Sigma(F)}(x, \mu(F))\right)^{-1} $$

   donde $d^2_{\Sigma(F)}(x, \mu(F)) = (x - \mu(F))' \Sigma(F)^{-1} (x - \mu(F))$ es la distancia al cuadrado de Mahalanobis entre $x$ y $\mu(F)$ utilizando la matriz de covarianza $\Sigma(F)$.

* **Medidas de Localización y Covarianza:** El paper menciona que $\mu(F)$ y $\Sigma(F)$ pueden ser cualquier medida de localización y covarianza correspondientes a la distribución $F$.  Liu (1992) sugirió usar la media y la matriz de covarianza de $F$.

* **Propiedades:**
    * **Invarianza Afín (P1):** La profundidad de Mahalanobis es invariante afín si $\mu$ y $\Sigma$ son equivariantes afines. Esto significa que si se aplica una transformación afín a los datos, la profundidad relativa de los puntos se mantiene.
    * **Maximalidad en el Centro (P2):** Para distribuciones simétricas, la profundidad de Mahalanobis alcanza su máximo en el centro de simetría si $\mu(F)$ coincide con el punto de simetría de $F$ y $\Sigma(F)$ es equivariante afín.
    * **Monotonicidad Relativa al Punto Más Profundo (P3):**  La profundidad de Mahalanobis decrece monótonamente a medida que un punto se aleja del centro a lo largo de cualquier rayo que parta del centro. Esto se cumple porque la distancia de Mahalanobis aumenta al alejarse del centro, y la profundidad es inversamente proporcional a esta distancia.
    * **Desvanecimiento en el Infinito (P4):** La profundidad de Mahalanobis tiende a cero a medida que la norma de $x$ tiende a infinito, ya que la distancia de Mahalanobis también tiende a infinito.

* **Robustez:** El paper menciona que si se utilizan la media y la matriz de covarianza muestrales para calcular la profundidad de Mahalanobis, no es robusta porque la media muestral no es robusta. Sin embargo, anticipa que se pueden elegir medidas de localización y covarianza robustas para obtener una profundidad de Mahalanobis más robusta.

---

### 2. Profundidad de Half-Space de Tukey (Tukey's Halfspace Depth - HD)

* **Definición:** La profundidad de Half-Space de Tukey (también conocida como profundidad de mitad de espacio o profundidad simplicial) de un punto $x$ con respecto a una medida de probabilidad $P$ en $\mathbb{R}^d$ se define como la mínima masa de probabilidad contenida en cualquier semi-espacio cerrado $H$ que contenga a $x$. Formalmente:

   $$ HD(x; P) = \inf\{P(H): H \text{ es un semi-espacio cerrado, } x \in H\}, \quad x \in \mathbb{R}^d $$

* **Interpretación:**  Representa la "centralidad" de un punto $x$ con respecto a la distribución $P$.  Un punto con alta profundidad de Half-Space está "profundamente" dentro de la distribución, rodeado por una alta probabilidad de masa en todas las direcciones.

* **Propiedades:**
    * **Invarianza Afín (P1):** La profundidad de Half-Space es invariante afín. Esto es una propiedad fundamental y deseable, ya que la profundidad no debería depender del sistema de coordenadas elegido.
    * **Maximalidad en el Centro (P2):** Para una distribución con un centro de simetría único (en particular, para distribuciones H-simétricas), la profundidad de Half-Space alcanza su máximo en este centro.
    * **Monotonicidad Relativa al Punto Más Profundo (P3):**  La profundidad de Half-Space decrece monótonamente a medida que un punto se aleja del punto más profundo (centro) a lo largo de cualquier rayo que parta del centro.
    * **Desvanecimiento en el Infinito (P4):** La profundidad de Half-Space tiende a cero a medida que la norma de $x$ tiende a infinito.

* **Tipo de Profundidad:** El paper clasifica la profundidad de Half-Space como una profundidad de **Tipo D**, basada en la "tailedness" (cola) de un punto con respecto a una clase de conjuntos cerrados (en este caso, semi-espacios cerrados).

* **Robustez:** El paper destaca que la profundidad de Half-Space es robusta y que el estimador de localización basado en ella (la mediana de Half-Space) tiene un punto de ruptura de 1/3 para conjuntos de datos típicos.

---

### 3. Profundidad Espacial (Spatial Depth - L² Depth)

* **Definición:** La profundidad espacial (o L² depth) se define como una función de profundidad de Tipo B. Se basa en la distancia euclidiana (norma L²) entre un punto $x$ y una muestra aleatoria $X$ de la distribución $F$.  Una versión invariante afín de la profundidad espacial, utilizando la norma inducida por la matriz de covarianza $\Sigma$ de $F$, se define como:

   $$ L^2D(x; F) = \left(1 + E [ ||x - X||_{\Sigma^{-1}}^2 ] \right)^{-1} $$

   donde $||x - X||_{\Sigma^{-1}}^2 = (x - X)' \Sigma^{-1} (x - X)$ es la distancia al cuadrado inducida por la matriz de covarianza inversa $\Sigma^{-1}$.

* **Relación con la Distancia L²:** Se basa en la idea de que un punto profundo debería estar "cerca" en promedio a los puntos de la distribución, medido por la distancia L².

* **Propiedades:**
    * **Invarianza Afín (P1):** La versión definida utilizando la matriz de covarianza $\Sigma$ es invariante afín. La versión original, basada en la norma euclidiana estándar, no es invariante afín, sino solo invariante bajo rotaciones y traslaciones (rígido-cuerpo invariante).
    * **Maximalidad en el Centro (P2):** Para distribuciones C-simétricas (y A-simétricas), la profundidad espacial alcanza su máximo en el centro de simetría.
    * **Monotonicidad Relativa al Punto Más Profundo (P3):** La profundidad espacial decrece monótonamente a medida que un punto se aleja del punto más profundo a lo largo de cualquier rayo que parta del centro.
    * **Desvanecimiento en el Infinito (P4):** La profundidad espacial tiende a cero a medida que la norma de $x$ tiende a infinito.

* **Tipo de Profundidad:** La profundidad espacial se clasifica como una profundidad de **Tipo B**, donde la profundidad se define como el inverso de uno más la esperanza de una función de "distancia" $h(x; X_1, ..., X_r)$, en este caso, la distancia al cuadrado inducida por la matriz de covarianza.

* **Robustez:**  El paper no profundiza en la robustez específica de la profundidad espacial, pero al utilizar la matriz de covarianza (o potencialmente una estimación robusta de la covarianza), se puede intentar mitigar la falta de robustez inherente a la media y la covarianza muestrales.

---

**En resumen:**

* **Profundidad de Mahalanobis:** Útil para distribuciones elípticas, pero su robustez depende de la robustez de las medidas de localización y covarianza utilizadas.
* **Profundidad de Half-Space de Tukey:** Robusta, invariante afín y con propiedades teóricas sólidas, considerada una opción muy favorable en el paper.
* **Profundidad Espacial (L² Depth):** Invariante afín en su versión modificada, con buenas propiedades de centralidad y monotonicidad, pero su robustez podría depender de la estimación de la matriz de covarianza.

El paper concluye que la **profundidad de Half-Space** y la **profundidad de proyección** (no explicada aquí, pero mencionada como relacionada con la profundidad espacial) son las opciones más favorables en general debido a sus propiedades y robustez.