# Algoritmo de Sobel

## 1. Sustento Matem√°tico
El operador de Sobel calcula una aproximaci√≥n discreta del **gradiente** de la intensidad de una imagen. Este m√©todo est√° fundamentado en el concepto de **diferencias finitas** para aproximar las derivadas parciales de la funci√≥n de imagen.

### 1.1 Definici√≥n del Gradiente
Para una funci√≥n continua $f(x, y)$, el gradiente se define como un vector que apunta en la direcci√≥n de mayor cambio de intensidad:

$$\nabla f = \begin{bmatrix} \frac{\partial f}{\partial x} \\ \frac{\partial f}{\partial y} \end{bmatrix}$$

### 1.2 Magnitud del Gradiente
La magnitud del gradiente representa la "fuerza" del borde y se calcula mediante la norma del vector:

$$|\nabla f| = \sqrt{\left( \frac{\partial f}{\partial x} \right)^2 + \left( \frac{\partial f}{\partial y} \right)^2}$$

## 2. Relaci√≥n con M√©todos Num√©ricos: Diferencias Finitas

### 2.1 Aproximaci√≥n de Derivadas
El m√©todo de Sobel utiliza **diferencias finitas ponderadas**, una t√©cnica cl√°sica de m√©todos num√©ricos para aproximar derivadas cuando solo disponemos de datos discretos (como los p√≠xeles de una imagen).

* **Derivada Parcial en X (direcci√≥n horizontal):**
    Representa el cambio de intensidad a lo largo de las columnas:
    $$\frac{\partial f}{\partial x} \approx G_x = \begin{bmatrix} -1 & 0 & +1 \\ -2 & 0 & +2 \\ -1 & 0 & +1 \end{bmatrix} * I$$

* **Derivada Parcial en Y (direcci√≥n vertical):**
    Representa el cambio de intensidad a lo largo de las filas:
    $$\frac{\partial f}{\partial y} \approx G_y = \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ +1 & +2 & +1 \end{bmatrix} * I$$

### 2.2 Interpretaci√≥n como Operador de Diferenciaci√≥n
| Aspecto Num√©rico | Aplicaci√≥n en Sobel |
| :--- | :--- |
| **Diferencias centrales** | M√°scara con valores $-1, 0, +1$ |
| **Suavizado (regularizaci√≥n)** | Coeficientes $1, 2, 1$ (promedio ponderado) |
| **Convoluci√≥n discreta** | Operador aplicado sobre vecindad $3 \times 3$ |

## 3. Pseudoc√≥digo del Algoritmo

### ALGORITMO SOBEL(I: imagen de entrada)

**ENTRADA:** $I[m][n]$ (matriz de intensidades en escala de grises)  
**SALIDA:** $G[m][n]$ (Magnitud del gradiente), $\theta[m][n]$ (Direcci√≥n del gradiente)

**PASOS:**

1. **INICIALIZAR:** Matrices $G_x, G_y, G, \theta$ con ceros (del mismo tama√±o que $I$).
2. **DEFINIR** m√°scaras de convoluci√≥n:

   **M√°scara X:**
   $$\begin{bmatrix} -1 & 0 & +1 \\ -2 & 0 & +2 \\ -1 & 0 & +1 \end{bmatrix}$$

   **M√°scara Y:**
   $$\begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ +1 & +2 & +1 \end{bmatrix}$$

3. **PARA** cada p√≠xel $(i, j)$ donde $1 \leq i \leq m-2$ y $1 \leq j \leq n-2$:
   
   a. **Extraer** vecindad $3 \times 3$ centrada en $(i, j)$: $V = I[i-1:i+2, j-1:j+2]$
   
   b. **Calcular** gradiente horizontal: $G_x[i][j] = \sum (V \odot MascaraX)$
   
   c. **Calcular** gradiente vertical: $G_y[i][j] = \sum (V \odot MascaraY)$
   
   d. **Calcular** magnitud: $G[i][j] = \sqrt{G_x[i][j]^2 + G_y[i][j]^2}$
   
   e. **Calcular** direcci√≥n (opcional): $\theta[i][j] = \arctan2(G_y[i][j], G_x[i][j])$

4. **NORMALIZAR** $G$ al rango $[0, 255]$ si es necesario.
5. **RETORNAR** $G, \theta$

## 4. Desarrollo Te√≥rico (Series de Taylor)

Para fundamentar el error de aproximaci√≥n, analizamos las expansiones de Taylor:

### Para Diferencias Progresivas
$$f(x+h) = f(x) + hf'(x) + \frac{h^2}{2}f''(x) + O(h^3)$$

**Despejando:**
$$f'(x) = \frac{f(x+h) - f(x)}{h} - \frac{h}{2}f''(x) + O(h^2)$$
$$\underbrace{Error: O(h)}_{\text{Primer orden}}$$

### Para Diferencias Regresivas
$$f(x-h) = f(x) - hf'(x) + \frac{h^2}{2}f''(x) - O(h^3)$$

**Despejando:**
$$f'(x) = \frac{f(x) - f(x-h)}{h} + \frac{h}{2}f''(x) + O(h^2)$$
$$\underbrace{Error: O(h)}_{\text{Primer orden}}$$

### Para Diferencias Centrales (Sobel)
Restando las expansiones de Taylor anteriores:
$$f(x+h) - f(x-h) = 2hf'(x) + O(h^3)$$

**Despejando:**
$$f'(x) = \frac{f(x+h) - f(x-h)}{2h} + O(h^2)$$
$$\underbrace{Error: O(h^2)}_{\text{Segundo orden (M√°s preciso)}}$$


## 5. Comparaci√≥n de Operadores

Dependiendo del m√©todo num√©rico elegido para aproximar la derivada, las m√°scaras (kernels) resultantes cambian su estructura y precisi√≥n:

### Sobel con Diferencias Regresivas (No est√°ndar)
Esta versi√≥n utiliza una aproximaci√≥n hacia atr√°s. Aunque es computacionalmente sencilla, no es la m√°s utilizada porque tiende a desplazar visualmente la posici√≥n de los bordes en la imagen:

$$\begin{bmatrix} -1 & 1 & 0 \\ -2 & 2 & 0 \\ -1 & 1 & 0 \end{bmatrix}$$

### Sobel Est√°ndar (Diferencias Centrales)
Es el est√°ndar de la industria y el que se implementa en la mayor√≠a de las librer√≠as. Al usar diferencias centrales, logra una mejor simetr√≠a y un error de segundo orden $O(h^2)$:

**Gradiente en X ($G_x$):**
$$G_x = \begin{bmatrix} -1 & 0 & +1 \\ -2 & 0 & +2 \\ -1 & 0 & +1 \end{bmatrix}$$

**Gradiente en Y ($G_y$):**
$$G_y = \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ +1 & +2 & +1 \end{bmatrix}$$

## 6. Interpretaci√≥n Geom√©trica

Desde una perspectiva geom√©trica, el algoritmo de Sobel no solo detecta cambios, sino que interpreta la imagen como una **superficie continua de intensidades**, donde cada p√≠xel tiene una "altura" basada en su valor de gris.

### 1. El Plano Tangente
Al calcular $G_x$ y $G_y$, el algoritmo est√° estimando la inclinaci√≥n de un **plano tangente** a la superficie de la imagen en el punto $(i, j)$. 
* $G_x$ representa la pendiente del plano en direcci√≥n este-oeste.
* $G_y$ representa la pendiente del plano en direcci√≥n norte-sur.

### 2. El Vector Gradiente
El vector $\nabla f = (G_x, G_y)$ es perpendicular a las l√≠neas de contorno de la imagen. 
* Su **direcci√≥n** $\theta$ apunta hacia donde la intensidad crece m√°s r√°pidamente.
* Su **magnitud** $|G|$ indica qu√© tan "empinada" es la pendiente. Un borde es, simplemente, una zona con una pendiente muy pronunciada.

### 3. Visualizaci√≥n de Bordes
En la pr√°ctica, los bordes detectados corresponden a los lugares donde la superficie de intensidad tiene su m√°xima tasa de cambio. Geom√©tricamente, el operador de Sobel act√∫a como un **filtro de paso alto**, eliminando las zonas planas (frecuencias bajas) y resaltando las transiciones abruptas (frecuencias altas).

# Algoritmo de Canny (Canny Edge Detector)

## 1. Sustento Matem√°tico (Criterios de Optimizaci√≥n)
A diferencia de otros operadores, el detector de bordes de Canny se dise√±√≥ como un problema de optimizaci√≥n matem√°tica. John Canny estableci√≥ tres criterios fundamentales para considerar una detecci√≥n de bordes como "√≥ptima":

### 1.1 Criterios de Calidad
* **Baja Tasa de Error (Detecci√≥n):** El algoritmo debe marcar tantos bordes reales como sea posible y evitar falsos positivos causados por el ruido.
* **Buena Localizaci√≥n:** La distancia entre el p√≠xel marcado como borde y el centro del borde real debe ser m√≠nima.
* **Respuesta √önica:** Un solo borde real no debe generar m√∫ltiples bordes detectados (evitar el "efecto de doble borde").

### 1.2 Formulaci√≥n Matem√°tica
Para lograr esto, se busca una funci√≥n $f(x)$ que maximice el producto de la relaci√≥n se√±al-ruido ($SNR$) y la localizaci√≥n ($L$):

$$SNR = \frac{|\int_{-W}^{W} G(-x)f(x)dx|}{\sigma \sqrt{\int_{-W}^{W} f^2(x)dx}}$$

$$L = \frac{|\int_{-W}^{W} G'(-x)f'(x)dx|}{\sigma \sqrt{\int_{-W}^{W} (f')^2(x)dx}}$$

Donde:
* $G(x)$ representa la se√±al del borde.
* $f(x)$ es el filtro aplicado.
* $\sigma$ es la desviaci√≥n est√°ndar del ruido.

# Algoritmo de Canny (Canny Edge Detector)

## 1. Sustento Matem√°tico (Criterios de Optimizaci√≥n)
A diferencia de otros operadores, el detector de bordes de Canny se dise√±√≥ como un problema de optimizaci√≥n matem√°tica. John Canny estableci√≥ tres criterios fundamentales para considerar una detecci√≥n de bordes como "√≥ptima":

### 1.1 Criterios de Calidad
* **Baja Tasa de Error (Detecci√≥n):** El algoritmo debe marcar tantos bordes reales como sea posible y evitar falsos positivos causados por el ruido.
* **Buena Localizaci√≥n:** La distancia entre el p√≠xel marcado como borde y el centro del borde real debe ser m√≠nima.
* **Respuesta √önica:** Un solo borde real no debe generar m√∫ltiples bordes detectados (evitar el "efecto de doble borde").

### 1.2 Formulaci√≥n Matem√°tica
Para lograr esto, se busca una funci√≥n $f(x)$ que maximice el producto de la relaci√≥n se√±al-ruido ($SNR$) y la localizaci√≥n ($L$):

$$SNR = \frac{|\int_{-W}^{W} G(-x)f(x)dx|}{\sigma \sqrt{\int_{-W}^{W} f^2(x)dx}}$$

$$L = \frac{|\int_{-W}^{W} G'(-x)f'(x)dx|}{\sigma \sqrt{\int_{-W}^{W} (f')^2(x)dx}}$$

Donde:
* $G(x)$ representa la se√±al del borde.
* $f(x)$ es el filtro aplicado.
* $\sigma$ es la desviaci√≥n est√°ndar del ruido.

## 2. Relaci√≥n con M√©todos Num√©ricos: Regularizaci√≥n

### 2.1 Suavizado Gaussiano
Dado que el c√°lculo de derivadas es una operaci√≥n que amplifica el ruido (frecuencias altas), el algoritmo de Canny aplica una etapa de **suavizado** o **regularizaci√≥n** previa. Esto se basa en la convoluci√≥n de la imagen original $I$ con un n√∫cleo (kernel) Gaussiano.

La funci√≥n Gaussiana en 2D se define como:

$$G(x, y) = \frac{1}{2\pi\sigma^2} e^{-\frac{x^2 + y^2}{2\sigma^2}}$$

### 2.2 Discretizaci√≥n del Kernel
En m√©todos num√©ricos, aproximamos esta funci√≥n continua mediante una m√°scara discreta. Por ejemplo, para un $\sigma = 1.4$, un kernel $5 \times 5$ aproximado es:

$$K = \frac{1}{273} \begin{bmatrix} 1 & 4 & 7 & 4 & 1 \\ 4 & 16 & 26 & 16 & 4 \\ 7 & 26 & 41 & 26 & 7 \\ 4 & 16 & 26 & 16 & 4 \\ 1 & 4 & 7 & 4 & 1 \end{bmatrix}$$

### 2.3 Operaci√≥n de Convoluci√≥n
La imagen suavizada $I_{suave}$ se obtiene mediante la suma ponderada en la vecindad del p√≠xel:

$$I_{suave}(i, j) = \sum_{m=-k}^{k} \sum_{n=-k}^{k} I(i-m, j-n) \cdot K(m, n)$$

> **Importante:** Esta etapa reduce el error en la aproximaci√≥n de las derivadas parciales que se calcular√°n en el siguiente paso.

## 3. C√°lculo de Gradiente y Direcci√≥n

Una vez suavizada la imagen, el algoritmo de Canny utiliza operadores de diferenciaci√≥n (como Sobel) para encontrar las variaciones de intensidad en las direcciones $x$ e $y$.

### 3.1 Componentes del Gradiente
Se aplican las m√°scaras de diferencias finitas para obtener las derivadas parciales:

* **Gradiente Horizontal:** $G_x = M_x * I_{suave}$
* **Gradiente Vertical:** $G_y = M_y * I_{suave}$

### 3.2 Magnitud y Orientaci√≥n
A partir de estas componentes, se calcula la magnitud total del cambio y la direcci√≥n del vector gradiente:

* **Magnitud del Gradiente:**
    $$M(i, j) = \sqrt{G_x(i, j)^2 + G_y(i, j)^2}$$

* **√Ångulo de Orientaci√≥n:**
    $$\alpha(i, j) = \arctan\left(\frac{G_y(i, j)}{G_x(i, j)}\right)$$

### 3.3 Cuantizaci√≥n de Direcciones
Para el procesamiento num√©rico posterior, el √°ngulo $\alpha$ se redondea a uno de los cuatro sectores de una vecindad $3 \times 3$:

| √Ångulo Aproximado | Direcci√≥n del Borde |
| :--- | :--- |
| **$0^\circ$** | Horizontal |
| **$45^\circ$** | Diagonal Positiva |
| **$90^\circ$** | Vertical |
| **$135^\circ$** | Diagonal Negativa |

## 4. Supresi√≥n de No M√°ximos (Non-Maximum Suppression)

Este proceso es una t√©cnica de **adelgazamiento de bordes**. Su objetivo es eliminar los p√≠xeles que no forman parte de la cresta del gradiente, dejando √∫nicamente los m√°ximos locales.

### 4.1 L√≥gica Algor√≠tmica
Para cada p√≠xel $(i, j)$, el algoritmo compara su magnitud $M(i, j)$ con las magnitudes de los dos p√≠xeles vecinos en la direcci√≥n del gradiente $\alpha(i, j)$.

* Si $M(i, j)$ es la mayor de las tres, el p√≠xel se conserva.
* Si no es la mayor, se suprime asign√°ndole un valor de $0$.

### 4.2 Esquema de Comparaci√≥n seg√∫n la Direcci√≥n
Dependiendo del √°ngulo cuantizado, se eligen los vecinos espec√≠ficos:

| √Ångulo ($\alpha$) | Vecino 1 | Vecino 2 | Eje de Comparaci√≥n |
| :--- | :---: | :---: | :--- |
| **$0^\circ$** | $(i, j+1)$ | $(i, j-1)$ | Horizontal |
| **$45^\circ$** | $(i-1, j+1)$ | $(i+1, j-1)$ | Diagonal Positiva |
| **$90^\circ$** | $(i-1, j)$ | $(i+1, j)$ | Vertical |
| **$135^\circ$** | $(i-1, j-1)$ | $(i+1, j+1)$ | Diagonal Negativa |

### 4.3 Resultado Num√©rico
El resultado de esta operaci√≥n es una imagen de bordes delgados (frecuentemente llamada *Thin Edges*), definida matem√°ticamente como:

$$M_{thin}(i, j) = \begin{cases} M(i, j) & \text{si } M(i, j) > M_{vecinos} \\ 0 & \text{en otro caso} \end{cases}$$

## 5. Umbralizaci√≥n con Hist√©resis

Este paso determina qu√© bordes son genuinos y cu√°les deben descartarse. A diferencia de una umbralizaci√≥n simple, Canny utiliza dos niveles de decisi√≥n para mantener la conectividad de los bordes.

### 5.1 Definici√≥n de Umbrales
Se establecen dos valores cr√≠ticos:
* **$T_{high}$ (Umbral Superior):** Define los bordes de alta confianza.
* **$T_{low}$ (Umbral Inferior):** Permite la inclusi√≥n de bordes m√°s d√©biles siempre que tengan sustento estructural.

### 5.2 Clasificaci√≥n de P√≠xeles
Para cada p√≠xel de la imagen resultante del paso anterior, se aplica la siguiente l√≥gica:

| Categor√≠a | Condici√≥n de Magnitud ($M$) | Decisi√≥n Final |
| :--- | :--- | :--- |
| **Borde Fuerte** | $M \geq T_{high}$ | Se conserva (P√≠xel de borde definitivo) |
| **Borde D√©bil** | $T_{low} \leq M < T_{high}$ | Se conserva **solo si** est√° conectado a uno fuerte |
| **No-Borde** | $M < T_{low}$ | Se elimina (Valor 0) |

### 5.3 An√°lisis de Conectividad (Hysteresis)
Matem√°ticamente, un p√≠xel d√©bil $W$ en la posici√≥n $(i, j)$ se convierte en borde si existe un p√≠xel fuerte $S$ en su vecindad de Moore ($8$ vecinos):

$$B(i, j) = \begin{cases} 1 & \text{si } M(i, j) \geq T_{high} \\ 1 & \text{si } T_{low} \leq M(i, j) < T_{high} \text{ y } \exists \text{ fuerte en vecindad} \\ 0 & \text{en otro caso} \end{cases}$$

> **Ventaja:** Este m√©todo evita que un borde se "rompa" debido a peque√±as variaciones de intensidad a lo largo de su trayectoria.

## 6. Pseudoc√≥digo del Algoritmo de Canny

**ALGORITMO CANNY_EDGE_DETECTOR($I$, $\sigma$, $T_{low}$, $T_{high}$)**

**ENTRADA:** * $I$: Imagen original en escala de grises.  
* $\sigma$: Desviaci√≥n est√°ndar para el suavizado Gaussiano.  
* $T_{low}, T_{high}$: Umbrales para la hist√©resis.

**SALIDA:** * $E$: Imagen binaria con los bordes detectados.

**PASOS:**

1. **REDUCCI√ìN DE RUIDO:** Aplicar filtro Gaussiano de tama√±o $(2k+1) \times (2k+1)$ para obtener $I_{suave}$.  
   $$I_{suave} = I * G_{\sigma}$$

2. **C√ÅLCULO DE GRADIENTES:** Aplicar m√°scaras de Sobel para obtener derivadas parciales $G_x$ y $G_y$.  
   Calcular magnitud $M$ y direcci√≥n $\alpha$ para cada p√≠xel.

3. **SUPRESI√ìN DE NO M√ÅXIMOS:** **PARA** cada p√≠xel $(i, j)$ en $M$:  
   * Determinar direcci√≥n del gradiente cuantizada (0, 45, 90, 135).  
   * Comparar $M(i, j)$ con vecinos en dicha direcci√≥n.  
   * **SI** $M(i, j)$ no es el m√°ximo local, $M_{thin}(i, j) = 0$.

4. **UMBRALIZACI√ìN DOBLE:** Clasificar p√≠xeles en $M_{thin}$ como **Fuertes**, **D√©biles** o **Suprimidos** seg√∫n $T_{low}$ y $T_{high}$.

5. **SEGUIMIENTO DE BORDES (HISTERESIS):** **PARA** cada p√≠xel d√©bil:  
   * **SI** est√° conectado a un p√≠xel fuerte (vecindad de 8), marcar como **Borde**.  
   * **SINO**, marcar como **Fondo**.

6. **RETORNAR** Imagen binaria final $E$.

## 7. Interpretaci√≥n Geom√©trica y Comparativa

### 7.1 La Geometr√≠a de la Cresta
Desde una perspectiva geom√©trica, mientras que Sobel identifica una "zona de cambio" (una rampa de intensidad), Canny busca la **l√≠nea de cresta** exacta de esa rampa. La supresi√≥n de no m√°ximos act√∫a como una operaci√≥n de proyecci√≥n que colapsa la pendiente del gradiente en un solo punto geom√©trico de m√°xima curvatura.

### 7.2 Comparativa: Sobel vs. Canny

| Caracter√≠stica | Operador de Sobel | Detector de Canny |
| :--- | :--- | :--- |
| **Complejidad** | Baja (1 solo paso) | Alta (m√∫ltiples etapas) |
| **Grosor del Borde** | Grueso (varios p√≠xeles) | Delgado (exactamente 1 p√≠xel) |
| **Sensibilidad al Ruido** | Alta | Baja (gracias al suavizado previo) |
| **Continuidad** | Bordes suelen presentar huecos | Bordes continuos (por hist√©resis) |
| **Precisi√≥n Matem√°tica** | $O(h^2)$ en derivaci√≥n | √ìptima seg√∫n criterios de SNR y Localizaci√≥n |

### 7.3 Conclusi√≥n
El m√©todo de Canny representa la evoluci√≥n del sustento matem√°tico de las **diferencias finitas**. No se limita a calcular la derivada parcial, sino que aplica una cadena de filtros num√©ricos (Gauss, Sobel, Supresi√≥n y Conectividad) para transformar una se√±al ruidosa en una representaci√≥n geom√©trica precisa de los bordes.

# A-Frame: Framework de Realidad Virtual y Gr√°ficos 3D

## 1. Sustento Tecnol√≥gico y el Grafo de Escena

A-Frame es un framework web de c√≥digo abierto basado en la arquitectura **Entity-Component-System (ECS)** que se ejecuta sobre WebGL. Desde la perspectiva de los m√©todos num√©ricos, A-Frame es un motor que gestiona un **Grafo de Escena**, donde cada nodo representa una transformaci√≥n espacial.

### 1.1 El Grafo de Escena como Estructura de Datos
El sistema organiza los objetos en una jerarqu√≠a de √°rbol. La posici√≥n, rotaci√≥n y escala de cualquier entidad se calculan mediante la acumulaci√≥n de transformaciones de sus ancestros.

### 1.2 Justificaci√≥n Matem√°tica: Transformaciones Homog√©neas
Cualquier entidad $E$ en el espacio 3D se representa mediante una **Matriz de Transformaci√≥n Homog√©nea $4 \times 4$**. Esto permite unificar traslaci√≥n, rotaci√≥n y escala en una sola operaci√≥n matricial:

$$M = \begin{bmatrix} 
r_{11} & r_{12} & r_{13} & t_x \\ 
r_{21} & r_{22} & r_{23} & t_y \\ 
r_{31} & r_{32} & r_{33} & t_z \\ 
0 & 0 & 0 & 1 
\end{bmatrix}$$

Donde:
* El subbloque $3 \times 3$ superior izquierdo gestiona la **Rotaci√≥n ($R$)** y la **Escala ($S$)**.
* La columna $[t_x, t_y, t_z]^T$ gestiona la **Traslaci√≥n ($T$)**.

La posici√≥n final de un objeto "hijo" ($P_{final}$) respecto al origen global se obtiene mediante la multiplicaci√≥n de matrices de su jerarqu√≠a:
$$P_{final} = M_{padre} \cdot M_{hijo} \cdot P_{local}$$

### 1.3 Coordenadas y Unidades
A-Frame utiliza un sistema de mano derecha (Right-handed coordinate system):
* **Eje X:** Positivo hacia la derecha.
* **Eje Y:** Positivo hacia arriba.
* **Eje Z:** Positivo hacia afuera de la pantalla (hacia el usuario).

> **Nota de Aplicaci√≥n:** En VR, la unidad de medida est√° estandarizada como $1 \text{ unidad} = 1 \text{ metro}$, lo cual es crucial para la precisi√≥n del c√°lculo de la c√°mara y la percepci√≥n de profundidad del usuario.

## 2. Geometr√≠a Anal√≠tica y √Ålgebra Vectorial

En A-Frame, cada objeto y cada interacci√≥n se define mediante vectores en $\mathbb{R}^3$. La manipulaci√≥n de estos vectores permite resolver problemas de posicionamiento, orientaci√≥n y detecci√≥n de colisiones.

### 2.1 Representaci√≥n Vectorial
Cualquier punto o direcci√≥n en el espacio se define por un vector columna:
$$\vec{v} = \begin{bmatrix} x \\ y \\ z \end{bmatrix}$$

Para garantizar c√°lculos precisos (como en el caso de las direcciones de las luces o la vista de la c√°mara), es necesario trabajar con **Vectores Unitarios (Normalizaci√≥n)**:
$$\hat{u} = \frac{\vec{v}}{\|\vec{v}\|} = \frac{1}{\sqrt{x^2 + y^2 + z^2}} \begin{bmatrix} x \\ y \\ z \end{bmatrix}$$

### 2.2 Operaciones Fundamentales y su Aplicaci√≥n Num√©rica

#### A. Producto Punto (Dot Product)
Se utiliza para calcular el √°ngulo entre dos vectores (como la mirada del usuario y un objeto) y en modelos de iluminaci√≥n:
$$\vec{a} \cdot \vec{b} = \|\vec{a}\| \|\vec{b}\| \cos(\theta)$$
* **Uso:** Si $\vec{a} \cdot \vec{b} > 0$, el objeto est√° frente a la c√°mara; si es $< 0$, est√° detr√°s.

#### B. Producto Cruz (Cross Product)
Es esencial para calcular la **Normal de una Superficie** ($\vec{N}$), lo cual define c√≥mo se renderiza una cara 3D:
$$\vec{N} = \vec{v_1} \times \vec{v_2} = \begin{vmatrix} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ x_1 & y_1 & z_1 \\ x_2 & y_2 & z_2 \end{vmatrix}$$
* **Justificaci√≥n:** El vector resultante es perpendicular al plano formado por $\vec{v_1}$ y $\vec{v_2}$, permitiendo al motor calcular el rebote de la luz.

### 2.3 Interpolaci√≥n Lineal (LERP)
Para animaciones fluidas entre dos puntos $\vec{P_0}$ y $\vec{P_1}$, A-Frame utiliza interpolaci√≥n num√©rica:
$$\vec{P}(t) = (1 - t)\vec{P_0} + t\vec{P_1}$$
Donde $t \in [0, 1]$ representa el paso del tiempo normalizado. Esta es la base de los m√©todos de aproximaci√≥n para trayectorias de movimiento.

## 3. Rotaciones y Representaci√≥n Algebraica: Cuaterniones

En el espacio 3D de A-Frame, las rotaciones se pueden definir mediante √°ngulos de Euler (Giro en X, Y, Z), pero internamente el motor utiliza **Cuaterniones** para realizar los c√°lculos num√©ricos de forma eficiente y evitar el fen√≥meno del *Gimbal Lock* (bloqueo de rotaci√≥n).

### 3.1 El Problema de los √Ångulos de Euler
Cuando rotamos un objeto usando tres √°ngulos ($\phi, \theta, \psi$), la matriz de rotaci√≥n total es el producto de tres matrices individuales:
$$R_{total} = R_z(\psi)R_y(\theta)R_x(\phi)$$
**Justificaci√≥n Num√©rica:** Este m√©todo pierde un grado de libertad cuando dos ejes de rotaci√≥n se alinean (singularidad), lo que impide c√°lculos de trayectoria suaves en sistemas de navegaci√≥n VR.

### 3.2 Soluci√≥n mediante Cuaterniones ($\mathbb{H}$)
Un cuaterni√≥n es un n√∫mero complejo en cuatro dimensiones que representa una rotaci√≥n en torno a un eje arbitrario $\vec{u}$ por un √°ngulo $\alpha$:
$$\mathbf{q} = (s, \vec{v}) = \cos\left(\frac{\alpha}{2}\right) + \sin\left(\frac{\alpha}{2}\right)(u_x\mathbf{i} + u_y\mathbf{j} + u_z\mathbf{k})$$

Donde se cumple la identidad fundamental:
$$\mathbf{i}^2 = \mathbf{j}^2 = \mathbf{k}^2 = \mathbf{ijk} = -1$$

### 3.3 Esferical Linear Interpolation (SLERP)
Para animar rotaciones de manera num√©ricamente estable y uniforme, A-Frame utiliza la f√≥rmula de **SLERP**, que interpola entre dos cuaterniones $q_0$ y $q_1$:

$$SLERP(q_0, q_1, t) = \frac{\sin((1-t)\Omega)}{\sin\Omega}q_0 + \frac{\sin(t\Omega)}{\sin\Omega}q_1$$

Donde:
* $t \in [0, 1]$ es el factor de interpolaci√≥n.
* $\cos\Omega = q_0 \cdot q_1$ (producto escalar de los cuaterniones).

### 3.4 Ventajas en el C√≥mputo Num√©rico
1. **Menor costo computacional:** Multiplicar dos cuaterniones requiere menos operaciones de punto flotante que multiplicar dos matrices $3 \times 3$.
2. **Normalizaci√≥n:** Para que un cuaterni√≥n represente una rotaci√≥n v√°lida, debe ser un cuaterni√≥n unitario:
$$\|\mathbf{q}\| = \sqrt{s^2 + x^2 + y^2 + z^2} = 1$$
Esto permite corregir errores de redondeo num√©rico acumulados simplemente renormalizando el vector resultante.

## 4. El Pipeline de Renderizado: De 3D a la Pantalla 2D

Para que A-Frame pueda mostrar una escena en un monitor o en un visor de VR, debe resolver una serie de ecuaciones que proyectan los puntos del espacio euclidiano $\mathbb{R}^3$ al plano de la pantalla $\mathbb{R}^2$.

### 4.1 Matriz de Vista (View Matrix)
Primero, se transforma todo el universo de la escena para que la c√°mara sea el origen $(0,0,0)$. Si la c√°mara tiene una posici√≥n $C$ y una orientaci√≥n $R$, la matriz de vista $V$ es la inversa de la matriz de transformaci√≥n de la c√°mara:
$$V = (M_{camera})^{-1}$$
Esto justifica que mover la c√°mara hacia adelante es num√©ricamente equivalente a mover todo el mundo hacia atr√°s.

### 4.2 Matriz de Proyecci√≥n de Perspectiva
Para simular el ojo humano, los objetos lejanos deben verse m√°s peque√±os. Esto se logra dividiendo las coordenadas por su profundidad ($z$). La matriz de proyecci√≥n $P$ transforma un volumen truncado (frustum) en un cubo normalizado:

$$P = \begin{bmatrix} 
\frac{1}{aspect \cdot \tan(\frac{fov}{2})} & 0 & 0 & 0 \\ 
0 & \frac{1}{\tan(\frac{fov}{2})} & 0 & 0 \\ 
0 & 0 & -\frac{f+n}{f-n} & -\frac{2fn}{f-n} \\ 
0 & 0 & -1 & 0 
\end{bmatrix}$$

Donde:
* **$fov$:** Campo de visi√≥n (Field of View).
* **$aspect$:** Relaci√≥n de aspecto de la pantalla (ancho/alto).
* **$n, f$:** Planos de corte cercano (near) y lejano (far).

### 4.3 Coordenadas de Dispositivo Normalizadas (NDC)
Tras multiplicar un punto $P_{world}$ por las matrices de Vista y Proyecci√≥n, obtenemos coordenadas en un espacio intermedio. El paso final es la **Divisi√≥n de Perspectiva**:
$$x_{ndc} = \frac{x_{clip}}{w_{clip}}, \quad y_{ndc} = \frac{y_{clip}}{w_{clip}}, \quad z_{ndc} = \frac{z_{clip}}{w_{clip}}$$

Este proceso asegura que todos los puntos visibles queden dentro del rango $[-1, 1]$. Cualquier valor fuera de este rango es descartado num√©ricamente (**Clipping**), optimizando el uso de la GPU.

### 4.4 Resumen del Flujo de Datos
La posici√≥n final de un v√©rtice en pantalla ($v_{screen}$) se calcula como:
$$v_{screen} = P \cdot V \cdot M \cdot v_{local}$$

> **Justificaci√≥n Num√©rica:** Este encadenamiento de multiplicaciones de matrices permite procesar miles de v√©rtices en paralelo mediante hardware especializado (GPU), resolviendo sistemas lineales masivos en milisegundos.

## 5. Modelos Num√©ricos de Iluminaci√≥n y Sombreado (Shading)

El renderizado en A-Frame se basa en calcular la intensidad de color en cada p√≠xel mediante modelos matem√°ticos que aproximan la interacci√≥n de la luz con las superficies.

### 5.1 El Modelo de Reflexi√≥n de Lambert
Para superficies opacas (mate), A-Frame utiliza la ley del coseno de Lambert. La intensidad de iluminaci√≥n $I$ en un punto depende del √°ngulo entre el vector de la luz $\vec{L}$ y el vector normal de la superficie $\vec{N}$.

La aproximaci√≥n num√©rica se resuelve mediante el **Producto Punto**:
$$I = L_c \cdot K_d \cdot \max(0, \hat{N} \cdot \hat{L})$$

Donde:
* $L_c$: Intensidad y color de la fuente de luz.
* $K_d$: Coeficiente de reflexi√≥n difusa del material.
* $\hat{N} \cdot \hat{L}$: Coseno del √°ngulo entre los vectores normalizados. Si el √°ngulo es $> 90^\circ$, el producto punto es negativo y la luz no incide (valor 0).

### 5.2 Modelo Especular (Phong/Blinn-Phong)
Para simular el brillo en materiales como metal o pl√°stico, se a√±ade un componente que depende de la posici√≥n del observador (la c√°mara) $\vec{V}$. Se calcula un vector intermedio llamado **Vector Medio** ($\vec{H}$):

$$\vec{H} = \frac{\vec{L} + \vec{V}}{\|\vec{L} + \vec{V}\|}$$

La intensidad especular se aproxima como:
$$I_{spec} = K_s \cdot (\hat{N} \cdot \hat{H})^n$$
* $n$: Es el exponente de brillo (Shininess). A mayor $n$, el reflejo es m√°s peque√±o y definido.

### 5.3 Implementaci√≥n en Shaders
Estos c√°lculos no se realizan en la CPU, sino que se delegan a la GPU mediante programas llamados **Shaders** escritos en GLSL. Existen dos aproximaciones principales:

| M√©todo | Aplicaci√≥n Num√©rica | Calidad Visual |
| :--- | :--- | :--- |
| **Gouraud Shading** | Calcula la iluminaci√≥n en los v√©rtices e interpola linealmente el color en el resto de la cara. | Baja (bordes visibles) |
| **Phong Shading** | Interpola las **normales** de los v√©rtices y calcula la iluminaci√≥n p√≠xel por p√≠xel. | Alta (suavidad matem√°tica) |

### 5.4 Justificaci√≥n del Error de Aproximaci√≥n
Como A-Frame busca el rendimiento en tiempo real (60 FPS), utiliza estos modelos emp√≠ricos en lugar de resolver la **Ecuaci√≥n de Renderizado de Kajiya** (que es una integral compleja). Esto es un ejemplo cl√°sico de c√≥mo los m√©todos num√©ricos sacrifican exactitud f√≠sica por eficiencia computacional.

## 6. Arquitectura ECS y el Ciclo de Actualizaci√≥n Num√©rica

A-Frame utiliza el patr√≥n **Entity-Component-System (ECS)**, el cual permite desacoplar los datos de la l√≥gica, facilitando el procesamiento masivo de entidades.

### 6.1 Componentes y Sistemas
* **Entidades ($E$):** Identificadores √∫nicos (puntos en el grafo).
* **Componentes ($C$):** Contenedores de datos (ej. posici√≥n, velocidad, masa).
* **Sistemas ($S$):** La l√≥gica que opera sobre los datos. Desde el punto de vista num√©rico, un sistema es un **solucionador** que itera sobre un conjunto de estados.

### 6.2 El M√©todo `tick`: Resoluci√≥n en Tiempo Real
El motor de A-Frame ejecuta una funci√≥n llamada `tick` aproximadamente cada $16.67$ ms (para alcanzar 60 FPS). Este es, en esencia, un paso de tiempo discreto $\Delta t$:

$$S_{t+1} = S_t + f(S_t, \Delta t)$$

Donde $f$ representa la funci√≥n de actualizaci√≥n (f√≠sica, animaciones, IA). Al ser un m√©todo iterativo, si $\Delta t$ var√≠a (debido a ca√≠das de rendimiento), el sistema debe compensarlo para mantener la consistencia temporal, una t√©cnica com√∫n en la resoluci√≥n de ecuaciones diferenciales ordinarias (EDO) para simulaciones f√≠sicas.

## 6. Arquitectura ECS y el Ciclo de Actualizaci√≥n Num√©rica

A-Frame utiliza el patr√≥n **Entity-Component-System (ECS)**, el cual permite desacoplar los datos de la l√≥gica, facilitando el procesamiento masivo de entidades.

### 6.1 Componentes y Sistemas
* **Entidades ($E$):** Identificadores √∫nicos (puntos en el grafo).
* **Componentes ($C$):** Contenedores de datos (ej. posici√≥n, velocidad, masa).
* **Sistemas ($S$):** La l√≥gica que opera sobre los datos. Desde el punto de vista num√©rico, un sistema es un **solucionador** que itera sobre un conjunto de estados.

### 6.2 El M√©todo `tick`: Resoluci√≥n en Tiempo Real
El motor de A-Frame ejecuta una funci√≥n llamada `tick` aproximadamente cada $16.67$ ms (para alcanzar 60 FPS). Este es, en esencia, un paso de tiempo discreto $\Delta t$:

$$S_{t+1} = S_t + f(S_t, \Delta t)$$

Donde $f$ representa la funci√≥n de actualizaci√≥n (f√≠sica, animaciones, IA). Al ser un m√©todo iterativo, si $\Delta t$ var√≠a (debido a ca√≠das de rendimiento), el sistema debe compensarlo para mantener la consistencia temporal, una t√©cnica com√∫n en la resoluci√≥n de ecuaciones diferenciales ordinarias (EDO) para simulaciones f√≠sicas.

## 7. Implementaci√≥n de una Escena Base

A continuaci√≥n, se presenta la estructura declarativa de una escena. Aunque el usuario escribe etiquetas tipo HTML, el motor traduce cada etiqueta a los objetos matem√°ticos (matrices, mallas y vectores) descritos anteriormente.

```html
<a-scene>
  <a-sky color="#ECECEC"></a-sky>

  <a-box position="-1 0.5 -3" 
         rotation="0 45 0" 
         color="#4CC3D9"
         shadow>
  </a-box>

  <a-plane position="0 0 -4" 
           rotation="-90 0 0" 
           width="4" 
           height="4" 
           color="#7BC8A4">
  </a-plane>

  <a-camera position="0 1.6 0"></a-camera>
</a-scene>

## 7. Implementaci√≥n de una Escena Base

A continuaci√≥n, se presenta la estructura declarativa de una escena. Aunque el usuario escribe etiquetas tipo HTML, el motor traduce cada etiqueta a los objetos matem√°ticos (matrices, mallas y vectores) descritos anteriormente.

```html
<a-scene>
  <a-sky color="#ECECEC"></a-sky>

  <a-box position="-1 0.5 -3" 
         rotation="0 45 0" 
         color="#4CC3D9"
         shadow>
  </a-box>

  <a-plane position="0 0 -4" 
           rotation="-90 0 0" 
           width="4" 
           height="4" 
           color="#7BC8A4">
  </a-plane>

  <a-camera position="0 1.6 0"></a-camera>
</a-scene>

### 7.1 Resumen de la Justificaci√≥n
El uso de **A-Frame** en el contexto de **M√©todos Num√©ricos** permite:

* **Visualizaci√≥n de Transformaciones:** Observar en tiempo real el efecto de las multiplicaciones matriciales y la composici√≥n de transformaciones lineales.
* **Simulaci√≥n de Modelos F√≠sicos:** Implementar algoritmos de colisi√≥n, gravedad y movimiento basados en **integraci√≥n num√©rica** (como el m√©todo de Euler o Verlet).
* **Abstracci√≥n de WebGL:** Manipular el pipeline de renderizado (shading, proyecci√≥n y rasterizaci√≥n) sin la necesidad de escribir manualmente miles de l√≠neas de c√≥digo de bajo nivel para la GPU, permitiendo enfocarse en la l√≥gica matem√°tica del espacio tridimensional.

---

> **Conclusi√≥n del M√≥dulo:** Tanto los operadores de gradiente (**Sobel**), el algoritmo de optimizaci√≥n de bordes (**Canny**), como los motores de renderizado (**A-Frame**), comparten una base com√∫n: la discretizaci√≥n de funciones continuas para su resoluci√≥n mediante c√≥mputo digital. Mientras los primeros analizan la se√±al, el √∫ltimo la sintetiza, pero ambos dependen del rigor del √°lgebra lineal y el c√°lculo diferencial.

# Three.js: Motor de Gr√°ficos Imperativo y √Ålgebra Lineal

## 1. Fundamentos Matem√°ticos y la Tuber√≠a de Datos (Pipeline)

A diferencia de los frameworks declarativos, **Three.js** es una biblioteca de bajo nivel que permite la manipulaci√≥n directa de los b√∫feres de memoria y las operaciones matriciales. Su funcionamiento se basa en la resoluci√≥n de transformaciones en espacios de $n$-dimensiones.

### 1.1 El Objeto `BufferGeometry`: Eficiencia en Memoria
Desde la perspectiva num√©rica, Three.js no trata a los objetos como entidades abstractas, sino como **arreglos de datos tipados (TypedArrays)**. Una malla (mesh) se define por un conjunto de atributos vectoriales almacenados de forma contigua para maximizar el *throughput* de la GPU:

* **V√©rtices ($V$):** Un vector plano $[x_1, y_1, z_1, ..., x_n, y_n, z_n] \in \mathbb{R}^{3n}$.
* **Normales ($N$):** Vectores unitarios para el c√°lculo de iluminaci√≥n.
* **√çndices ($I$):** Define la topolog√≠a de la malla mediante la conectividad de los v√©rtices para formar tri√°ngulos.

### 1.2 La Cadena de Transformaciones (Modelo-Vista-Proyecci√≥n)
Para renderizar un solo punto, Three.js debe resolver la ecuaci√≥n fundamental de la computaci√≥n gr√°fica, que es una cadena de multiplicaciones de matrices de $4 \times 4$:

$$P_{clip} = M_{proj} \cdot M_{view} \cdot M_{model} \cdot v_{local}$$

Cada componente tiene una justificaci√≥n num√©rica espec√≠fica:
1. **$M_{model}$ (World Matrix):** Transforma coordenadas locales al espacio global mediante traslaci√≥n, rotaci√≥n y escala.
2. **$M_{view}$ (Camera Matrix):** Es la matriz inversa de la posici√≥n de la c√°mara ($C^{-1}$), que reorienta el universo respecto al observador.
3. **$M_{proj}$ (Projection Matrix):** Aplica la distorsi√≥n de perspectiva, mapeando un volumen arbitrario a coordenadas normalizadas $[-1, 1]$.

### 1.3 El Grafo de Escena y Matrices Globales
Three.js utiliza un sistema de actualizaci√≥n recursiva para las matrices. Para cualquier objeto $i$, su matriz global $M_{global}^i$ se define como:

$$M_{global}^i = M_{global}^{padre} \cdot M_{local}^i$$

> **Dato para M√©todos Num√©ricos:** Para optimizar el rendimiento, Three.js no recalcula estas matrices en cada frame a menos que la propiedad `.matrixWorldNeedsUpdate` sea verdadera, lo que ejemplifica una estrategia de **ahorro computacional** en sistemas din√°micos.

## 2. Geometr√≠a Computacional: Raycasting e Intersecci√≥n

El **Raycasting** es la t√©cnica que utiliza Three.js para resolver problemas de interactividad y detecci√≥n de colisiones. Matem√°ticamente, consiste en proyectar una l√≠nea recta en el espacio y encontrar el punto de intersecci√≥n con la geometr√≠a m√°s cercana.

### 2.1 Ecuaci√≥n Param√©trica del Rayo
Un rayo se define como una funci√≥n lineal que depende de un par√°metro de tiempo o distancia $t$:

$$\vec{R}(t) = \vec{O} + t\vec{D}$$

Donde:
* $\vec{O}$: Es el origen del rayo (usualmente la posici√≥n de la c√°mara).
* $\vec{D}$: Es el vector de direcci√≥n unitario ($\|\vec{D}\| = 1$).
* $t$: Es la distancia desde el origen ($t \geq 0$).

### 2.2 Algoritmo de Intersecci√≥n Rayo-Tri√°ngulo (M√∂ller-Trumbore)
Para determinar si un rayo golpea un objeto, Three.js debe resolver si el rayo intersecta alguno de los tri√°ngulos de la malla. Dado un tri√°ngulo con v√©rtices $V_1, V_2, V_3$, un punto $P$ dentro del tri√°ngulo se define por sus **Coordenadas Baric√©ntricas** $(u, v)$:

$$P(u, v) = (1 - u - v)V_1 + uV_2 + vV_3$$

Igualando la ecuaci√≥n del rayo con la del plano del tri√°ngulo, el sistema de ecuaciones lineales resultante es:

$$\vec{O} + t\vec{D} = (1 - u - v)V_1 + uV_2 + vV_3$$

Este sistema se resuelve num√©ricamente para $t, u, v$ mediante la regla de Cramer, lo que permite a la GPU o CPU determinar:
1. **Si hay intersecci√≥n:** Si $u \geq 0, v \geq 0$ y $u + v \leq 1$.
2. **La distancia exacta:** El valor de $t$.

### 2.3 Frustum Culling: Optimizaci√≥n por Descarte
Antes de realizar los c√°lculos costosos de intersecci√≥n, Three.js aplica m√©todos de **delimitaci√≥n volum√©trica**. Se envuelve cada objeto en una **Esfera de Delimitaci√≥n (Bounding Sphere)** m√≠nima:

$$\|\vec{P} - \vec{C}\|^2 \leq r^2$$

**Justificaci√≥n Num√©rica:** Es mucho m√°s barato computacionalmente verificar la intersecci√≥n con una esfera (una sola ecuaci√≥n cuadr√°tica) que con miles de tri√°ngulos. Si el rayo no toca la esfera, se descarta el objeto inmediatamente, reduciendo la complejidad algor√≠tmica de $O(n)$ a $O(1)$ para ese objeto.

## 3. Interpolaci√≥n y Curvas Param√©tricas

En Three.js, la animaci√≥n y el movimiento de c√°maras u objetos se basan en la aproximaci√≥n de trayectorias mediante funciones polin√≥micas. Esto es fundamental para evitar movimientos "rob√≥ticos" y asegurar la continuidad en las derivadas de la posici√≥n (velocidad y aceleraci√≥n).

### 3.1 Curvas de B√©zier (Interpolaci√≥n Polin√≥mica)
Para definir trayectorias suaves, se utilizan las **Curvas de B√©zier**, que se basan en los **Polinomios de Bernstein**. Una curva de tercer grado (c√∫bica) se define mediante cuatro puntos de control $P_0, P_1, P_2, P_3$:

$$B(t) = (1-t)^3 P_0 + 3(1-t)^2 t P_1 + 3(1-t) t^2 P_2 + t^3 P_3, \quad t \in [0, 1]$$

**Justificaci√≥n Num√©rica:** Esta f√≥rmula garantiza que la curva sea tangente a los segmentos de control, permitiendo un control geom√©trico preciso de la trayectoria sin necesidad de resolver sistemas de ecuaciones globales pesados.

### 3.2 Splines de Catmull-Rom
A diferencia de B√©zier, donde la curva no siempre pasa por los puntos de control, Three.js utiliza frecuentemente **Catmull-Rom Splines** para que la trayectoria pase exactamente por los nodos definidos. La ecuaci√≥n local para un segmento entre $P_i$ y $P_{i+1}$ es:

$$P(t) = \frac{1}{2} \begin{bmatrix} 1 & t & t^2 & t^3 \end{bmatrix} \begin{bmatrix} 0 & 2 & 0 & 0 \\ -1 & 0 & 1 & 0 \\ 2 & -5 & 4 & -1 \\ -1 & 3 & -3 & 1 \end{bmatrix} \begin{bmatrix} P_{i-1} \\ P_i \\ P_{i+1} \\ P_{i+2} \end{bmatrix}$$

* **Continuidad $C^1$:** Este m√©todo asegura que la primera derivada (velocidad) sea continua en todos los puntos, eliminando cambios bruscos de direcci√≥n.

### 3.3 El Ciclo de Animaci√≥n y Delta Time ($\Delta t$)
En m√©todos num√©ricos, la integraci√≥n del movimiento requiere un paso de tiempo. Three.js utiliza el reloj del sistema para calcular el `delta`:

$$\text{Posici√≥n}_{nuevo} = \text{Posici√≥n}_{anterior} + (\text{Velocidad} \cdot \Delta t)$$

Si la velocidad no es constante, se aplican m√©todos de integraci√≥n como **Euler Simple** o, en simulaciones m√°s avanzadas dentro de Three.js, **Integraci√≥n de Verlet**, que es m√°s estable num√©ricamente para sistemas de part√≠culas:

$$x_{t+ \Delta t} = 2x_t - x_{t- \Delta t} + a \cdot \Delta t^2$$

## 4. Iluminaci√≥n Avanzada y Mapeo de Normales (Normal Mapping)

En Three.js, la apariencia de una superficie no depende solo de la cantidad de tri√°ngulos, sino de c√≥mo se manipulan los vectores normales en el nivel de los fragmentos (p√≠xeles). Esto se basa en la aplicaci√≥n de **√Ålgebra Lineal** para simular micro-geometr√≠a.

### 4.1 Espacio Tangente y Base TBN
Para aplicar un mapa de normales (una textura que indica hacia d√≥nde "mira" cada p√≠xel), Three.js debe construir un sistema de coordenadas local para cada punto de la superficie, llamado **Espacio Tangente**. Este se define por tres vectores ortonormales:
* **$\vec{T}$ (Tangente):** Vector en la direcci√≥n del eje U de la textura.
* **$\vec{B}$ (Bitangente):** Vector en la direcci√≥n del eje V de la textura.
* **$\vec{N}$ (Normal):** Vector perpendicular a la cara.

Estos vectores forman la **Matriz TBN**, que permite transformar vectores del "Espacio de Textura" al "Espacio del Mundo":
$$M_{TBN} = \begin{bmatrix} T_x & B_x & N_x \\ T_y & B_y & N_y \\ T_z & B_z & N_z \end{bmatrix}$$

### 4.2 Perturbaci√≥n de la Normal
El valor de color de un p√≠xel en el mapa de normales $(R, G, B)$ se decodifica para obtener un vector unitario en el rango $[-1, 1]$:
$$\vec{n}_{local} = \begin{bmatrix} 2R - 1 \\ 2G - 1 \\ 2B - 1 \end{bmatrix}$$

La normal final utilizada para el c√°lculo de iluminaci√≥n ($\vec{n}_{final}$) es el producto de la matriz TBN por este vector local:
$$\vec{n}_{final} = M_{TBN} \cdot \vec{n}_{local}$$

### 4.3 El Modelo de PBR (Physically Based Rendering)
Three.js utiliza en su `MeshStandardMaterial` un modelo num√©rico avanzado llamado **Ecuaci√≥n de Reflectancia**, que es una integral de iluminaci√≥n:
$$L_o(p, \omega_o) = \int_{\Omega} f_r(p, \omega_i, \omega_o) L_i(p, \omega_i) (\vec{n} \cdot \omega_i) d\omega_i$$

**Justificaci√≥n Num√©rica:** Como resolver esta integral en tiempo real es imposible, Three.js utiliza una aproximaci√≥n de **Suma de Riemann** o **Importancia de Muestreo (Importance Sampling)** para simular c√≥mo la luz se refleja en micro-facetas, bas√°ndose en la funci√≥n de distribuci√≥n de micro-facetas de **Trowbridge-Reitz (GGX)**.

### 4.4 C√°lculo de Sombras (Shadow Mapping)
Las sombras se calculan mediante una comparaci√≥n de profundidad ($z$). Para cada p√≠xel, el motor resuelve:
$$Visible = \begin{cases} 1 & \text{si } z_{p√≠xel} \leq z_{shadow\_map} + \epsilon \\ 0 & \text{en otro caso} \end{cases}$$
*Donde $\epsilon$ es un factor de sesgo (bias) introducido para corregir errores de precisi√≥n num√©rica de punto flotante.*

## 5. El Ciclo de Renderizado (Render Loop) y Estabilidad Num√©rica

En Three.js, la generaci√≥n de im√°genes no es un evento est√°tico, sino un proceso iterativo continuo que debe mantener la estabilidad num√©rica para evitar errores de precisi√≥n o "saltos" en la simulaci√≥n.

### 5.1 Discretizaci√≥n del Tiempo
Cada iteraci√≥n del ciclo de renderizado representa un paso de tiempo discreto $\Delta t$. Para que las simulaciones f√≠sicas sean consistentes, Three.js utiliza el m√©todo de `requestAnimationFrame`, que busca sincronizarse con la tasa de refresco del monitor.

La actualizaci√≥n del estado del sistema se define como:
$$X_{t+1} = X_t + \int_{t}^{t+\Delta t} v(t) dt \approx X_t + v_t \cdot \Delta t$$

### 5.2 Manejo del Error de Redondeo (Floating Point Precision)
Dado que WebGL utiliza precisi√≥n de punto flotante de 32 bits, en escenas con escalas masivas (ej. simulaciones astron√≥micas) se presenta el error de **Z-Fighting**.
Este fen√≥meno ocurre cuando dos profundidades $z_1$ y $z_2$ son tan cercanas que la precisi√≥n num√©rica no puede distinguirlas:
$$|z_1 - z_2| < \epsilon$$
Donde $\epsilon$ es la resoluci√≥n del b√∫fer de profundidad. Three.js permite mitigar esto mediante el uso de un **Logarithmic Depth Buffer**, que redistribuye la precisi√≥n de forma no lineal (logar√≠tmica) para dar m√°s detalle a objetos lejanos.

## 5. El Ciclo de Renderizado (Render Loop) y Estabilidad Num√©rica

En Three.js, la generaci√≥n de im√°genes no es un evento est√°tico, sino un proceso iterativo continuo que debe mantener la estabilidad num√©rica para evitar errores de precisi√≥n o "saltos" en la simulaci√≥n.

### 5.1 Discretizaci√≥n del Tiempo
Cada iteraci√≥n del ciclo de renderizado representa un paso de tiempo discreto $\Delta t$. Para que las simulaciones f√≠sicas sean consistentes, Three.js utiliza el m√©todo de `requestAnimationFrame`, que busca sincronizarse con la tasa de refresco del monitor.

La actualizaci√≥n del estado del sistema se define como:
$$X_{t+1} = X_t + \int_{t}^{t+\Delta t} v(t) dt \approx X_t + v_t \cdot \Delta t$$

### 5.2 Manejo del Error de Redondeo (Floating Point Precision)
Dado que WebGL utiliza precisi√≥n de punto flotante de 32 bits, en escenas con escalas masivas (ej. simulaciones astron√≥micas) se presenta el error de **Z-Fighting**.
Este fen√≥meno ocurre cuando dos profundidades $z_1$ y $z_2$ son tan cercanas que la precisi√≥n num√©rica no puede distinguirlas:
$$|z_1 - z_2| < \epsilon$$
Donde $\epsilon$ es la resoluci√≥n del b√∫fer de profundidad. Three.js permite mitigar esto mediante el uso de un **Logarithmic Depth Buffer**, que redistribuye la precisi√≥n de forma no lineal (logar√≠tmica) para dar m√°s detalle a objetos lejanos.

## 6. Estructura de Implementaci√≥n y C√≥digo Base

A diferencia de A-Frame, en Three.js la configuraci√≥n de la escena requiere la instanciaci√≥n expl√≠cita de los objetos matem√°ticos (C√°mara, Escena, Renderizador).

### 6.1 Componentes Esenciales del Script
El siguiente bloque muestra c√≥mo se traduce la teor√≠a de matrices y vectores a c√≥digo funcional:

```javascript
// 1. Inicializaci√≥n del Motor (Espacio de Renderizado)
const scene = new THREE.Scene();
const camera = new THREE.PerspectiveCamera(75, window.innerWidth / window.innerHeight, 0.1, 1000);
const renderer = new THREE.WebGLRenderer();

// 2. Creaci√≥n de Geometr√≠a Discreta
// Se define la topolog√≠a de la malla (8 v√©rtices, 12 caras triangulares)
const geometry = new THREE.BoxGeometry(1, 1, 1);

// 3. Definici√≥n del Material (Modelo de Iluminaci√≥n)
// Utiliza algoritmos de sombreado de fragmentos para calcular la luz
const material = new THREE.MeshStandardMaterial({ color: 0x00ff00 });

// 4. Creaci√≥n de la Malla (Mesh = Geometr√≠a + Material)
const cube = new THREE.Mesh(geometry, material);
scene.add(cube);

// 5. Bucle de Animaci√≥n (M√©todo Iterativo)
function animate() {
  requestAnimationFrame(animate);

  // Aplicaci√≥n de rotaci√≥n incremental (Transformaci√≥n de matriz local)
  cube.rotation.x += 0.01;
  cube.rotation.y += 0.01;

  // Resoluci√≥n de la Matriz de Proyecci√≥n y dibujado en el Canvas
  renderer.render(scene, camera);
}
animate();

In [None]:
from IPython.display import display, HTML

codigo_seguro = """
<div id="app-container">
    <div class="controls">
        <button id="btn-glasses">üëì Lentes</button>
        <button id="btn-mustache">ü•∏ Bigote</button>
        <button id="btn-hat">üé© Sombrero</button>
        <button id="btn-mole">üü§ Lunar</button>
        <button id="btn-points">üü¢ Puntos (Debug)</button>
    </div>

    <div class="viewport">
        <video id="input-video" style="display:none" autoplay muted playsinline></video>
        <canvas id="output-canvas"></canvas>
        <div id="status-text">Iniciando sistema...</div>
    </div>
</div>

<script src="https://cdn.jsdelivr.net/npm/@mediapipe/face_mesh/face_mesh.js"></script>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/camera_utils/camera_utils.js"></script>

<style>
    #app-container {
        font-family: sans-serif;
        width: 640px;
        margin: 0 auto;
        background: #222;
        padding: 10px;
        border-radius: 8px;
        color: white;
    }

    .viewport {
        position: relative;
        width: 640px;
        height: 480px;
        background: black;
        border: 2px solid #444;
        overflow: hidden;
    }

    canvas {
        width: 100%;
        height: 100%;
        object-fit: cover;
    }

    .controls {
        display: flex;
        gap: 5px;
        margin-bottom: 10px;
        justify-content: center;
        flex-wrap: wrap;
    }

    button {
        background: #444;
        color: white;
        border: 1px solid #666;
        padding: 8px 12px;
        cursor: pointer;
        border-radius: 4px;
        font-weight: bold;
    }

    button:hover { background: #555; }
    
    /* Clase para bot√≥n activo (Verde) */
    button.active {
        background: #00e676;
        color: black;
        border-color: #00a152;
    }

    #status-text {
        position: absolute;
        bottom: 10px;
        left: 10px;
        background: rgba(0, 0, 0, 0.7);
        padding: 5px 10px;
        border-radius: 4px;
        font-size: 14px;
        pointer-events: none;
    }
</style>

<script>
(function() {
    // 1. Configuraci√≥n Inicial
    const container = document.getElementById('app-container');
    const videoElement = container.querySelector('#input-video');
    const canvasElement = container.querySelector('#output-canvas');
    const ctx = canvasElement.getContext('2d');
    const statusText = container.querySelector('#status-text');
    
    // Forzamos tama√±o
    canvasElement.width = 640;
    canvasElement.height = 480;

    // Estado de filtros
    const state = {
        glasses: false,
        mustache: false,
        hat: false,
        mole: false,
        points: false // Activado por defecto para probar
    };

    // 2. Conectar Botones
    function setupButton(id, key) {
        const btn = container.querySelector('#' + id);
        if(!btn) return;
        btn.onclick = () => {
            state[key] = !state[key];
            // Visualmente cambiar el bot√≥n
            if(state[key]) btn.classList.add('active');
            else btn.classList.remove('active');
            console.log("Toggle " + key + ": " + state[key]);
        };
    }

    setupButton('btn-glasses', 'glasses');
    setupButton('btn-mustache', 'mustache');
    setupButton('btn-hat', 'hat');
    setupButton('btn-mole', 'mole');
    setupButton('btn-points', 'points');

    // 3. L√≥gica de Dibujo (Filtros 2D)
    function drawScene(results) {
        // Limpiar
        ctx.clearRect(0, 0, canvasElement.width, canvasElement.height);
        
        // A. Dibujar la imagen de la c√°mara DE FONDO
        ctx.drawImage(results.image, 0, 0, canvasElement.width, canvasElement.height);

        // B. Verificar si hay cara
        if (results.multiFaceLandmarks && results.multiFaceLandmarks.length > 0) {
            statusText.innerText = "‚úÖ Rostro detectado - Filtros activos";
            statusText.style.color = "#00e676";
            
            const landmarks = results.multiFaceLandmarks[0];
            drawFilters(landmarks);
        } else {
            statusText.innerText = "‚ö†Ô∏è Buscando rostro... (Ac√©rcate a la c√°mara)";
            statusText.style.color = "orange";
        }
    }

    function drawFilters(landmarks) {
        const w = canvasElement.width;
        const h = canvasElement.height;

        // Puntos Clave
        const leftEye = landmarks[33];
        const rightEye = landmarks[263];
        const noseTip = landmarks[1];
        const upperLip = landmarks[13];
        const forehead = landmarks[10];
        const leftCheek = landmarks[234];

        // Matem√°ticas para posici√≥n y tama√±o
        const cx = (leftEye.x + rightEye.x) / 2 * w;
        const cy = (leftEye.y + rightEye.y) / 2 * h;
        const dx = (rightEye.x - leftEye.x) * w;
        const dy = (rightEye.y - leftEye.y) * h;
        const dist = Math.sqrt(dx*dx + dy*dy); // Distancia entre ojos
        const angle = Math.atan2(dy, dx); // Inclinaci√≥n de la cabeza

        ctx.save(); // Guardar estado para rotaciones

        // --- 1. PUNTOS (DEBUG) ---
        if (state.points) {
            ctx.fillStyle = "#00FF00";
            for (let point of landmarks) {
                ctx.beginPath();
                ctx.arc(point.x * w, point.y * h, 1, 0, 2 * Math.PI);
                ctx.fill();
            }
        }

        // --- 2. LENTES ---
        if (state.glasses) {
            ctx.translate(cx, cy);
            ctx.rotate(angle);
            
            ctx.strokeStyle = "black";
            ctx.lineWidth = 5;
            // Marco Izq
            ctx.strokeRect(-dist*0.9, -dist*0.3, dist*0.8, dist*0.5);
            // Marco Der
            ctx.strokeRect(dist*0.1, -dist*0.3, dist*0.8, dist*0.5);
            // Puente
            ctx.beginPath();
            ctx.moveTo(-dist*0.1, 0);
            ctx.lineTo(dist*0.1, 0);
            ctx.stroke();

            ctx.rotate(-angle); // Deshacer rotaci√≥n
            ctx.translate(-cx, -cy); // Deshacer traslaci√≥n
        }

        // --- 3. BIGOTE ---
        if (state.mustache) {
            const mx = upperLip.x * w;
            const my = upperLip.y * h;
            
            ctx.translate(mx, my);
            ctx.rotate(angle);

            ctx.fillStyle = "#3e2723";
            ctx.beginPath();
            ctx.ellipse(0, -dist*0.1, dist*0.6, dist*0.15, 0, 0, Math.PI*2);
            ctx.fill();

            ctx.rotate(-angle);
            ctx.translate(-mx, -my);
        }

        // --- 4. SOMBRERO ---
        if (state.hat) {
            const hx = forehead.x * w;
            const hy = forehead.y * h;

            ctx.translate(hx, hy);
            ctx.rotate(angle);

            ctx.fillStyle = "#1a237e"; // Azul oscuro
            // Copa
            ctx.fillRect(-dist*0.8, -dist*1.5, dist*1.6, dist*1.0);
            // Ala
            ctx.fillRect(-dist*1.2, -dist*0.5, dist*2.4, dist*0.2);

            ctx.rotate(-angle);
            ctx.translate(-hx, -hy);
        }

        // --- 5. LUNAR ---
        if (state.mole) {
            const lx = leftCheek.x * w;
            const ly = leftCheek.y * h;
            ctx.fillStyle = "black";
            ctx.beginPath();
            ctx.arc(lx + dist*0.2, ly, dist*0.08, 0, Math.PI*2);
            ctx.fill();
        }

        ctx.restore();
    }

    // 4. Iniciar MediaPipe FaceMesh
    const faceMesh = new FaceMesh({
        locateFile: (file) => `https://cdn.jsdelivr.net/npm/@mediapipe/face_mesh/${file}`
    });

    faceMesh.setOptions({
        maxNumFaces: 1,
        refineLandmarks: true,
        minDetectionConfidence: 0.5,
        minTrackingConfidence: 0.5
    });

    faceMesh.onResults(drawScene);

    // 5. Iniciar C√°mara
    const camera = new Camera(videoElement, {
        onFrame: async () => {
            await faceMesh.send({image: videoElement});
        },
        width: 640,
        height: 480
    });

    statusText.innerText = "Solicitando c√°mara...";
    camera.start()
        .then(() => statusText.innerText = "C√°mara activa. Cargando modelo...")
        .catch(err => statusText.innerText = "Error de c√°mara: " + err);

})();
</script>
"""

display(HTML(codigo_seguro))

# MediaPipe: Inferencia Perceptual y Optimizaci√≥n de Grafos

## 1. Fundamentos de Visi√≥n Computacional y Redes Convolucionales

MediaPipe es un framework basado en el paradigma de **ML Pipelines**. Su funci√≥n principal en el contexto num√©rico es la **regresi√≥n de coordenadas**, donde una imagen de entrada $I$ se procesa para obtener un conjunto de vectores de caracter√≠sticas.

### 1.1 Inferencia como Funci√≥n de Mapeo
La detecci√≥n de una cara o mano se puede expresar como una funci√≥n $f$ que mapea el espacio de la imagen al espacio de par√°metros:
$$f(I) = \Theta$$
Donde:
* $I \in \mathbb{R}^{W \times H \times 3}$: Es la matriz de p√≠xeles (ancho, alto, canales RGB).
* $\Theta = \{\vec{P}_1, \vec{P}_2, ..., \vec{P}_n\}$: Es el conjunto de puntos clave (landmarks), donde cada $\vec{P}_i = (x, y, z)$.

### 1.2 La Convoluci√≥n Discreta (Sustento del Modelo)
Para extraer caracter√≠sticas de la imagen, MediaPipe utiliza **Redes Neuronales Convolucionales (CNN)**. La operaci√≥n fundamental es la convoluci√≥n discreta entre la imagen $I$ y un filtro (kernel) $K$ de tama√±o $m \times n$:

$$(I * K)(i, j) = \sum_{m} \sum_{n} I(i-m, j-n) \cdot K(m, n)$$

**Justificaci√≥n Num√©rica:** Este proceso act√∫a como un detector de gradientes y patrones (similar a los filtros de Sobel/Canny pero con pesos aprendidos), reduciendo la dimensionalidad de la imagen a un vector de caracter√≠sticas abstractas.

### 1.3 El Grafo de Flujo (Calculators)
MediaPipe organiza el procesamiento en un **Grafo Ac√≠clico Dirigido (DAG)**. Cada nodo es una "calculadora" que recibe un paquete de datos $T$ (Tensor) y emite un resultado tras aplicar una transformaci√≥n num√©rica:
$$T_{out} = \phi(T_{in})$$
Esta arquitectura permite el **paralelismo masivo**, resolviendo m√∫ltiples etapas de la tuber√≠a de datos simult√°neamente.

### 1.4 Normalizaci√≥n y Coordenadas Relativas
MediaPipe no entrega coordenadas en p√≠xeles, sino valores normalizados en el rango $[0, 1]$. La conversi√≥n a coordenadas de pantalla (necesaria para Three.js) es una **Transformaci√≥n Lineal Escalar**:

$$P_{pixel} = \begin{bmatrix} x_{norm} \cdot W \\ y_{norm} \cdot H \\ z_{norm} \cdot W \end{bmatrix}$$

*Donde $W$ y $H$ son el ancho y alto de la imagen.* La coordenada $z$ se calcula de manera relativa al centro de gravedad del objeto detectado, permitiendo una estimaci√≥n de profundidad sin necesidad de una c√°mara est√©reo.

## 2. El Modelo Face Mesh y Regresi√≥n de Puntos Clave

El sistema **Face Mesh** de MediaPipe predice la posici√≥n de 468 puntos (landmarks) en 3D. A diferencia de un detector de objetos simple que solo encuentra una caja delimitadora, este modelo realiza una **Regresi√≥n de Coordenadas de Alta Dimensionalidad**.

### 2.1 Funci√≥n de P√©rdida y Optimizaci√≥n
Para que el modelo aprenda a colocar los puntos correctamente, durante su entrenamiento se minimiza una **Funci√≥n de P√©rdida (Loss Function)**, generalmente basada en el **Error Cuadr√°tico Medio (MSE)** entre la posici√≥n predicha ($\hat{P}$) y la real ($P$):

$$\mathcal{L} = \frac{1}{n} \sum_{i=1}^{n} \|\vec{P}_i - \hat{\vec{P}}_i\|^2$$

Donde $n = 468$. El modelo utiliza el **Gradiente Descendente** para ajustar los pesos de la red y minimizar este error num√©rico.

### 2.2 Reconstrucci√≥n de la Superficie (Topolog√≠a Fija)
MediaPipe no solo entrega puntos aislados; los entrega con una **conectividad predefinida**. Esto significa que los 468 puntos forman una malla de tri√°ngulos fija.
* **Justificaci√≥n:** Se utiliza una matriz de adyacencia constante para definir c√≥mo se conectan los v√©rtices. Esto permite calcular el vector normal ($\vec{N}$) de cualquier parte de la cara mediante el producto cruz de las aristas del tri√°ngulo formado por los landmarks:
$$\vec{N}_{cara} = (\vec{P}_{v2} - \vec{P}_{v1}) \times (\vec{P}_{v3} - \vec{P}_{v1})$$

### 2.3 Estimaci√≥n de Profundidad Relativa
Una de las mayores proezas num√©ricas de MediaPipe es obtener la coordenada $z$ (profundidad) a partir de una c√°mara 2D. Esto lo logra mediante **Inferencia de Profundidad**:
1. El modelo asume un modelo de cabeza promedio (Weak Perspective Projection).
2. La coordenada $z$ de los puntos se predice bas√°ndose en la deformaci√≥n y el tama√±o relativo de las facciones.
3. El origen ($z=0$) se sit√∫a generalmente en el centro de masa de la cara o en el puente de la nariz.

### 2.4 Alineaci√≥n Espacial: Transformaciones Afines
Para alinear los filtros (lentes, sombreros) con la cara detectada, se resuelven transformaciones afines que mantienen el paralelismo de las l√≠neas. Si tenemos tres puntos de referencia en la cara (ojos y nariz), podemos calcular la **Matriz de Transformaci√≥n Af√≠n $A$** que mapea el objeto al espacio facial:

$$\begin{bmatrix} x' \\ y' \end{bmatrix} = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} + \begin{bmatrix} t_x \\ t_y \end{bmatrix}$$

Este sistema de ecuaciones se resuelve en cada frame para asegurar que el "filtro" siga el movimiento del usuario con precisi√≥n milim√©trica.

## 3. El Problema PnP y Estimaci√≥n de la Pose (Head Pose Estimation)

Para que los filtros 3D se orienten correctamente, MediaPipe debe resolver el problema de **Perspectiva de n-Puntos (PnP)**. Esto consiste en encontrar la rotaci√≥n ($R$) y traslaci√≥n ($\vec{t}$) de la cabeza a partir de las coordenadas 2D observadas en la imagen.

### 3.1 El Modelo de C√°mara Pinhole
El sistema asume que los puntos del mundo 3D ($X, Y, Z$) se proyectan en el plano de la imagen ($u, v$) siguiendo la ecuaci√≥n de proyecci√≥n central:

$$s \begin{bmatrix} u \\ v \\ 1 \end{bmatrix} = \mathbf{K} [ \mathbf{R} | \vec{t} ] \begin{bmatrix} X \\ Y \\ Z \\ 1 \end{bmatrix}$$

Donde:
* **$\mathbf{K}$:** Es la matriz de par√°metros intr√≠nsecos de la c√°mara (focal, centro √≥ptico).
* **$[\mathbf{R}|\vec{t}]$:** Es la matriz de par√°metros extr√≠nsecos (la pose que queremos hallar).
* **$s$:** Es un factor de escala.

### 3.2 Resoluci√≥n mediante Iteraci√≥n Num√©rica
Como la imagen es una proyecci√≥n 2D de un objeto 3D, el problema est√° **sobredeterminado**. MediaPipe utiliza algoritmos como **Levenberg-Marquardt** para minimizar el **Error de Reproyecci√≥n**:

$$\min_{\mathbf{R}, \vec{t}} \sum_{i=1}^{n} \| p_i - \text{proj}(\mathbf{K}, \mathbf{R}, \vec{t}, P_i) \|^2$$

Este es un m√©todo num√©rico de optimizaci√≥n que ajusta la rotaci√≥n y posici√≥n hasta que los puntos del modelo 3D "calzan" perfectamente sobre los p√≠xeles de la cara detectada.

### 3.3 Extracci√≥n de los √Ångulos de Euler (Tait-Bryan)
Una vez obtenida la matriz de rotaci√≥n $\mathbf{R}$, se descomponen los √°ngulos para aplicarlos en Three.js o A-Frame:
* **Pitch (X):** Inclinaci√≥n arriba/abajo.
* **Yaw (Y):** Giro izquierda/derecha.
* **Roll (Z):** Inclinaci√≥n lateral.

La matriz de rotaci√≥n se define como el producto:
$$\mathbf{R} = R_z(\psi)R_y(\theta)R_x(\phi)$$

### 3.4 Estabilizaci√≥n de la Pose (Filtrado de Se√±al)
Debido al ruido en la captura de video, los valores de $R$ y $t$ pueden oscilar. Para evitar esto, se aplican t√©cnicas de **Suavizado Exponencial**:

$$S_t = \alpha \cdot X_t + (1 - \alpha) \cdot S_{t-1}$$

Donde $\alpha \in [0, 1]$ es el factor de suavizado. Este m√©todo num√©rico permite que el sombrero o los lentes no "tiemblen" ante peque√±as variaciones de luz o movimiento del sensor.

## 4. Estabilizaci√≥n de Datos: El Filtro "One Euro" ($1‚Ç¨$)

En la visi√≥n computacional en tiempo real, los landmarks detectados suelen presentar un fen√≥meno de "jitter" (vibraci√≥n aleatoria) debido a errores de cuantizaci√≥n en la imagen y ruido en el sensor. MediaPipe utiliza el **Filtro One Euro**, un filtro de paso bajo adaptativo de primer orden.

### 4.1 La Limitaci√≥n de los Filtros Tradicionales
Un filtro de paso bajo est√°ndar tiene un compromiso (trade-off) cr√≠tico:
1. **Si el corte es bajo:** Se elimina el ruido, pero se introduce **lag** (retraso) en movimientos r√°pidos.
2. **Si el corte es alto:** El sistema responde r√°pido, pero los puntos tiemblan cuando el usuario est√° quieto.

### 4.2 El Modelo Matem√°tico Adaptativo
El filtro $1‚Ç¨$ resuelve esto ajustando din√°micamente su frecuencia de corte $f_c$ bas√°ndose en la velocidad de la se√±al. La ecuaci√≥n fundamental del filtro de paso bajo es:

$$\hat{X}_k = \alpha X_k + (1 - \alpha) \hat{X}_{k-1}$$

Donde el factor de suavizado $\alpha$ se calcula a partir de la frecuencia de corte:
$$\alpha = \frac{1}{1 + \frac{1}{2\pi \cdot \Delta t \cdot f_c}}$$

### 4.3 Adaptaci√≥n mediante la Velocidad (Derivada Discreta)
La clave num√©rica est√° en definir $f_c$ como una funci√≥n de la velocidad de cambio de la se√±al ($\dot{X}$):

1. **C√°lculo de la velocidad:** $\dot{X}_k = \frac{X_k - \hat{X}_{k-1}}{\Delta t}$
2. **Suavizado de la velocidad:** $\hat{\dot{X}}_k = \text{LowPass}(\dot{X}_k, \alpha_{speed})$
3. **Frecuencia de corte adaptativa:** $f_c = f_{c_{min}} + \beta |\hat{\dot{X}}_k|$

Donde:
* **$f_{c_{min}}$:** Evita el jitter cuando el usuario est√° quieto.
* **$\beta$:** Coeficiente de intensidad que aumenta la frecuencia de corte si hay mucha velocidad, reduciendo el lag.

### 4.4 Justificaci√≥n en M√©todos Num√©ricos
Este algoritmo representa un **controlador proporcional** simple aplicado al procesamiento de se√±ales. Permite que MediaPipe entregue coordenadas que se sienten "f√≠sicas" y naturales, eliminando la alta frecuencia del ruido sin sacrificar la respuesta inmediata del sistema ante movimientos bruscos.

## 5. Procesamiento de Tensores y Aceleraci√≥n en GPU

El motor de c√°lculo de MediaPipe no opera sobre p√≠xeles individuales de forma secuencial, sino que utiliza **√Ålgebra Multilineal** para procesar la informaci√≥n mediante Tensores.

### 5.1 ¬øQu√© es un Tensor en MediaPipe?
Un tensor es una generalizaci√≥n de los vectores y matrices a $n$ dimensiones. En el caso del video, la entrada es un tensor de cuarto orden:
$$\mathbf{T} \in \mathbb{R}^{B \times H \times W \times C}$$
Donde:
* **$B$:** Batch size (usualmente 1 en tiempo real).
* **$H, W$:** Altura y ancho de la imagen.
* **$C$:** Canales de color (3 para RGB).

### 5.2 Cuantizaci√≥n y Optimizaci√≥n Num√©rica
Para ejecutar estos modelos en navegadores o m√≥viles, MediaPipe utiliza **Cuantizaci√≥n**. Esto consiste en reducir la precisi√≥n de los pesos de la red neuronal de `float32` (32 bits) a `int8` (8 bits). 

**Justificaci√≥n Num√©rica:** Aunque se introduce un peque√±o error de redondeo, el volumen de datos se reduce en un **75%**, permitiendo que las operaciones de producto punto en las capas de la red se realicen mucho m√°s r√°pido en la GPU.

### 5.3 Implementaci√≥n v√≠a WebGL/WebGPU
MediaPipe delega las multiplicaciones matriciales a la GPU mediante **Shaders de Computaci√≥n**. Esto permite resolver el sistema de la red neuronal en paralelo:
$$\vec{y} = \sigma(\mathbf{W}\vec{x} + \vec{b})$$
Donde $\mathbf{W}$ es la matriz de pesos, $\vec{x}$ los datos de entrada, $\vec{b}$ el sesgo y $\sigma$ la funci√≥n de activaci√≥n (ej. ReLU). Millones de estas operaciones ocurren cada 16ms.

## 5. Procesamiento de Tensores y Aceleraci√≥n en GPU

El motor de c√°lculo de MediaPipe no opera sobre p√≠xeles individuales de forma secuencial, sino que utiliza **√Ålgebra Multilineal** para procesar la informaci√≥n mediante Tensores.

### 5.1 ¬øQu√© es un Tensor en MediaPipe?
Un tensor es una generalizaci√≥n de los vectores y matrices a $n$ dimensiones. En el caso del video, la entrada es un tensor de cuarto orden:
$$\mathbf{T} \in \mathbb{R}^{B \times H \times W \times C}$$
Donde:
* **$B$:** Batch size (usualmente 1 en tiempo real).
* **$H, W$:** Altura y ancho de la imagen.
* **$C$:** Canales de color (3 para RGB).

### 5.2 Cuantizaci√≥n y Optimizaci√≥n Num√©rica
Para ejecutar estos modelos en navegadores o m√≥viles, MediaPipe utiliza **Cuantizaci√≥n**. Esto consiste en reducir la precisi√≥n de los pesos de la red neuronal de `float32` (32 bits) a `int8` (8 bits). 

**Justificaci√≥n Num√©rica:** Aunque se introduce un peque√±o error de redondeo, el volumen de datos se reduce en un **75%**, permitiendo que las operaciones de producto punto en las capas de la red se realicen mucho m√°s r√°pido en la GPU.

### 5.3 Implementaci√≥n v√≠a WebGL/WebGPU
MediaPipe delega las multiplicaciones matriciales a la GPU mediante **Shaders de Computaci√≥n**. Esto permite resolver el sistema de la red neuronal en paralelo:
$$\vec{y} = \sigma(\mathbf{W}\vec{x} + \vec{b})$$
Donde $\mathbf{W}$ es la matriz de pesos, $\vec{x}$ los datos de entrada, $\vec{b}$ el sesgo y $\sigma$ la funci√≥n de activaci√≥n (ej. ReLU). Millones de estas operaciones ocurren cada 16ms.

## 6. Integraci√≥n T√©cnica: El V√≠nculo MediaPipe - Three.js

En tu implementaci√≥n, el flujo de datos representa un ciclo completo de **M√©todos Num√©ricos Aplicados**:

1. **Captura:** La c√°mara obtiene la matriz de p√≠xeles $I$.
2. **Inferencia (MediaPipe):** Se resuelve la regresi√≥n para obtener los landmarks $\vec{P}_i$.
3. **Mapeo:** Se transforman las coordenadas normalizadas $[0,1]$ al espacio euclidiano $[-n, n]$.
4. **Transformaci√≥n (Three.js):** Se actualizan las matrices de rotaci√≥n y traslaci√≥n de los objetos 3D.
5. **Render:** Se proyectan los objetos 3D de nuevo a 2D para el monitor.

### 6.1 Ejemplo de L√≥gica de Uni√≥n (Fragmento del c√≥digo)
```javascript
// La regresi√≥n de MediaPipe entrega 'f' (landmarks)
const f = res.multiFaceLandmarks[0];
const le = f[33], re = f[263]; // Ojo Izquierdo y Derecho

// C√°lculo de la distancia euclidiana (Norma L2) para la escala
const eyeDist = Math.abs(le.x - re.x) * 3;

// Aplicaci√≥n de la transformaci√≥n af√≠n (Traslaci√≥n)
glasses.position.set(centerX, centerY, -0.35);

### 6.2 Resumen Final de la Tecnolog√≠a

| Proceso | M√©todo Num√©rico / Matem√°tico |
| :--- | :--- |
| **Detecci√≥n de Objetos** | Convoluci√≥n Discreta y Redes Neuronales Convolucionales (CNN). |
| **Landmarks (Puntos Clave)** | Regresi√≥n No-lineal de alta dimensionalidad sobre espacios latentes. |
| **Estabilidad de Se√±al** | Filtros de Paso Bajo adaptativos (Filtro One Euro). |
| **Alineaci√≥n 3D** | Resoluci√≥n del problema PnP (Perspective-n-Point) y Optimizaci√≥n de Reproyecci√≥n. |
| **Rendimiento** | Cuantizaci√≥n de tensores y computaci√≥n paralela en GPU. |

---

> **Conclusi√≥n de MediaPipe:** Esta tecnolog√≠a representa la frontera de los m√©todos num√©ricos aplicados, donde la resoluci√≥n de sistemas de ecuaciones no se hace de forma manual, sino que se delega a modelos de aprendizaje autom√°tico que optimizan billones de par√°metros para transformar datos visuales brutos en informaci√≥n geom√©trica √∫til.

In [None]:
from IPython.display import display, HTML

# Guardamos todo el c√≥digo HTML/JS en una variable de texto de Python
codigo_html = """
<div id="main-container">
    <div class="panel">
      <button id="btn-glasses">üëì Lentes</button>
      <button id="btn-mustache">ü•∏ Bigote</button>
      <button id="btn-hat">üé© Sombrero</button>
      <button id="btn-mole">üü§ Lunar</button>
      <button id="btn-points">üü¢ FaceMesh</button>
    </div>

    <video id="videoElement" autoplay muted playsinline></video>
    <canvas id="canvasElement"></canvas>
    <div id="status">Cargando sistema...</div>
</div>

<script src="https://cdn.jsdelivr.net/npm/@mediapipe/face_mesh/face_mesh.js"></script>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/camera_utils/camera_utils.js"></script>

<style>
    #main-container {
        position: relative;
        width: 640px;
        height: 480px;
        background: black;
        margin: 0 auto;
        border: 2px solid #444;
        font-family: sans-serif;
        overflow: hidden;
    }
    video, canvas {
        position: absolute;
        top: 0; left: 0;
        width: 100%; height: 100%;
        object-fit: cover;
    }
    .panel {
        position: absolute;
        top: 10px; left: 10px;
        z-index: 50;
        display: flex;
        flex-direction: column;
        gap: 5px;
    }
    button {
        width: 140px;
        padding: 8px;
        cursor: pointer;
        font-weight: bold;
        border: 1px solid #999;
        border-radius: 4px;
        background: white;
        transition: background 0.2s;
    }
    /* Clase activa (Verde) */
    button.active {
        background-color: #76ff03 !important;
        border-color: #4caf50;
    }
    #status {
        position: absolute;
        bottom: 10px; left: 10px;
        color: white;
        background: rgba(0,0,0,0.5);
        padding: 5px;
        z-index: 40;
        pointer-events: none;
    }
</style>

<script>
(function() {
    // 1. Referencias
    const container = document.getElementById('main-container');
    if (!container) return; // Prevenir errores si se re-ejecuta
    
    const video = container.querySelector("#videoElement");
    const canvas = container.querySelector("#canvasElement");
    const ctx = canvas.getContext("2d");
    const statusDiv = container.querySelector("#status");

    // 2. Estado de los filtros
    const filters = {
        glasses: false,
        mustache: false,
        hat: false,
        mole: false,
        points: false
    };

    // 3. CONEXI√ìN DE BOTONES
    const buttons = {
        'btn-glasses': 'glasses',
        'btn-mustache': 'mustache',
        'btn-hat': 'hat',
        'btn-mole': 'mole',
        'btn-points': 'points'
    };

    // Asignar eventos clic
    for (const [btnId, filterName] of Object.entries(buttons)) {
        const btn = container.querySelector("#"+btnId);
        if (btn) {
            btn.onclick = function() {
                filters[filterName] = !filters[filterName];
                // Feedback Visual
                if (filters[filterName]) {
                    btn.classList.add('active');
                } else {
                    btn.classList.remove('active');
                }
            };
        }
    }

    // 4. Ajustar Canvas
    function resize() {
        canvas.width = 640;
        canvas.height = 480;
    }
    resize();

    // 5. Configurar FaceMesh
    const faceMesh = new FaceMesh({
        locateFile: (file) => `https://cdn.jsdelivr.net/npm/@mediapipe/face_mesh/${file}`
    });

    faceMesh.setOptions({
        maxNumFaces: 1,
        refineLandmarks: true,
        minDetectionConfidence: 0.5,
        minTrackingConfidence: 0.5
    });

    faceMesh.onResults(onResults);

    // 6. Dibujar Resultados
    function onResults(res) {
        statusDiv.innerText = "Rostro detectado ‚úÖ";
        ctx.clearRect(0, 0, canvas.width, canvas.height);
        
        // Dibujar imagen de video
        ctx.drawImage(res.image, 0, 0, canvas.width, canvas.height);

        if (res.multiFaceLandmarks && res.multiFaceLandmarks.length > 0) {
            const landmarks = res.multiFaceLandmarks[0];
            drawFilters(landmarks, canvas.width, canvas.height);
        } else {
            statusDiv.innerText = "Buscando rostro...";
        }
    }

    function drawFilters(f, w, h) {
        // Puntos clave
        const le = f[33];   // Ojo izq
        const re = f[263];  // Ojo der
        const lip = f[13];  // Labio
        const cheek = f[50];// Mejilla

        // Geometr√≠a
        const cx = (le.x + re.x) / 2 * w;
        const cy = (le.y + re.y) / 2 * h;
        const dx = (re.x - le.x) * w;
        const dy = (re.y - le.y) * h;
        const dist = Math.sqrt(dx*dx + dy*dy);

        if (filters.points) {
            ctx.fillStyle = "#00ff00";
            for (let p of f) {
                ctx.beginPath();
                ctx.arc(p.x * w, p.y * h, 1, 0, 2 * Math.PI);
                ctx.fill();
            }
        }

        if (filters.glasses) {
            ctx.strokeStyle = "black";
            ctx.lineWidth = 5;
            ctx.strokeRect(cx - dist*0.8, cy - dist*0.3, dist*0.7, dist*0.4);
            ctx.strokeRect(cx + dist*0.1, cy - dist*0.3, dist*0.7, dist*0.4);
            ctx.beginPath();
            ctx.moveTo(cx - dist*0.1, cy - dist*0.1);
            ctx.lineTo(cx + dist*0.1, cy - dist*0.1);
            ctx.stroke();
        }

        if (filters.mustache) {
            const mx = lip.x * w;
            const my = lip.y * h - dist * 0.15;
            ctx.strokeStyle = "black"; 
            ctx.lineWidth = dist * 0.2;
            ctx.lineCap = "round";
            ctx.beginPath();
            ctx.moveTo(mx - dist * 0.5, my + dist * 0.1);
            ctx.quadraticCurveTo(mx, my - dist * 0.2, mx + dist * 0.5, my + dist * 0.1);
            ctx.stroke();
        }

        if (filters.hat) {
            ctx.fillStyle = "#5d4037";
            ctx.fillRect(cx - dist, cy - dist * 1.8, dist * 2, dist * 0.8);
            ctx.fillRect(cx - dist * 1.4, cy - dist, dist * 2.8, dist * 0.2);
        }
        
        if (filters.mole) {
             ctx.fillStyle = "#3e2723";
             ctx.beginPath();
             ctx.arc(cheek.x*w, cheek.y*h, dist*0.1, 0, Math.PI*2);
             ctx.fill();
        }
    }

    // 7. Iniciar C√°mara
    const camera = new Camera(video, {
        onFrame: async () => {
            await faceMesh.send({image: video});
        },
        width: 640,
        height: 480
    });

    statusDiv.innerText = "Solicitando c√°mara...";
    camera.start()
        .then(() => statusDiv.innerText = "C√°mara lista.")
        .catch(err => statusDiv.innerText = "Error: " + err);

})();
</script>
"""

# Esta l√≠nea final es la que hace la magia de mostrar el HTML
display(HTML(codigo_html))