## Optimización de Funciones con Restricciones

### <u>Problema General con Restricciones de Igualdad</u>

Sea la función 

$$
f : \Omega \subset \mathbb{R}^n \to \mathbb{R},
$$  

el problema de optimización con **restricciones de igualdad** se formula como:

\[
\begin{aligned}
& \min_{x \in \Omega} \; f(x) \quad \text{o} \quad \max_{x \in \Omega} \; f(x) \\
& \text{sujeto a: } \\
& \quad \varphi_1(x) = 0, \\
& \quad \varphi_2(x) = 0, \\
& \quad \;\;\vdots \\
& \quad \varphi_m(x) = 0,
\end{aligned}
\]

donde:

- $f$ es la **función objetivo**.  
- $\varphi_i(x)$, con $i = 1, 2, \dots, m$, son las **restricciones de igualdad**.  
- $x \in \Omega \subset \mathbb{R}^n$ es el **vector de variables de decisión**.  

Se asume que tanto $f$ como $\varphi_i$ son **continuas** y tienen **segundas derivadas parciales continuas**, es decir, pertenecen a la clase $C^2$.

### <u>Función de Lagrange</u>

Para resolver el problema de optimización con restricciones de igualdad,  
**Lagrange** planteó la idea de construir una nueva función $L$ que incorpore  
a la función objetivo $f(x)$ las restricciones $\varphi(x) = (\varphi_1(x), \varphi_2(x), \dots, \varphi_m(x))^T$.  

Se define:

$$
L : \mathbb{R}^m \times \Omega \to \mathbb{R}, \quad
L(\lambda, x) = f(x) + \langle \lambda, \varphi(x) \rangle
$$

es decir,

$$
L(\lambda, x) = f(x) + \sum_{j=1}^m \lambda_j \, \varphi_j(x) \tag{*}
$$

donde:

- $f(x)$ es la función objetivo.  
- $\varphi_j(x)$ son las funciones de restricción de igualdad.  
- $\lambda = (\lambda_1, \lambda_2, \dots, \lambda_m)$ es el vector de **multiplicadores de Lagrange**.  

A esta nueva función $L(\lambda, x)$ se le denomina **Función de Lagrange**.

### <u>Teorema</u>

Se cumple que si 

$$
(\lambda_0, x_1, x_2, \dots, x_n)
$$  

es un **máximo o mínimo relativo** de la función de Lagrange $L$,  
entonces  

$$
(x_1, x_2, \dots, x_n)
$$  

es un **máximo o mínimo relativo** de la función $f$,  
**sujeto a la restricción**  

$$
\varphi(x_1, x_2, \dots, x_n) = 0.
$$


### <u>Matriz Hessiana Orlada</u>

La **matriz Hessiana orlada** es una herramienta que permite estudiar la naturaleza de los puntos críticos en problemas de optimización con restricciones de igualdad.  

Se construye a partir de:  
- Las **restricciones** $\varphi_1, \dots, \varphi_m$,  
- Las **variables** $x_1, \dots, x_n$,  
- Y la **función de Lagrange** $L(x, \lambda)$.  

Su forma general es:

$$
H(\varphi_1, \dots, \varphi_m, x_1, \dots, x_n) =
\begin{bmatrix}
0      & \cdots & 0      & \tfrac{\partial \varphi_1}{\partial x_1} & \cdots & \tfrac{\partial \varphi_1}{\partial x_n} \\
\vdots & \ddots & \vdots & \vdots                                   & \ddots & \vdots \\
0      & \cdots & 0      & \tfrac{\partial \varphi_m}{\partial x_1} & \cdots & \tfrac{\partial \varphi_m}{\partial x_n} \\[6pt]
\tfrac{\partial \varphi_1}{\partial x_1} & \cdots & \tfrac{\partial \varphi_m}{\partial x_1} & \tfrac{\partial^2 L}{\partial x_1^2} & \cdots & \tfrac{\partial^2 L}{\partial x_1 \partial x_n} \\
\vdots & \ddots & \vdots & \vdots                                   & \ddots & \vdots \\
\tfrac{\partial \varphi_1}{\partial x_n} & \cdots & \tfrac{\partial \varphi_m}{\partial x_n} & \tfrac{\partial^2 L}{\partial x_n \partial x_1} & \cdots & \tfrac{\partial^2 L}{\partial x_n^2}
\end{bmatrix}
$$

#### Interpretación

- La **primera parte** (superior izquierda) es una matriz de ceros de tamaño $m \times m$.  
- La **parte superior derecha** contiene las derivadas parciales de las restricciones respecto a las variables.  
- La **parte inferior izquierda** es la transpuesta de la anterior.  
- La **parte inferior derecha** es la **matriz Hessiana** de la función de Lagrange respecto a las variables $x$.  

### <u>Procedimiento de Optimización con Restricciones</u>

#### Pasos Generales

1. **Determinar los puntos críticos** (posibles máximos o mínimos) a partir de las condiciones de primer orden (gradientes nulos en el problema de Lagrange).  
2. **Aplicar el Criterio de la Segunda Derivada** utilizando la **matriz Hessiana orlada**.  

#### <u>Teorema (Criterio de la Segunda Derivada)</u>

Sea $H$ la **matriz Hessiana orlada** evaluada en un punto crítico y sean  

$$
H_1, H_2, \dots, H_{n+m}
$$  

los **menores principales** de $H$.  

- Si  

$$
H_k < 0 \quad \text{para todo } k = 2m+1, \dots, n+m,
$$  

(entonces corresponden a los $n-m$ últimos menores principales),  
el punto crítico es un **mínimo relativo**.  

- Si  

$$
(-1)^k H_k < 0 \quad \text{para todo } k = 2m+1, \dots, n+m,
$$  

entonces el punto crítico es un **máximo relativo**.  

### <u>Funciones de Dos Variables con una Restricción</u>

Sea la función $f : \Omega \subset \mathbb{R}^2 \to \mathbb{R}$, el problema es:  

**Minimizar** $f(x, y)$  
sujeto a la restricción:  

$$
\varphi(x, y) = 0,
$$

donde $(x, y) \in \Omega$.

#### Función de Lagrange

La **función de Lagrange** está dada por:  

$$
L(\lambda, x, y) = f(x, y) + \lambda \, \varphi(x, y),
$$  

donde $\lambda \in \mathbb{R}$.  

#### Matriz Hessiana Orlada

La **matriz Hessiana orlada** es:  

$$
H(\lambda, x, y) =
\begin{bmatrix}
0 & \varphi_x & \varphi_y \\
\varphi_x & L_{xx} & L_{xy} \\
\varphi_y & L_{yx} & L_{yy}
\end{bmatrix}
$$

#### Teorema (Criterio de la Segunda Derivada)

Cuando $n=2$ y $m=1$, se cumple lo siguiente:  

Sea $(\lambda_0, x_0, y_0)$ un **punto crítico** de $L(\lambda, x, y)$.  

1. Si  
   $$
   \Delta(\lambda_0, x_0, y_0) < 0,
   $$  
   entonces $(x_0, y_0)$ es un **mínimo relativo** de $f$ sujeto a la restricción $\varphi(x, y) = 0$.  

2. Si  
   $$
   \Delta(\lambda_0, x_0, y_0) > 0,
   $$  
   entonces $(x_0, y_0)$ es un **máximo relativo** de $f$ sujeto a la restricción $\varphi(x, y) = 0$.  

### <u>Condiciones de Karush–Kuhn–Tucker (KKT)</u>

Sean $f, g_1, g_2, \dots, g_p$ funciones **convexas** de clase $C^1$ y $h_1, h_2, \dots, h_m$ funciones **afines lineales**.  

El problema de optimización se plantea como:  

$$
\min f(x)
$$  

sujeto a:  

$$
h(x) = \theta_m, \quad g(x) \leq \theta_p
$$  

donde:  

- $h = (h_1, h_2, \dots, h_m)^t$,  
- $g = (g_1, g_2, \dots, g_p)^t$,  
- $g(x) \leq \theta_p$ significa $g_i(x) \leq 0 \; \forall i$,  
- $x \in \Omega$ con $\Omega$ un conjunto **convexo, abierto y no vacío**.  

La **función de Lagrange** se define como:  

$$
L(x, \lambda, \mu) = f(x) + \lambda^T h(x) + \mu^T g(x)
$$  

donde:  

- $\lambda \in \mathbb{R}^m$ son los multiplicadores de igualdad,  
- $\mu \in \mathbb{R}^p$ son los multiplicadores de desigualdad.  

### Condiciones KKT

Sea $x_0 \in \Omega$, $\lambda \in \mathbb{R}^m$, $\mu \in \mathbb{R}^p$.  
Entonces $x_0$ es **mínimo de $f$ sujeto a las restricciones** si se cumplen:  

1. **Condiciones de Estacionariedad:**  

$$
\nabla f(x_0) + \sum_{j=1}^m \lambda_j \nabla h_j(x_0) + \sum_{i=1}^p \mu_i \nabla g_i(x_0) = \theta
$$  

2. **Condiciones de Viabilidad:**  

$$
h(x_0) = \theta_m, \quad g(x_0) \leq \theta_p
$$  

3. **Condiciones de Complementariedad:**  

$$
\mu \cdot g(x_0) = 0
$$  

(es decir, $\mu_i g_i(x_0) = 0$ para todo $i$).  

4. **Condiciones de No Negatividad:**  

$$
\mu_i \geq 0, \quad \forall i
$$  

#### Conclusión

Si se cumplen las condiciones anteriores, entonces $x_0$ es un **mínimo de $f$** sujeto a las restricciones.  
