# Modelado en Optimización (IIND-2501)

## Lección 3.3: Optimización lineal (formato estándar, holguras y bases)

El **propósito** de esta lección es construir intuición geométrica de:
- Región factible, restricciones activas/inactivas, holguras.
- Variables básicas y no básicas (en $\mathbb{R}^n$, los vértices son intersección de $n$ o más restricciones activas).
- Conexión entre formato canónico, estándar y matricial.

In [1]:
'''
Importaciones y configuraciones generales del notebook. No modificar.
'''
import numpy as np
import matplotlib.pyplot as plt
from IPython.display import display, Math
from ipywidgets import FloatSlider, VBox, HBox, HTML, interactive_output, Checkbox, Button, Output, Layout

from helpers_bases import region_factible, eval_basis

### 0. Representación general de un problema de optimización

Un problema de optimización con $n$ variables y $m$ restricciones puede escribirse de manera general como:

$$\max\; c^\top x$$
$$\text{s.a.}$$
$$A x \le b,\;$$
$$x\ge 0,\;$$
$$x\in\mathbb{R}^2.$$

En esta **representación matricial**, $A\in\mathbb{R}^{m\times n}$ contiene los coeficientes de las variables en las restricciones, $b\in\mathbb{R}^{m}$ contiene los términos independientes (lado derecho) de las restricciones, y $c\in\mathbb{R}^{n}$ contiene los costos asociados a las variables en la función objetivo (ver diapositivas).

#### Ejemplo:

$$\max\ z = 3x_1 + 2x_2$$

Sujeto a
$$
\begin{aligned}
x_1 + x_2 &\le 6 \\
x_1 + 2 x_2 &\le 8 \\
2 x_2 + x_2 &\le 8 \\
x_1, x_2 &\ge 0 \, .
\end{aligned}
$$

En notación matricial:
$$
A =
\begin{bmatrix}
1 & 1 \\
1 & 2 \\
2 & 1
\end{bmatrix},
\quad
b =
\begin{bmatrix}
6 \\ 8 \\ 8
\end{bmatrix},
\quad
c =
\begin{bmatrix}
3 \\ 2
\end{bmatrix} .
$$

## 1. Formatos de representación 

- **Formato canónico**: implica expresar problemas de maximización con restricciones `<=`(y de minimización con restricciones `>=`); el ejemplo anterior ya está dado en formato canónico.
  
- **Formato estándar**: implica expresar el problema solo con restricciones de igualdad para trabajar con sistemas de ecuaciones exactos. Para esto, introduce `variables de holgura` ($s$) que absorben "lo que le falta" a cada restricción para cumplirse en igualdad, reemplazando las restricciones originales por:

$$\max\; c^\top x$$
$$A x + s = b,$$
$$x\ge 0,$$
$$s\ge 0.$$

Para el caso del ejemplo anterior, la representación en **formato estándar** sería:
$$\max\ z = 3x_1 + 2x_2$$
$$
\begin{aligned}
x_1 + x_2 + s_1 &= 6 \\
x_1 + 2 x_2 + s_2 &= 8 \\
2 x_2 + x_2 + s_3 &= 8 \\
x_1, x_2, s_1, s_2, s_3 &\ge 0 \, .
\end{aligned}
$$

De forma que la representación matricial se extiende a:

$$
A =
\begin{bmatrix}
1 & 1 & 1 & 0 & 0 \\
1 & 2 & 0 & 1 & 0\\
2 & 1 & 0 & 0 & 1
\end{bmatrix},
\quad
b =
\begin{bmatrix}
6 \\ 8 \\ 8
\end{bmatrix},
\quad
c =
\begin{bmatrix}
3 \\ 2 \\ 0 \\ 0 \\ 0
\end{bmatrix} .
$$

Observa que:
$$
\begin{aligned}
s_1 &= 6 - (x_1 + x_2) \\
s_2 &= 8 - (x_1 + 2 x_2 ) \\
s_3 &= 8 - (2 x_2 + x_2)\\
\end{aligned}
$$

In [2]:
A = np.array([[1.,1.],[1.,2.],[2.,1.]], float)
b = np.array([6.,8.,8.], float)
c = np.array([3.,2.], float)

## 2. Conceptos de *holgura y restricción activa*

Utiliza el siguiente *recurso interactivo* para evaluar diferentes puntos $(x_1, x_2)$, verificar factibilidad, y comprender el papel de las variables de holgura.

- Desliza `x1` y `x2` para **probar factibilidad** $(Ax \le b$).
- El vector de **holguras** es $s = b - A x$.
  - Si $s_i > 0$: la restricción $i$ está **inactiva**.
  - Si $s_i = 0$: la restricción $i$ está **activa**.
  - Si $s_i < 0$: la restricción $i$ se está incumpliendo.
- El gráfico 2D muestra las restricciones (rectas $a_i^\top x = b_i$), la región factible y el punto $(x_1, x_2)$ (todo en el espacio de $x_1,x_2$).
- El gráfico de barras horizontales muestra los valores de **todas las variables**: $[x_1, x_2, s_1, s_2, s_3]$.

In [3]:
#plot_LP(A,b,c)
region_factible(A, b, x_init=(0.0, 0.0))

VBox(children=(HBox(children=(FloatSlider(value=0.0, description='x1', max=5.0), FloatSlider(value=0.0, descri…

## 3. Conceptos de *base* y *punto extremo*

Al introducir **holguras**, obtenemos un vector de decisión ampliado $x = [\,x_1,\ x_2,\ s_1,\ s_2,\ s_3\,]^\top$ y matrices:

$$
A =
\begin{bmatrix}
1 & 1 & 1 & 0 & 0 \\
1 & 2 & 0 & 1 & 0 \\
2 & 1 & 0 & 0 & 1
\end{bmatrix},
\quad
b =
\begin{bmatrix}
6 \\ 8 \\ 8
\end{bmatrix},
\quad
c =
\begin{bmatrix}
3 \\ 2 \\ 0 \\ 0 \\ 0
\end{bmatrix} .
$$

- Un sistema de ecuaciones de 3x5 ($m\times n$) tiene infinitas soluciones (todos los puntos de la región factible satisfacen el sistema de ecuaciones, aunque no todos sean óptimos). Si fijamos $n-m$ variables en cero, obtenemos un sistema de $m\times m$ que tiene una solución única (igual número de ecuaciones e incógnitas).
- Llamaremos **base** ($B$) a la matriz de $m\times m$ que resulta de descartar las columnas de $A$ correpondientes a variables fijadas en cero. Por ejemplo, si fijamos $s_2$ y $s_3$ en cero, se 'anularían' las columnas 4 y 5 de la matriz $A$, y se podría resolver el sistema $B x = b$:

$$
\begin{bmatrix}
1 & 1 & 1 \\
1 & 2 & 0 \\
2 & 1 & 0 
\end{bmatrix}
\begin{bmatrix}
x_1 \\ x_2 \\ s_1
\end{bmatrix}
=
\begin{bmatrix}
6 \\ 8 \\ 8
\end{bmatrix}
$$

- De la sección anterior, sabemos que tener una **variable en cero** implica que se tiene una **restricción activa**. Al fijar ciertas variables en cero y solucionar el sistema restante, estamos encontrando el punto donde se encuentran las restricciones activas.

$\rightarrow$ `usa la interfaz de la Sección 2 para encontrar el punto relacionado con fijar s_2 y s_3 en cero` 

$\rightarrow$ ¿Cómo se relaciona el punto obtenido con $ B^{-1} b$?

- Si una **base** es invertible, ésta representará el punto donde se intersectan las restricciones activas. Si dicho punto es factible, lo llamaremos un **punto extremo** del problema de optimización; si es infactible, simplemente lo llamamos *solución básica infactible*.

In [4]:
A_full = np.array([[1,1,1,0,0],
                   [1,2,0,1,0],
                   [2,1,0,0,1]], float)

var_names=['x1','x2','s1','s2','s3']

#### Exploración de bases en un problema de optimización lineal

Selecciona exactamente **m** variables para formar una **base** $B$ candidata (a estas las llamaremos **variables básicas**: $x_B$). Fijamos las demás variables en cero (**no básicas**: $x_N$). Si la submatriz es invertible, resolvemos $B x_B = b$ internamente, reportamos soluciones, y graficamos el punto resultante en el espacio de $(x_1, x_2)$.

In [5]:
eval_basis(A_full, b, c, var_names=var_names)

VBox(children=(HBox(children=(Checkbox(value=False, description='x1', indent=False, layout=Layout(width='70px'…