# Implementación Método Simplex

### Prefacio

En el siguiente reporte se implementará el paquete `mex` creado por los autores de este proyecto, que tiene como función principal resolver problemas de Programación Lineal, usualmente denotados por **LP** (por sus siglas en inglés *Linear Programming*). Se indagará en la formulación matemática del problema a resolver, así como de la metodología utilizada en el *Método Símplex*.

### 1. Programación lineal
La **Programación Lineal** es una sección de una de las ramas de las matemáticas que se ha consolidado a lo largo del Siglo XX con el nombre de Optimización. En general, esta última rama trata de varias técnicas matemáticas que buscan obtener el mayor provecho en sistemas biológicos, económicos, tecnológicos, ... 
Dichas técnicas se basaron en la idea de construir un **programa** que ayudase a encontrar la solución *óptima*. Según las caracteríticas de las funciones del problema y de las variables se tienen diversos tipos de problemas de Programación Matemática, en el caso particular, en donde todas las funciones del problema, objetivo  restricciones son lineales se tiene un problema de **Programación Lineal**.

La Programación Lineal estudia el problema de optimizar (ya sea minimizar o maximizar) una función lineal en la presencia de restricciones de la forma de desigualdades lineales. Unas de las principales ventajas de la Programación Lineal son la habilidad de modelar problemas grandes y complejos y la habilidad para resolver tales problemas (inclusive de grande escala) en un intervalo de tiempo razonable mediante el uso del **método símplex** y de computadoras.

El auge de la Programación Lineal a fechas previas al fin de la Segunda Guerra Mundial que fue una época en donde se hizo evidente que era fundamental la planificación y coordinaciión entre varios proyectos y más aún el uso **eficaz de los recursos disponibles**. En particular, el auge se da en junio de $1947$ cuando inicia un proyecto de la Fuerza Aérea de los EE.UU conocido como **SCOOP (Scientific Computation of Optimun Programs)** , que como resultado se tiene el **método símplex** desarrollado por el matemático George B. Dantzig para el final del verano de dicho año. El interés de la Programación Lineal se difundió muy rápido entre economistas, matemáticos, estadísticos, instituciones gubernamentales, entre otros.

![George Dantinzg](../images/progr_lineal_1.png)


Los elementos de un problema de Programación Lineal son:
+ Función objetivo: usualmente denotada por $f(x)$ con $x \in \mathbb{R}^n$, donde se tiene $n$ variables de interés. $f$ tiene como única restricción ser lineal respecto a $x$, esto es:

$$ f(x) = c_1x_1 + c_2x_2 + ... + c_nx_n$$

Por lo general, $c$ es conocido como el vector de costos.

+ Restricciones del tipo de desigualdad, bajo la restricción de que sean lineales respecto a $x$. Esto es para la función $h(x)$ y la cota superior $b$:

$$ h(x) = a_1x_1 + a_2x_2 + ... + a_nx_n \leq b $$

Se pueden tener tantas restricciones como sea necesario:

$$ h_1(x) = a_{11}x_1 + a_{12}x_2 + ... + a_{1n}x_n \leq b_1 $$
$$ h_2(x) = a_{21}x_1 + a_{22}x_2 + ... + a_{2n}x_n \leq b_2 $$
$$ \vdots  $$
$$ h_m(x) = a_{m1}x_1 + a_{m2}x_2 + ... + a_{mn}x_n \leq b_m $$

+ Variables no negativas: se tiene la restricción de que la variable que conforme la solución del problema esté conformado por valores no negativos, esto es:

$$ x_1,x_2, ...,x_n \geq 0$$


Así pues, un problema de Programación Lineal tiene la siguiente forma:

$$\min_{x_1,x_2,...,x_n \in \mathbb{R}} c_1x_1 + c_2x_2 + ... + c_nx_n $$

$$\text{sujeto a}$$
$$ h_1(x) = a_{11}x_1 + a_{12}x_2 + ... + a_{1n}x_n \leq b_1 $$
$$ h_2(x) = a_{21}x_1 + a_{22}x_2 + ... + a_{2n}x_n \leq b_2 $$
$$ \vdots  $$
$$ h_m(x) = a_{m1}x_1 + a_{m2}x_2 + ... + a_{mn}x_n \leq b_m $$

$$ x_1,x_2, ...,x_n \geq 0 $$

Si utilizamos álgebra matricial para representar el problema de una forma más compacta, entonces se tiene la siguiente forma:

$$\min_{x \in \mathbb{R}^n} c^Tx $$

$$\text{sujeto a}$$
$$ h(x) = Ax \leq b $$

$$ x \geq 0 $$

En donde:

$$ x = (x_1, x_2, ..., x_n)^T $$

$$ c = (c_1, c_2, ..., c_n)^T $$

$$ b = (b_1, b_2, ..., b_m)^T $$

$$
  A=
  \left[ {\begin{array}{cc}
   a11 & a12 & ... & a1n\\
   a21 & a22 & ... & a2n\\
   \vdots & \vdots & ... & \vdots \\
   am1 & am2 & ... & amn\\
  \end{array} } \right]; A \in \mathbb{R}^{m\text{x}n}
$$



### 2. Método Símplex

El **método símplex** fue creado en el año $1947$ por el matemático [George Dantzig](https://en.wikipedia.org/wiki/George_Dantzig) con el objetivo de resolver problemas de programación lineal, en los cuales pueden intervenir más de $2$ variables permitiendo mejorar las respuestas paso a paso y permitir alcanzar la solución óptima de dicho problema.

![George Dantinzg](../images/george_dantzing.png)


La programación lineal se planteó como un modelo matemático desrrolado durante la Segunda Guerra Mundial para tener una mejor planificación en cuanto a gastos y retornos y sobre todo reducir los costos del ejército y aumentar las pérdidas del enemigo.

El **método símplex** es un procedimiento iterativo utilizado para resolver problema de programación lineal (*LP*), que tiene como objetivo la búsqueda de la solución óptima. 

Para tener una mejor idea intuitiva de cómo funciona el método símplex se revisarán las siguientes definiciones:
+ El conjunto factible (posibles soluciones al *LP*) puede representarse por medio de un poliedro convexo. Éste es un resultado aplicable a cualquier *LP*.
+ Si un *LP* tiene una solución óptima y finita, entonces dicha solución se encuentra en uno de los **vértices del poliedro convexo**.


Intuitivamente, el método inicia en uno de los vértices del problema y verifica si éste es óptimo, si no lo es, entonces busca un vértice adyacente que mejore el valor de la función objetivo y así sucesivamente hasta llegar al vértice que no permite una mejora en la función objetivo, es ahí donde se encuentra la solución óptima. En la siguiente imagen se representa un gráfico que ayuda a imaginarse esta última descripción.

<img src="../images/repr_graf_met_simp.png">

Cabe mencionar, que el método símplex trabaja bajo el supuesto de que el problema a optimizar se encuentra en su forma estándar, la cual es la siguiente:

$$\min_{x \in \mathbb{R}^n} c^Tx$$

$$\text{sujeto a}$$
$$ Ax = b $$
$$ x \geq 0 $$

En donde $A \in \mathbb{R}^{m \text{x} n}, b \in \mathbb{R}^m$.

Los pasos para resolver un *PL* utilizando el método símplex son los siguintes:
1. El primer paso es transformar el problema a su versión estándar y crear el *tableu*. En caso de que el lector tenga duda sobre cómo realizar este paso sugerimos vistar la siguiente [liga](http://www.phpsimplex.com/teoria_metodo_simplex.htm).
1. Determinar la solución básica inicial.
1. Mediante la **condición de optimalidad** determinar cuál será la variable de entrada. En caso de que no exista una variable de entrada, entonces se ha llegado a la condición óptima y finaliza el algoritmo. En caso contrario se continúa con el siguiente paso.
1. Mediante la **condición de factibilidad** se selecciona la variable de salida.
1. Se actualiza el *tableau* mediante las operaciones de Gauss-Jordan y se regresa al paso $3$.

A continuación se realizará una expliación más profunda método símplex basándonos de un ejemplo de pequeña escala que ayudará (o eso se espera) a entender con mayor facilidad. 

El ejemplo a explicar se encontró en la [siguiente liga](https://www.plandemejora.com/metodo-simplex-paso-a-paso-ejemplos-maximizar-minimizar/), donde el *PL* a resolver es el siguiente:

$$\max_{x \in \mathbb{R}^2} 3x_1 + 2x_2$$

$$\text{sujeto a}$$
$$ 2x_1 + 5x_2 \leq 35 $$
$$ -3x_1 + +2x_2 \geq -18 $$
$$ 2x_1 + 4x_2 \leq 26 $$
$$ x_1,x_2 \geq 0 $$


#### 1. Transformar problema a versión estándar y crear *tableau*
Transformemos el siguiente problema a su versión estándar:

$$\max_{x \in \mathbb{R}^2} 3x_1 + 2x_2$$

$$\text{sujeto a}$$
$$ 2x_1 + 5x_2 \leq 35 $$
$$ -3x_1 + +2x_2 \geq -18 $$
$$ 2x_1 + 4x_2 \leq 26 $$
$$ x_1,x_2 \geq 0 $$

Versión estándar del problema:

$$\max_{x \in \mathbb{R}^2} 3x_1 + 2x_2 + 0s_1 + 0s_2 +0s_3$$

$$\text{sujeto a}$$
$$ 2x_1 + 5x_2 + 1s_1 + 0s_2 +0s_3 = 35 $$
$$ 3x_1 - 2x_2 + 0s_1 + 1s_2 +0s_3 = 18 $$
$$ 2x_1 + 4x_2 + 0s_1 + 0s_2 +1s_3= 26 $$
$$ x_1,x_2,s_1,s_2,s_3 \geq 0 $$

Ahora se crea el *tableau*:

<img src="../images/simplex_1.png">

#### 2. Determinar la solución básica inicial
En este caso en específico la solución básica inical sería:

$$ s_1=35, s_2=18, s_3=26 $$

Que corresponden al conjunto de variables básicas iniciales (conforman la *base*)  con valores iguales al vector $b$. Las variables que no se encuentran en la base se denominan variables no básicas y en este caso serían $x_1$ y $x_2$, las cuales tienen valor de $0$. Cabe mencionar que en todos los pasos las variables no básicas son iguales a $0$.

#### 3. Seleccionar la variable de entrada mediante la condición de optimalidad

Busca responder la pregunta ¿la solución actual en nuestro *tableau* actual es óptima o se puede mejorar? Para ello se verifica lo siguiente:
+ **Problema de maximización**: verificar que todos los coeficientes del vector de costos reducidos ($c$) son mayores o iguales que cero, esto quiere decir que estamos en el punto óptimo y se ha finalizado el problema, pues se ha encontrado una solución óptima.
+ **Problema de minimización**: verificar que todos los coeficientes del vector de costos reducidos ($c$) son menores o iguales que cero, esto quiere decir que estamos en el punto óptimo y se ha finalizado el problema, pues se ha encontrado una solución óptima.

Dado que nuestro ejemplo es un problema de maximización, entonces notamos que uno de los coeficientes del vector de costos ($c$) es menor a cero, en específico, el que está asociado a la segunda entrada. Esto implica que no se cumple la condición de optimalidad y aún se puede mejorar el valor de la solución. En la siguiente imagen se muestra este hecho.

<img src="../images/simplex_2.png">

La **variable de entrada** será una de las variables no básicas que ingresará a la base, es decir, formará parte de las variables básicas y de la solución del problema. Los criterios para determinar la variable de entrada se mencionan a continuación:

+ **Problema de maximización**: variable no básica con el coeficiente **más negativo** (o más pequeño) en el vector de costos reducidos.
+ **Problema de minimización**: variable no básica con el coeficiente **más positivo** (o más grande) en el vector de costos reducidos.

La columna donde está ubicada dicha variable se denominará **columna pivote**.

En nuestro ejemplo, notemos que el vector de costos en la primera iteración es:

$$ c = (-3,-2,0,0,0) $$

Dado que, es un problema de maximización, entonces elegimos el valor más pequeño o análogamente el más negativo el cual corresponde a $-3$ ubicado en la primera posición que hace referencia a la variable $x_1$. La siguiente vráfica da un apoyo visual de este proceso:

<img src="../images/simplex_2_1.png">


#### 4. Seleccionar la variable de salida mediante la condición de factibilidad

La condición de factibilidad, ya sea un problema de maximización o minimización, analiza si el problema tiene solución no acotada. Esto se realiza mediante la verificación de que al menos uno de los valores de la columna pivote sea mayor que $0$.


Para determinar la **variable de salida** se debe dividir cada elemento de la columna $R$ (que en la primera iteración es igual al vector $b$) entre cada elemento de la columna correspondiente a la variable de entrada (siempre y cuando el divisor sea distinto de cero). Una vez calculado este cociente, entonces la variable de salida corresponde a la posición con el valor más pequeño, dicha posición hace referencia a una de las variables básicas, por lo que, se denotará a este renglón como **renglón pivote**.

A la posición que hace intersección entre la **columna pivote** y **renglón pivote**, le denotaremos como **elemento pivote**.

En nuestro ejemplo sería realizar lo siguiente:

$$ v_{{\text{exit}}} = R ./ x_1 = (35, 18, 26) ./ (2, 3, 2) = \left(\frac{35}{2}, \frac{18}{3}, \frac{26}{2}\right) = (17.5, 6, 13) $$

Luego tomamos el mínimo,
$$ \min (v_{{\text{exit}}})  = 6 $$

El cual corresponde a la segunda posición, que hace referencia a la variable $s_2$ del conjunto base.

El siguiente gráfico ayuda a entender este proceso:


<img src = "../images/simplex_3.png">


#### 5. Actualización del *tableau* mediante las operaciones de Gauss-Jordan

Una vez determinado el elemento pivote se proseguirá a realizar las operaciones de Gauss-Jordan para formar la matriz identidad ($I$) mediante la siguiente manera:
+ Renglón pivote: dividir el valor acutal de cada entrada entre el elemento pivote, esto hará que el pivote tenga un nuevo valor igual a $1$. Esto es:

$$\text{Nuevo renglón pivote} = \frac{\text{Renglón pivote actual}}{\text{Elemento pivote}}$$

La siguiente imagen representa esta operación:

<img src = "../images/simplex_4.png">

+ Otros renglones: restar del valor actual la multiplicación del elemento del renglón que se encuentra en la columna pivote por el nuevo valor calculado en el renglón pivote. Esto es:

$$\text{Nuevo valor} = \text{Valor actual} - \text{Elemento renglón columna pivote}*\text{Nuevo valor renglón pivote}$$

Este último cómputo en palabras puede ser muy complicado, por lo que, se apoya con la siguiente imagen que representa estas operaciones para el renglón correspondiente a $s_1$:

<img src = "../images/simplex_4_1.png">

Ahora para el renglón correspondiente a $s_3$:

<img src = "../images/simplex_4_2.png">

Y finalmente para el renglón correspondiente a $Z$:

<img src = "../images/simplex_4_3.png">

Finalmente, la matriz resultante que contiene estos pasos es la siguiente:

<img src = "../images/simplex_4_4.png">



Una vez llegado a este punto se vuelve al paso 3 y se verifica la condición de optimalidad.
