# Симплекс-метод
Задача линейного программирования является одной из первых задач выпуклой оптимизации, для которой удалось получить эффиктивные методы решения
$$
\begin{array}{rl}
\mbox{минимизировать } & c^Tx \\
\mbox{при условии } & Ax=b \\
& x\geq 0.\tag{1}
\end{array}
$$
Геометрически ограничения в виде линейных равенств и неравенств задают в пространстве многогранник, в котором мы должно найти самую дальнюю точку в какому-то направлении. Интуитивно понятно, что если задача ограничена, среди оптимальных решений обязательно найдется вершина многогранника, поэтому самым простым способом является аккуратно перебрать все вершины многогранника и найти минимум среди них, это уже даст нам решение за конечное число шагов. Давайте теперь формализуем этот подход.

<b>Определение.</b> При $A\in\mathbb{R}^{m\times n}$ вершиной задачи (1) называется точка $x$ такая, что $Ax=b$, $x\geq 0$ и при этом хотя бы $n-m$ компонент $x$ равны $0$.

<b>Лемма.</b> Для любой допустимой (1) точки $z$, не являющей вершиной, найдутся $x\neq y$ такие, что 
$$z=tx+(1-t)y,~t\in(0,1)$$
<b>Доказательство</b>. Раз $z$ не является вершиной, то хотя бы $m+1$ компоненты $z$ не равны нулю, обозначим эти компоненты за $S$. Рассмотрим вектора вида $e^{in}\in\mathbb{R}^n:~e^{in}_j=\delta_{ij}$, $\delta_{ij}$. Эти векторы линейно независимы, среди векторов, соответствующих $S$, найдется хотя бы один, который не попадает в линейную оболочку строк $A$, обозначим индекс этого вектора как $i$. Рассмотрим систему
$$
Ax=b,~x_i=d, x_j=0~\forall j\notin S.
$$
Так как при $d=z_i$ решение этой систмемы существует и равно $z$, в силу выбора $i$ получаем, что система разрешима для любого $d$. С другой стороны решение $x^*(d)$ этой задачи линейно (а следовательно непрерывно) по $d$. Таким образом существует такое $\epsilon<z_i$, что $x^*(z_i-\epsilon)\geq 0$ и $x^*(z_i+\epsilon)\geq 0$, что дает на искомые точки. $\#$

<b>Следствие</b>. Среди оптимальных точек найдется вершина.

<b>Доказательство.</b> На самом деле формально самой леммы недостаточно для доказательства этого факта, нужно продолжить доказательство этой леммы: в силу линейности $x^*(d)=db+p$ если для всех положительных $d$ выполняется $x^*(d)\geq 0$ и при этом $c^T x^*(d)-x^*(0)=dc^Tb<0$, то задача неограничена снизу, поэтому не имеет решения. Иначе существует некоторое пороговое значение $d^*$, при котором обнуляется одна из компонент $z$ не из $S$. Таким образом мы получаем не просто две точки такие, что $z$ лежит на отрезке, соединяющим эти две точки, но при этом еще и количество нулевых компонент у них увеличилось хотя бы на $1$. Повторив это нужное число раз можно получить вершины.

## Перебор вершин и симплекс-метод
Из указанного выше можно прийти к следующим двум простым алгоритмам:
* Первый алгоритм
  * Перебрать все возможные $n-m$-элементные подмножества переменных $S$
  * Решить систему $Ax=b, x_i=0,~i\in S$, проверить, что решение $x(S)\geq 0$.
  * Из полученных решений взять минимальное
* Второй алгоритм (Симплекс-метод):
  * Найти начальное подмножество $S_0$ такое, что система $Ax=b, x_i=0,~i\in S_0$ разрешима и $x(S_0)\geq 0$.
  * Пока в $S_k$ можно заменить один индекс так, чтобы выполнялось $x(S_{k+1})\geq 0$ и $c^Tx(S_{k+1})\leq c^Tx(S_k)$ строить новые приближения соответствующей заменой.
  
Симплекс-метод можно воспринимать как алгоритм умного перебора, использующий выпуклость задачи. Тем не менее известно, что существуют [примеры](https://en.wikipedia.org/wiki/Klee%E2%80%93Minty_cube), на которых симплекс-метод имеет экспоненциальную сложность.

## Некоторые замечания
Приведение произвольной задачи оптимизации с линейным функционалом и линейными ограничениями к стандартной линейного программирования в стандартной форме (1) можно с помощью следующих преобразований:
* Замена произвольного неравенства
$$
A_ix\leq b_i
$$
на
$$
A_ix+s_i=b_i,~s_i\geq 0
$$
с добавлением вспомогательной переменной $s_i$ (<i>slack variable</i>).
* Переменные $x_i$, для которых нет ограничения $x_i\geq 0$ разбиваются следующим образом
$$
x_i=x^+_i-x^-_i, ~x^+_i,x^-_i\geq 0.
$$
* В некоторых случаях используются неравенства, а не равенства, от равенства можно избавиться простым способом
$$
Ax=b\Leftrightarrow Ax\geq b, Ax\leq b.
$$

Получение начального допустимого приблежения в симлекс-методе может быть получено двумя способами:
* Первое - сформулировать задачу в канонической форме
$$
\begin{array}{rl}
\mbox{минимизировать } & c^Tx \\
\mbox{при условии } & Ax\leq b \\
& x\geq 0
\end{array}
$$
с положительными компонентами в $b$. В этой задаче точка $x=0$ является допустимой, если мы хотим конвертировать эту задачу в стандартную форму (1), то достаточно только ввести дополняющие переменные
$$
Ax\leq b\Leftrightarrow Ax+s=b,~s\geq 0,
$$
где, соответственно, начальным приближением можно взять $x=0, s=b$.
* Второе - решение вспомогательной задачи
$$
\begin{array}{rl}
\mbox{максимизировать } & t \\
\mbox{при условии } & Ax=b \\
& x\geq t\mathbb{1}.
\end{array}
$$
Здесь мы можем взять в качестве начального приближения любое решение $Ax=b$ и $t=\min_ix_i$. Если оптимальное значение $t$ этой задачи меньше нуля, то исходная задача не имеет допустимых точек, иначе решение задачи может быть использовано как начальной приближение для (1).

In [1]:
import numpy as np
import matplotlib.pyplot as plt

In [2]:
# from two points defines the coefficients a, b, c such that a line ax+by=c goes through these points 
def get_line(x1, x2):
    a = x1[1] - x2[1]
    b = x2[0] - x1[0]
    c = a * x1[0] + b * x1[1]
    return a, b, c

vertices = [(2.0, 2.0), (1.9, 3.0), (2.5, 4.0), (4.0, 4.2), (4.7, 3.5), (4.5, 1.5), (3.5, 1.0), (2.0, 2.0)]
A = []
b = []

for i in range(len(vertices) - 1):
    a_, b_, c_ = get_line(vertices[i], vertices[i + 1])
    A.append([a_, b_])
    b.append(c_)
A = np.array(A)
b = np.array(b)
direction = np.array([-2, -1]) # c

In [3]:
def fix_scaling(ax=None):
    if not ax:
        xlim = plt.xlim()
        ylim = plt.ylim()
        d1 = xlim[1] - xlim[0]
        d2 = ylim[1] - ylim[0]
        if d1 > d2:
            plt.ylim((ylim[0] - (d1-d2) / 2, ylim[1] + (d1-d2) / 2))
        else:
            plt.xlim((xlim[0] + (d1-d2) / 2, xlim[1] - (d1-d2) / 2))
    else:
        xlim = ax.get_xlim()
        ylim = ax.get_ylim()
        d1 = xlim[1] - xlim[0]
        d2 = ylim[1] - ylim[0]
        if d1 > d2:
            ax.set_ylim((ylim[0] - (d1-d2) / 2, ylim[1] + (d1-d2) / 2))
        else:
            ax.set_xlim((xlim[0] + (d1-d2) / 2, xlim[1] - (d1-d2) / 2))

In [4]:
import scipy
import scipy.optimize
simplex_steps = []
scipy.optimize.linprog(direction, A_ub=A, b_ub=b, method='revised simplex',
                       callback=lambda xk, **kwargs: simplex_steps.append([xk.copy(), kwargs.copy()]))

     con: array([], dtype=float64)
     fun: -12.900000000000002
 message: 'Optimization terminated successfully.'
     nit: 6
   slack: array([ 2.8500000e+00,  2.5000000e+00,  1.1900000e+00, -8.8817842e-16,
        0.0000000e+00,  1.9000000e+00,  4.9500000e+00])
  status: 0
 success: True
       x: array([4.7, 3.5])

In [5]:
for x, _ in simplex_steps:
    print(x['x'], x['phase'])

[0. 0.] 1
[0.1 0. ] 1
[1.5        2.33333333] 1
[2. 2.] 1
[2. 2.] 2
[3.5 1. ] 2
[4.5 1.5] 2
[4.7 3.5] 2


In [6]:
from interactive_visualization.animation_utils import animate_list

In [7]:
x_simplex_1 = [x['x'] for x, info in simplex_steps if x['phase'] == 1]
x_simplex_2 = [x['x'] for x, info in simplex_steps if x['phase'] == 2]
#print(x_simplex_1, x_simplex_2)

def simplex_state(i):
    fig, ax = plt.subplots(figsize=(10, 10))
    ax.plot([x for x, y in vertices], [y for x, y in vertices])
    ax.plot(0, 0, 'o')
    ax.text(-0.2, -0.2, '$(0, 0)$', fontsize=20)
    ax.plot([0, 5], [0, 0], ':', color='black')
    ax.plot([0, 0], [0, 4], ':', color='black')
    ax.plot([0.1, 1.9], [0.0,  3.0], ':', color='black')
    ax.plot([1.5, 2.0], [2.33333333, 2.0], ':', color='black')
    fix_scaling(ax)
    #ax.axis('off')
    path1, = ax.plot([], [])
    path2, = ax.plot([], [])
    
    num2 = 0 if i < len(x_simplex_1) else (i - len(x_simplex_1) + 1)
    path1.set_data([x for x, y in x_simplex_1[:i + 1]], [y for x, y in x_simplex_1[:i + 1]])
    path2.set_data([x for x, y in x_simplex_2[:num2]], [y for x, y in x_simplex_2[:num2]])
    x = simplex_steps[min(i, len(simplex_steps) - 1)][0]['x'][0]
    y = simplex_steps[min(i, len(simplex_steps) - 1)][0]['x'][1]
    #print(i)
    ax.plot(x, y, 'o', color='red')
    
    plt.close(fig)
    return fig

animate_list([simplex_state(i) for i in range(len(simplex_steps))]);

HBox(children=(Button(description='Prev', style=ButtonStyle()), Button(description='Next', style=ButtonStyle()…

interactive(children=(IntSlider(value=0, description='step', max=7), Output()), _dom_classes=('widget-interact…