In [1]:
import numpy as np
import matplotlib.pyplot as plt

Входные данные:
<br>
e1, e2, e3, e4 - погрешности для $x, x_s, y, y_s$ соответственно <br>
k_max - максимальное число итераций метода центрального пути

In [2]:
A = np.array([[1, 2]])
b = np.array([2])
c = np.array([3, 4])
m, n = A.shape[0], A.shape[1]
e1, e2, e3, e4 = 0.001, 0.001, 0.001, 0.001
k_max = 100

### а) Показать, что, если алгоритм центрального пути сходится, то он сходится к решения задачи ЛП

<div style="float: left; width: 30%;">Прямая задача: <br>
max $c^Tx$ <br>
$Ax + x_s = b$ <br>
$x, x_s \geq 0$
</div><div style="float: left; width: 70%;">
Двойственная задача: <br>
min $b^Ty$ <br>
$A^Ty - y_s = c$ <br>
$y, y_s \geq 0$
</div><div class="clear">
<t>На каждом шаге ищем $x, x_s, y, y_s$ такие, что F($x, x_s, y, y_s, \mu$) = $\begin{pmatrix} Ax + x_s - b \\  A^Ty - y_s - c\\ XY_s\textbf1 - \mu\textbf1 \\ X_sY\textbf1 - \mu\textbf1 \end{pmatrix} = \vec0$ 
<br> Уравнения из первых двух строчек системы гарантируют нам, что точки $x, x_s, y, y_s$ являются допустимыми для соответствующих задач ЛП
<br> Из последних двух уравнений получаем, что в пределе ($\mu = 0$) $x^iy_s^i = 0, x_s^jy^j = 0$  $\forall i \in\overline{1,n}, j \in\overline{1,m}  $, из чего при помощи теоремы о комплиментарности делаем вывод, что $x, x_s, y, y_s$ - решения соответствующих задач ЛП

### b) Реализовать алгоритм демпфированного метода Ньютона 
для задачи <br>solve $F(x, 𝑥𝑠, 𝑦, 𝑦𝑠, 𝜇) = \vec0$ <br>$x,x_s,y,y_s>0$

Функция F векторная, метод Ньютона определен для скалярной. Будем решать задачу G($x, x_s, y, y_s, \mu$) = $<F,F>^2$, ее решение, очевидно, является решением исходной. <br>


In [3]:
def G_value(x, x_s, y, y_s, mu):
    r1, r2 = np.dot(A, x) + x_s - b, np.dot(A.transpose(), y) - y_s - c
    v1, v2 = np.array([x[i]*y_s[i] - mu for i in range(len(x))]), np.array([x_s[j]*y[j] - mu for j in range(len(y))])
    return np.dot(r1, r1) + np.dot(r2, r2) + np.dot(v1, v1) + np.dot(v2, v2)

gradG может быть посчитан аналитически <br>
$\frac{\partial G}{\partial x^i} = 2(Ax + x_s -b)A^T[i] + 2(x^iy_s^i - \mu)y_s^i$,   $i \in \overline{1,n}$ <br>
$\frac{\partial G}{\partial x_s^j} = 2(Ax + x_s -b)\textbf1 + 2(x_s^jy^j - \mu)y^j$,   $j \in \overline{1,m}$ <br>
$\frac{\partial G}{\partial y^j} = 2(A^Ty - y_s - c)A[j] + 2(x_s^jy^j - \mu)x_s^j$,   $j \in \overline{1,m}$ <br>
$\frac{\partial G}{\partial y_s^i} = -2(A^Ty - y_s - c)\textbf1 + 2(x^iy_s^i - \mu)x^i$,   $i \in\overline{1,n}$ <br>
Здесь A[i] - i-ая строка матрицы А

In [4]:
def grad_G(x, x_s, y, y_s, mu):
    r1 = np.dot(A, x) + x_s - b,
    r2 = np.dot(A.transpose(), y) - y_s - c
    dot1, dot2 = np.dot(r1, np.ones(len(r1))), np.dot(r2, np.ones(len(r2)))
    grad_x, grad_x_s, grad_y, grad_y_s = np.zeros(len(x)), np.zeros(len(x_s)), np.zeros(len(y)), np.zeros(len(y_s))
    for i in range(len(x)):
        grad_x[i] = 2*np.dot(r1, A.transpose()[i]) + 2*(x[i]*y_s[i] - mu)*y_s[i]
        grad_y_s[i] = -2*dot2 + 2*(x[i]*y_s[i] - mu)*x[i]
    for j in range(len(y)):
        grad_y[j] = 2*np.dot(r2, A[j]) + 2*(x_s[j]*y[j] - mu)*x_s[j]
        grad_x_s[j] = 2*dot1 + 2*(x_s[j]*y[j] - mu)*y[j]
    return grad_x, grad_x_s, grad_y, grad_y_s

В следующей функции определяем, куда нам шагнуть из текущего положения <br>
$x_{n+1} = x_n - \alpha \frac {gradG(x_n)}{|gradG(x_n)|}$ <br>
$\alpha$ выбираем так, чтобы координаты $x_{n+1}$ были неотрицательными <br>
$\alpha_{max} = \frac {G(x_n)}{|gradG(x_n)|}$ <br>
$\alpha = min(\alpha_{max}, min(\frac {x_i}{gradG[i]}, \alpha_{max}))$  $\forall i$ т.ч $gradG[i] > 0$



In [5]:
def calc_next_point(x, x_s, y, y_s, mu):
    grad_x, grad_x_s, grad_y, grad_y_s = grad_G(x, x_s, y, y_s, mu)
    X = np.hstack((x, x_s, y, y_s))
    gradG_X = np.hstack((grad_x, grad_x_s, grad_y, grad_y_s))
    G_X = G_value(x, x_s, y, y_s, mu)
    alpha = G_X/np.linalg.norm(gradG_X)
    for i in range(len(X)):
        if gradG_X[i] > 0:
            alpha = min(alpha, X[i]/gradG_X[i])
    X_next = X - alpha*gradG_X/np.linalg.norm(gradG_X)
    print "G: " + str(G_X)
    return X_next[:len(x)], X_next[len(x):len(x) + len(x_s)], X_next[len(x) + len(x_s):len(x) + len(x_s) + len(y)], X_next[len(x) + len(x_s) + len(y):len(x) + len(x_s) + len(y) + len(y_s)]

Наконец, находим решение задачи G = 0

In [6]:
def solve_G(mu):
    x, y_s, x_s, y = np.ones(n), np.ones(n), np.ones(m), np.ones(m)
    for i in range(1000):
        x_next, x_s_next, y_next, y_s_next = calc_next_point(x, x_s, y, y_s, mu)
        if np.linalg.norm(x - x_next) <= e1 and np.linalg.norm(x_s - x_s_next) <= e2 and np.linalg.norm(y - y_next) <= e3 and np.linalg.norm(y_s - y_s_next) <= e4:
                break;
        x, x_s, y, y_s = x_next, x_s_next, y_next, y_s_next
    return x, x_s, y, y_s

print solve_G(0)

G: 25.0
G: 23.406894905
G: 21.877895616
G: 20.4123804174
G: 19.0096938888
G: 17.669146657
G: 16.3900155611
G: 15.1715442501
G: 14.012944206
G: 12.9133961475
G: 11.8720517225
G: 10.8880353378
G: 9.96044590491
G: 9.08835819733
G: 8.27082343434
G: 7.50686861525
G: 6.79549405306
G: 6.13566849766
G: 5.52632121523
G: 4.96633042186
G: 4.45450757969
G: 3.98957728281
G: 3.57015282338
G: 3.19470807283
G: 2.86154706706
G: 2.56877365346
G: 2.31426468187
G: 2.09565134394
G: 1.91031407958
G: 1.75539654248
G: 1.62784298122
G: 1.52446076591
G: 1.4420057866
G: 1.37728368235
G: 1.32725539668
G: 1.28913285379
G: 1.26045116417
G: 1.23910839961
G: 1.22337136364
G: 1.21185295284
G: 1.20347091243
G: 1.19739824992
G: 1.19301339582
(array([ 0.71965928,  0.50639327]), array([ 0.25519831]), array([ 2.04537132]), array([ 0.00210473,  0.0203493 ]))
