# Задачи выпуклого программирования
## Выполнил: Яковлев Артур, 853501
## Проверила: Костюкова О.И.

In [1]:
import numpy as np
import scipy.linalg as sla

from copy import deepcopy

### Вариант 7

$$
\begin{equation}
    \begin{cases}
        f(x) = x_1^2 + x_2^2 + 16x_2^3 - 2x_1 x_2 + 8x_1x_3 - 8x_2x_3 \rightarrow min\\
        x_1 - x_2 + 4x_3 \leq 4\\
        x_1^2 - 2x_1 x_3 + 4x_3^2 \leq 3
    \end{cases}
\end{equation}
$$

$ g_1(x) = x_1 - x_2 + 4x_3 - 4 $

$ g_2(x) = x_1^2 - 2x_1 x_3 + 4x_3^2 - 3 $

$ x = \begin{pmatrix}
           1 \\
           1 \\
           1
         \end{pmatrix}$
         
Проверим, является ли данный план допустимым

$ g_1(x) = 1 - 1 + 4 - 4 = 0 \leq 0 $

$ g_2(x) = 1 - 2 + 4 - 3 = 0 \leq 0 $

Таким образом план допустимый

Найдем частные производные для $f(x)$

$ \frac{\partial f}{\partial x_1} = 2x_1 - 2x_2 + 8x_3 $

$ \frac{\partial f}{\partial x_2} = 2x_2 + 48x_2^2 - 2x_1 - 8x_3 $

$ \frac{\partial f}{\partial x_3} = 8x_1 - 8x_2 $

Получаем:

$$
\frac{\partial f}{\partial x} = \begin{pmatrix}
           2x_1 - 2x_2 + 8x_3 \\
           2x_2 + 48x_2^2 - 2x_1 - 8x_3 \\
           8x_1 - 8x_2
         \end{pmatrix}
$$

Частные производные для $g_1$ и $g_2$

$$
\frac{\partial g_1}{\partial x} =  \begin{pmatrix}
           1 \\
           -1 \\
           4
         \end{pmatrix}
$$

$$
\frac{\partial g_2}{\partial x} =  \begin{pmatrix}
           2x_1 - 2x_3 \\
           0 \\
           -2x_1 + 8x_3
         \end{pmatrix}
$$

Теперь подставим наш вектор $x$ в полученные выражения

$$
\frac{\partial f}{\partial x} = \begin{pmatrix}
           8 \\
           40 \\
           0
         \end{pmatrix}
$$

$$
\frac{\partial g_1}{\partial x} =  \begin{pmatrix}
           1 \\
           -1 \\
           4
         \end{pmatrix}
$$

$$
\frac{\partial g_2}{\partial x} =  \begin{pmatrix}
           0 \\
           0 \\
           6
         \end{pmatrix}
$$

Теперь попробуем найти значения $\lambda_1$ и $\lambda_2$ для данного плана

$$
\begin{pmatrix}
8 \\
40 \\
0
\end{pmatrix} + \lambda_1 
\begin{pmatrix}
1 \\
-1 \\
4
\end{pmatrix} + \lambda_2 
\begin{pmatrix}
0 \\
0 \\
6
\end{pmatrix} = 
\begin{pmatrix}
0 \\
0 \\
0
\end{pmatrix}
$$

$$
\begin{equation}
    \begin{cases}
        1 \cdot \lambda_1 + 0 \cdot \lambda_2 = -8\\
        -1 \cdot \lambda_1 + 0 \cdot \lambda_2 = -40\\
        4 \lambda_1 + 6 \lambda_2 = 0
    \end{cases}
\end{equation}
$$

Данная система не имеет решений, так как из первых двух уравнений имеем $\lambda_1 = -8$ и $\lambda_1 = 40$, что невозможно. Поэтому план $x$ не является оптимальным.

### Вариант 4

Исходные данные для выбранного варианта задания

In [2]:
dataset = {
    'B': [
        np.array([
            [1., 4., -3., 6., 3., 1., 0., -1.],
            [0., 2., 1., -1., 0., 6., 2., 4.],
        ]),
        np.array([
            [0., 0., 0.5, 0., -1., 0.5, 0., -2.],
            [0.5, 0., -0.5, 0., 0.5, -0.5, -0.5, -0.5],
            [0.5, 0.5, 0.5, 0., 0.5, 0., 2.5, 4.],
        ]),
        np.array([
            [1., 2., -1.5, 3., -2.5, 0., -1., -0.5],
            [-1.5, -0.5, -1., -2.5, 3.5, -3., -1.5, -0.5],
            [1.5, 2.5, -1., 1., 2.5, 1.5, 3., 0.]
        ]),
        np.array([
            [0.75, 0.5, 1., 0.25, 0.25, 0., 0.25, 0.75],
            [-1., 1., 4., 0.75, -0.75, 0.5, 8., -0.75],
            [0.5, -0.25, 0.5, 0.75, 0.5, 1.25, -0.75, -0.25]
        ]),
        np.array([
            [2.5, -1.5, -1.5, 2., 1.5, 0., 0.5, -1.5],
            [-0.5, -2.5, -0.5, -6., -2.5, 4.5, 1., 1.],
            [-2.5, 1., -2., -1.5, -2.5, 0.5, 8.5, -2.5],
        ]),
        np.array([
            [1., 0.25, -0.5, 0., 1.25, -0.5, 0.25, -0.75],
            [-1., -0.75, -0.75, 0.5, -0.25, -1.25, 0.25, -0.5],
            [0., 0.75, 0.5, -0.5, -1., 1., -1., 1.],
        ]),
    ],
    'c': [
        np.array([-2., -4., -1., -1., -2., 0., -3., -3.]),
        np.array([60., 0., 80., 0., 0., 0., 40., 0.]),
        np.array([2., 0., 3., 2., 2., 0., 3., 0.]),
        np.array([0., 0., 80., 0., 0., 0., 0., 0.]),
        np.array([0., -2., 1., 2., 0., 0., -2., 1.]),
        np.array([-4., -2., 6., 0., 4., -2., 60., 2.]),
    ],
    'a': np.array([0., -84.25, -158.75, -126.5625, -117.625, -17.8125]),
}

eps = 1e-9
x = np.array([0., 3., 1., 1., 0., 2., 0., 0.])

Далее заметим, что произведение $B_i^T \cdot B_i$ является квадратной симметричной матрицей. Это позволяет упростить вычисление производных по вектору $x$ для функций $f(x)$ и $g_i(x)$.

Воспользуемся формулой матричного дифференцирования для выражения $x^TAx$.

$$
\frac{\partial x^TAx}{\partial x} = (A^T + A)x
$$

Для симметричной $A$ получаем $\frac{\partial x^TAx}{\partial x} = 2Ax$. Далее известно, что $\frac{\partial cx}{\partial x} = c$. Теперь запишем формулы производных для функций $f$ и $g_i$

$$
\frac{\partial f}{\partial x} = (B^T_0 B_0)x + c_0
$$

$$
\frac{\partial g_i}{\partial x} = (B^T_i B_i)x + c_i
$$

In [3]:
class Solver:
    def __init__(self, dataset):
        self.B = [B.T @ B for B in dataset['B']]
        self.c = deepcopy(dataset['c'])
        self.alpha = deepcopy(dataset['a'])
        self.count = len(self.B)
        self.g = lambda x, i: 0.5 * x @ self.B[i] @ x + self.c[i] @ x + self.alpha[i]
        self.partial_g = lambda x, i: self.B[i] @ x + self.c[i]
    
    def is_valid(self, x):
        for i in range(1, self.count):
            if self.g(x, i) > eps:
                return False
        return True
    
    def is_optimal(self, x):
        A = np.stack([self.partial_g(x, i) for i in range(1, self.count)]).T
        b = self.partial_g(x, 0)
        result = sla.lstsq(A, -b)
        solution, error = result[0], result[1]
        if np.sum(error) > eps or np.any(np.solution < eps):
            return None
        return solution

In [4]:
solver = Solver(dataset)

Проверим, является ли план $x$ допустимым

In [5]:
solver.is_valid(x)

True

Для поиска оптимального плана нам необходимы массивы $J_0 = \{j \in J = \{0, 1, \dots, 7\} : x_j = 0 \}$ и $I_0 = \{i \in I: g_i(x) = 0 \}$. Найдем данные массивы

In [6]:
I = [i for i in range(1, len(solver.B)) if np.abs(solver.g(x, i)) < eps]
print(f'I = {I}')

I = [1, 3, 5]


In [7]:
J_0 = np.argwhere(np.abs(x) < eps).ravel()
J_0

array([0, 4, 6, 7])

В таком случае нам необходимо решить задачу

$$
\begin{equation}
    \begin{cases}
        \left(l, \frac{\partial f}{\partial x}\right) \rightarrow min \\
        \left(l, \frac{\partial g_i}{\partial x}\right) \leq 0, i \in I \\
        l_j \geq 0, j \in J \\
        |l_j| \leq 1, j \in J
    \end{cases}
\end{equation}
$$

Преобразуем данную задачу для решения симплекс методом

$$
A = \begin{pmatrix}
           \frac{\partial g_1}{\partial x} \\
           \frac{\partial g_1}{\partial x} \\
           \frac{\partial g_1}{\partial x}
     \end{pmatrix}
$$

$$
c = -\frac{\partial f}{\partial x}
$$

$$
b = \begin{pmatrix}
           0 \\
           0 \\
           0
     \end{pmatrix}
$$

$$
d_* = \begin{pmatrix} 0 \\ -1 \\ -1 \\ -1 \\ 0 \\ -1 \\ 0 \\ 0 \end{pmatrix}, 
d^* = \begin{pmatrix} 1 \\ 1 \\ 1 \\ 1 \\ 1 \\ 1 \\ 1 \\ 1 \end{pmatrix}
$$

$$
\begin{equation}
    \begin{cases}
        cl \rightarrow max \\
        Al \leq b \\
        d_* \leq l \leq d^*
    \end{cases}
\end{equation}
$$

In [8]:
A = np.stack([solver.partial_g(x, i) for i in I])
b = np.zeros(A.shape[0], dtype='float64')
c = -solver.partial_g(x, 0)
lower = np.array([-1 if x[i] > eps else 0 for i in range(x.shape[0])], dtype='float64')
upper = np.ones(x.shape[0], dtype='float64')

In [9]:
def solve(data, max_iters=200, verbose=True):
    dataset = deepcopy(data)
    B = sla.inv(dataset['A'][:, dataset['Jb']])
    
    if verbose:
        print(f'A_b = {dataset["A"][:, dataset["Jb"]]}')
        print(f'c_b = {dataset["c"][dataset["Jb"]]}')
        print(f'B = {B}')
        print(f'Jb = {dataset["Jb"]}')
    
    # Step 1
    y = dataset['c'][dataset['Jb']] @ B
    delta_j = y @ dataset['A'] - dataset['c']
    Jn = [i for i in range(dataset['c'].shape[0]) if i not in dataset['Jb']]
    Jn_pos = [i for i in Jn if delta_j[i] > -eps]
    Jn_neg = [i for i in Jn if delta_j[i] <= -eps]
    
    if verbose:
        print('\nStep 1\n')
        print(f'y = {y}')
        print(f'delta j = {delta_j}')
        print(f'Jn = {Jn}')
        print(f'Jn+ = {Jn_pos}')
        print(f'Jn- = {Jn_neg}')
    
    for it in range(max_iters):
        # Step 2
        x = np.zeros(dataset['c'].shape[0])
        x[Jn_pos] = dataset['lower'][Jn_pos]
        x[Jn_neg] = dataset['upper'][Jn_neg]
        x[dataset['Jb']] = B.dot(dataset['b'] - np.sum(dataset['A'][:, Jn] * x[Jn], axis=1))
        # x[dataset['Jb']] = B.dot(dataset['b'] - sum([dataset['A'][:, j].dot(x[j]) for j in Jn]))
        
        if verbose:
            print('\n===========================================\n')
            print(f'Iteration {it + 1}')
            print('\nStep 2\n')
            print(f'x = {x}')

        # Step 3
        if np.all(dataset['lower'] < x + eps) and np.all(x - eps < dataset['upper']):
            print(f'\nOptimal plan: {x}\n')
            print(f'cx = {-dataset["c"] @ x}')
            return x

        # Step 4
        for i in range(len(dataset['Jb'])):
            j_i = dataset['Jb'][i]
            if dataset['lower'][j_i] > x[j_i] or x[j_i] > dataset['upper'][j_i]:
                j_k = i
                break
        
        if verbose:
            print('\nStep 4\n')
            print(f'jk = {dataset["Jb"][j_k]}')

        # Step 5
        mu_jk = 1 if x[dataset["Jb"][j_k]] < dataset['lower'][dataset["Jb"][j_k]] else -1
        delta_y = mu_jk * B[j_k]
        mu_j = delta_y @ dataset['A']
        
        if verbose:
            print('\nStep 5\n')
            print(f'mu_jk = {mu_jk}')
            print(f'delta y = {delta_y}')
            print(f'mu_j = {mu_j}')

        # Step 6
        sigma_j = np.array([np.inf] * dataset['c'].shape[0])
        for i in Jn_pos:
            if mu_j[i] < eps:
                sigma_j[i] = -delta_j[i] / mu_j[i]

        for i in Jn_neg:
            if mu_j[i] > -eps:
                sigma_j[i] = -delta_j[i] / mu_j[i]
        
        j0 = np.argmin(sigma_j)
        sigma0 = sigma_j[j0]
        # To prevent -inf as sigma0
        while sigma0 == -np.inf:
            sigma_j[j0] = np.inf
            j0 = np.argmin(sigma_j)
            sigma0 = sigma_j[j0]
        
        if verbose:
            print('\nStep 6\n')
            print(f'sigma_j = {sigma_j}')
            print(f'j* = {j0}')
            print(f'sigma0 = {sigma0}')

        # Step 7
        if sigma0 == np.inf:
            print('\nSolution does not exist')
            return

        # Step 8
        delta_j += sigma0 * mu_j
        dataset['Jb'].pop(j_k)
        delta_j[dataset['Jb']] = 0.
        dataset['Jb'] = [j0] + dataset['Jb']
        # dataset['Jb'].sort()
        
        if verbose:
            print('\nStep 8\n')
            print(f'New delta j = {delta_j}')
            print(f'Jb = {dataset["Jb"]}')
        
        # Step 9
        B = sla.inv(dataset['A'][:, dataset['Jb']])
        Jn = [i for i in range(dataset['c'].shape[0]) if i not in dataset['Jb']]
        Jn_pos = [i for i in Jn if delta_j[i] > -eps]
        Jn_neg = [i for i in Jn if delta_j[i] <= -eps]
        
        if verbose:
            print('\nStep 9\n')
            print(f'A_b = {dataset["A"][:, dataset["Jb"]]}')
            print(f'B = {B}')
            print(f'Jn = {Jn}')
            print(f'Jn+ = {Jn_pos}')
            print(f'Jn- = {Jn_neg}')
        
    print(f'\nBest found solution: {x}')

In [10]:
l = solve({
    'A': A,
    'b': b,
    'c': c,
    'upper': upper,
    
    'lower': lower,
    'Jb': [0, 4, 6],
}, verbose=False)


Optimal plan: [ 0.         -0.54347422 -0.15935912  1.          0.         -1.
  0.33203502  0.        ]

cx = -79.97205638220197


Так как значение целевой функции меньше 0, значит план $x$ не является оптимальным. Построим новый план, взяв в качестве начального $\overline{x} = (0, 0, 0, 0, 0, 0, 0, 0)$. Построим новый план в виде $x(t) = x + t(1^0 + \alpha \Delta x), \Delta x = \overline{x} - x$

Подберем $\alpha > 0$, чтобы выполнялось нервенство:

$$
\frac{\partial f}{\partial x}l + \alpha \frac{\partial f}{\partial x} \Delta x < 0
$$

In [11]:
solver.partial_g(x, 0) @ l + 5 * solver.partial_g(x, 0) @ (-x)

-3074.972056382202

In [15]:
5 * solver.partial_g(x, 0) @ (-x)

-2995.0

$\alpha = 5$ удовлетворяет нашему условию. Теперь подберем $t$ такое, при котором выполняются:

$f(x(t)) < f(x)$

$g_i(x(t)) < 0$

$x(t) \geq 0$

In [12]:
x_t = x + (0.05) * (1 - x * 5)
x_t

array([0.05, 2.3 , 0.8 , 0.8 , 0.05, 1.55, 0.05, 0.05])

In [13]:
for i in range(1, 6):
    print(solver.g(x_t, i))

-12.181562499999998
-65.96843750000001
-31.679296875000006
-107.516875
-4.52890625


In [14]:
solver.g(x_t, 0), solver.g(x, 0)

(177.96499999999997, 292.5)

Таким образом, план $(0.05, 2.3 , 0.8 , 0.8 , 0.05, 1.55, 0.05, 0.05)$ является оптимальным.