# Algorytm sympleksowy

Algorytm sympleksowy służy do rozwiązywania problemów programowania liniowego, tzn.

$$(*)\left\{
\begin{array}{lll}
&\boldsymbol{c}^T\boldsymbol{x}\to \max\\
&\text{przy ograniczeniach}\\
& A\boldsymbol{x}\le\boldsymbol{b},\\
& \boldsymbol{x}\ge 0,\\
\end{array}
\right.$$

gdzie $\boldsymbol{x} = [x_1, ..., x_n]^T, \boldsymbol{c} = [c_1, ..., c_n]^T\in\mathbb{R}^n$, $\boldsymbol{b} = [b_1, ..., b_m]^T\in\mathbb{R}^m$ oraz $A = [a_{ij}]\in\mathcal{M}_{m,n}(\mathbb{R})$.

# Metoda

Rozważmy następujący problem optymalizacyjny z ograniczeniami

$$(P_1)\left\{
\begin{array}{lll}
&-0.5(x+y)\to \min\\
&\text{przy ograniczeniach}\\
& x - y \le 2,\\
& x - y \ge -3,\\
& -2x - y \ge -10,\\
& x, y\ge 0.\\
\end{array}
\right.$$

Po pierwsze, powinniśmy zadbać o to by był on w takiej samej postaci jak $(*)$, tzn. 

$$(P_1^*)\left\{
\begin{array}{lll}
&0.5(x+y)\to \max\\
&\text{przy ograniczeniach}\\
& x - y \le 2,\\
& -x + y \le 3,\\
& 2x + y \le 10,\\
& x, y\ge 0.\\
\end{array}
\right.$$

Zobaczmy jak problem $(P_1^*)$ wygląda na wykresie.

![Wykres](wykres.png) 

Dodajemy zmienne bazowe $s_1, s_2, s_3$ tak, aby zmienić ograniczenia typu '$\le$' na '$=$', czyli

$$(P_1^{*})\left\{
\begin{array}{lll}
&0.5(x+y)\to \max\\
&\text{przy ograniczeniach}\\
& x - y + s_1 = 2,\\
& -x + y + s_2 = 3,\\
& 2x + y + s_3 = 10,\\
& x, y, s_1, s_2, s_3\ge 0.\\
\end{array}
\right.$$

Następnie tworzymy tablice sympleksową, tzn.

$$
B = \begin{bmatrix}
&A                  &|&  I_{m\times m} \hspace{0.1cm} &|&  \boldsymbol{b} &\\
&-\boldsymbol{c}^T  &|&  \boldsymbol{0^T_m}           &|&  0 &
\end{bmatrix}
$$

W naszym przykładzie tablica ta ma postać

$$
B = \begin{bmatrix}
x & y & s_1 & s_2 & s_3 & \\
1 & -1 & 1 & 0 & 0 & 2 & s_1\\
-1 & 1 & 0 & 1 & 0 & 3 & s_2\\
2 & 1 & 0 & 0 & 1 & 10 & s_3\\
-0.5 & -0.5 & 0 & 0 & 0 & 0
\end{bmatrix}
$$

Dodatkowo odnotujmy dopuszczalne rozwiązanie bazowe, tj. $(x, y, s_1, s_2, s_3) = (0, 0, 2, 3, 10)$. Będziemy je aktualizować, po każdym kroku algorytmu. $$$$
Przechodzimy do metody. 
1. Na początek sprawdzamy czy ostatni wiersz macierzy B zawiera wartości ujemne. Jeśli nie, to znaleźliśmy rozwiązanie optymalne. W przeciwnym razie szukamy najmniejszej wartości ujemnej. Kolumna, którą wybraliśmy, decyduje o zmiennej, wychodzącej z bazy. $\longrightarrow$ W naszym przykładzie ostatnia kolumna zawiera dwie takie same ujemne wartości. Wybieramy tą, która odpowiada pierwszej kolumnie. Do bazy wchodzi zmienna $x$. 
2. Następnie sprawdzamy, czy istnieje jakakolwiek dodatnia wartość pośród pozostałych współczynników z wybranej kolumny. Jeśli nie, to problem jest nieograniczony. W przeciwnym razie szukamy najmniejszej wartości nieujemnej z dzielenia ostatniej kolumny macierzy B (bez ostatniego wiersza) przez kolumnę pozostałych współczynników z kroku nr 1. Odpowiada ona numerowi wiersza zmiennej, która wychodzi z bazy. $\longrightarrow$ W naszym przykładzie istnieją dwie dotatnie wartości w pierwszej kolumnie, tj. $1$ i $2$. Wykonujemy dzielenie i wybieramy najmniejszą wartość, tutaj to $\frac{2}{1}=2$. Z bazy wychodzi zmienna $s_1$.
3. W ostatnim kroku wykonujemy eliminację Gaussa dla kolumny z kroku nr 1 względem wiersza z kroku nr 2 oraz aktualizujemy dopuszczalne rozwiązanie bazowe.

$$
B = \begin{bmatrix}
x & y & s_1 & s_2 & s_3 & \\
1 & -1 & 1 & 0 & 0 & 2 & x\\
0 & 0 & 1 & 1 & 0 & 5 & s_2\\
0 & 3 & -2 & 0 & 1 & 6 & s_3\\
0 & -1 & 0.5 & 0 & 0 & 1
\end{bmatrix}
$$

Nowe dopuszczalne rozwiązanie bazowe, to $(x, y, s_1, s_2, s_3) = (2, 0, 0, 5, 14)$.

4. Iterujemy tak do momentu, w którym w ostatnim wierszu tablicy B znajdą się same nieujemne wartości.

$$
B = \begin{bmatrix}
x & y & s_1 & s_2 & s_3 & \\
1 & 0 & 0 & -\frac{1}{3} & \frac{1}{3} & \frac{7}{3} & x\\
0 & 0 & 1 & 1 & 0 & 5 & s_1\\
0 & 1 & 0 & \frac{2}{3} & \frac{1}{3} & \frac{16}{3} & y\\
0 & 0 & 0 & \frac{1}{6} & \frac{1}{3} & \frac{23}{6}
\end{bmatrix}
$$

Ostateczne dopuszczalne rozwiązanie bazowe, to $(x, y, s_1, s_2, s_3) = \left(\frac{7}{3}, \frac{16}{3}, 5, 0, 0\right)$.
Poszukiwane rozwiązanie, to $(x,y)=\left(\frac{7}{3}, \frac{16}{3}\right)$. Wartość funkcji celu dla problemu $(P_1^*)$ to $\frac{23}{6}$, czyli dla problemu $(P_1)$ to $\left(-\frac{23}{6}\right)$. Sprawdźmy rozwiązanie graficznie dla problemu $(P_1^*)$!

![Wykres2](BFS.png)

# Właściwy algorytm

In [1]:
import numpy as np
from copy import deepcopy

In [2]:
def non_neg(lst):
    return [x for x in lst if x >= 0] or None

In [3]:
def pos(lst):
    return [x for x in lst if x > 0] or None

In [7]:
def Simplex_solve(CONSTRAINTS_LEFT, CONSTRAINTS_RIGHT, OBJECTIVE_FUNCTION):
    
    #liczby ograniczeń i zmiennych
    NUM_OF_CONSTRAINTS = len(CONSTRAINTS_LEFT)
    NUM_OF_VARIABLES = len(OBJECTIVE_FUNCTION)
    
    #zmienna do przechowywania
    STORAGE = {}
    
    #jeśli listy są jednowymiarowe, to zamieniamy je na dwuwymiarowe dla poprawności obliczeń
    if np.ndim(CONSTRAINTS_RIGHT) != 2 and np.ndim(OBJECTIVE_FUNCTION) != 2:
        CONSTRAINTS_RIGHT = np.array([CONSTRAINTS_RIGHT])
        OBJECTIVE_FUNCTION = np.array([OBJECTIVE_FUNCTION])
    
    #tworzymy tablice sympleksową B
    I = np.identity(NUM_OF_CONSTRAINTS)
    PARTIAL_B = np.concatenate((CONSTRAINTS_LEFT, I, CONSTRAINTS_RIGHT.T), axis = 1) 
    LAST_ROW_OF_B = np.array([np.concatenate((-OBJECTIVE_FUNCTION, np.zeros((1, NUM_OF_CONSTRAINTS + 1))), axis = None)])
    B = np.concatenate((PARTIAL_B, LAST_ROW_OF_B), axis = 0)
    
    #zapisujemy rozwiązanie bazowe
    BFS = np.concatenate((np.zeros(NUM_OF_VARIABLES), CONSTRAINTS_RIGHT), axis = None)
    
    #główna treść algorytmu
    while min(B[NUM_OF_CONSTRAINTS]) < 0:
        #szukamy numeru kolumny, w której znajduje się maksymalna (-1)*wartość z ostatniego wiersza tablicy sympleksowej
        i, = np.where(np.isclose(-B[NUM_OF_CONSTRAINTS, :NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES], max(-B[NUM_OF_CONSTRAINTS, :NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES])))  
        #sprawdzamy ograniczoność problemu optymalizacyjnego
        if pos(B[:NUM_OF_CONSTRAINTS, i[0]]) == None:
            return print('Problem jest nieograniczony!')
        else:
            #następnie szukamy numeru wiersza, w której znajduje się najmniejsza nieujemna wartość z dzielenia ostatniej kolumny przez i-tą
            j, = np.where(np.isclose(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]], min(non_neg(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]]))))
        #wykonujemy to, aby określić, która ze zmiennych wychodzi z tablicy, a która wchodzi
        #następnie wykonujemy eliminację Gaussa dla i-tej kolumny, posługując się j-tym wierszem
        B[j[0], :] = B[j[0], :]/B[j[0], i[0]]
        for n in range(j[0] + 1, NUM_OF_CONSTRAINTS + 1):
            x = B[n, i[0]]/B[j[0], i[0]]
            B[n, :] = B[n, :] - x * B[j[0], :]
        for m in range(j[0]):
            y = B[m, i[0]]/B[j[0], i[0]]
            B[m, :] = B[m, :] - y * B[j[0], :]
        #aktualizujemy rozwiązanie bazowe z każdą iteracją 
        STORAGE[i[0]] = [j[0]]
        for key in STORAGE:
            for val in STORAGE[key]:
                temp = BFS[key]
                BFS[key] = B[val, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]
                BFS[NUM_OF_VARIABLES + val] = temp
        #wykonujemy te same kroki, dopóki w ostatnim wierszu pojawią się tylko dodatnie liczby
    
    #rozwiązanie
    SOLUTION = BFS[:NUM_OF_VARIABLES]
    OBJECTIVE_VALUE = B[NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]
    
    return print('Znaleziono rozwiązanie! \nWartość funkcji celu: '
                 + str(OBJECTIVE_VALUE) +'\nPunkt, w którym wartość ta jest przyjmowana: '+ str(SOLUTION))

# Przykłady zastosowania

### Problem $(P_1^*)$
$$(P_1^*)\left\{
\begin{array}{lll}
&0.5(x+y)\to \max\\
&\text{przy ograniczeniach}\\
& x - y \le 2,\\
& -x + y \le 3,\\
& 2x + y \le 10,\\
& x, y\ge 0.\\
\end{array}
\right.$$
### Rozwiązanie:

In [10]:
CONSTRAINTS_LEFT = np.array([[1, -1], 
                             [-1, 1],
                             [2, 1]]) 

CONSTRAINTS_RIGHT = np.array([2, 3, 10]) 

OBJECTIVE_FUNCTION = np.array([0.5, 0.5])

Simplex_solve(CONSTRAINTS_LEFT, CONSTRAINTS_RIGHT, OBJECTIVE_FUNCTION)

Znaleziono rozwiązanie! 
Wartość funkcji celu: 3.833333333333333
Punkt, w którym wartość ta jest przyjmowana: [2.33333333 5.33333333]


  j, = np.where(np.isclose(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]], min(non_neg(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]]))))


### Problem optymalizacji w $\mathbb{R}^4$
$$(P_2)\left\{
\begin{array}{lll}
&5x_1 - 3x_2 - 4x_3 + 7x_4\to \max\\
&\text{przy ograniczeniach}\\
& x_1 + x_2 + x_3 + x_4 \le 14,\\
& x_1 + x_3 \le 7,\\
& 2x_1 + x_2 + x_3 \le 13,\\
& x_1, x_2, x_3, x_4 \ge 0.\\
\end{array}
\right.$$
### Rozwiązanie:

In [41]:
CONSTRAINTS_LEFT = np.array([[1, 1, 1, 1],
                             [1, 0, 1, 0],
                             [2, 1, 1, 0]])

CONSTRAINTS_RIGHT = np.array([14, 7, 13])

OBJECTIVE_FUNCTION = np.array([5, -3, -4, 7])

Simplex_solve(CONSTRAINTS_LEFT, CONSTRAINTS_RIGHT, OBJECTIVE_FUNCTION)

Znaleziono rozwiązanie! 
Wartość funkcji celu: 98.0
Punkt, w którym wartość ta jest przyjmowana: [ 0.  0.  0. 14.]


  j, = np.where(np.isclose(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]], min(non_neg(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]]))))


### Sprawdzenie: 

In [42]:
from scipy.optimize import linprog

In [43]:
BOUNDS = [(0,float('inf')) ,(0,float('inf')) ,(0,float('inf')) ,(0,float('inf'))] #There are 4 bounds because 4 variables

optimize = linprog(c = -OBJECTIVE_FUNCTION,
                  A_ub = CONSTRAINTS_LEFT,
                  b_ub = CONSTRAINTS_RIGHT,
                  bounds = BOUNDS,
                  method = 'simplex')
optimize

  optimize = linprog(c = -OBJECTIVE_FUNCTION,


     con: array([], dtype=float64)
     fun: -98.0
 message: 'Optimization terminated successfully.'
     nit: 7
   slack: array([ 0.,  7., 13.])
  status: 0
 success: True
       x: array([ 0.,  0.,  0., 14.])

### Przykład w zastosowaniu do wyznaczania optymalnego portfela wzg. maksymalnego oczekiwanego zwrotu
Jesteśmy początkującym inwestorem z kapitałem początkowym 20 tys. PLN. Obserwowaliśmy na GPW akcje trzech różnych spółek, w które chcemy zainwestować. Amortyzując straty dobieramy do naszego portfela lokatę oprocentowaną 5% w skali roku. Wówczas, jeśli $\boldsymbol{x}=[x_0, x_1, x_2, x_3]^T$ opisuje portfel inwestycyjny, a $R_0, R_1, R_2, R_3$ są zmiennymi losowymi całkowalnymi, które opisują odpowiednio dzienne stopy zwrotu z intrumentu bezpiecznego (lokaty) oraz intrumentów ryzykownych (3 wybrane przez nas akcje), to problem znalezienia najlepszego portfela wzg. maksymalizowania oczekiwanego zysku możemy opisać za pomocą problemu optymalizacyjnego:

$$(\boldsymbol{\mu})\left\{
\begin{array}{lll}
&R_0x_0 + \mathbb{E}(R_1)x_1 + \mathbb{E}(R_2)x_2 + \mathbb{E}(R_3)x_3\to \max\\
&\text{przy ograniczeniu}\\
& x_0 + x_1 + x_2 + x_3 = 1.
\end{array}
\right.$$

W domu maklerskim dowiadujemy się, że:
1. Krótka sprzedaż jest zabroniona, tzn. $x_i\ge 0$ dla $i=1,2,3$;
2. Aktualnie dostępne są tylko 4 akcje spółki nr 1, 10 akcji spółki nr 2 oraz 40 akcji spółki nr 3.  
$$$$

Zatem nasz problem przyjmuje postać:

$$(\boldsymbol{\mu}^*)\left\{
\begin{array}{lll}
&R_0x_0 + \mathbb{E}(R_1)x_1 + \mathbb{E}(R_2)x_2 + \mathbb{E}(R_3)x_3\to \max\\
&\text{przy ograniczeniu}\\
& x_0 + x_1 + x_2 + x_3 = 1,\\
& \frac{K_0}{P_1}x_1 <= 4,\\
& \frac{K_0}{P_2}x_2 <= 10,\\
& \frac{K_0}{P_3}x_3 <= 40,\\
& x_1, x_2, x_3, x_4 \ge 0,
\end{array}
\right.$$

gdzie $K_0$ to kapitał początkowy, a $P_i$ to cena $i$-tej akcji w momencie jej kupna dla $i=1,2,3$.

### Rozwiązanie:

In [21]:
import pandas as pd
import statistics as stat
from math import *

In [22]:
SOURCE = 'Portfel.csv'
NAMES = ['Dzień', 'nr 1', 'nr 2', 'nr 3']
DELIMITER = ","

In [23]:
def rate_of_return(data):
    R = []
    for name in NAMES[1:]:
        R.append([(data[name][idx+1]-data[name][idx])/data[name][idx] for idx in range(len(data[name])-1)])
    return R  

In [24]:
DF = pd.read_csv(SOURCE, names = NAMES, delimiter = DELIMITER)
DF

Unnamed: 0,Dzień,nr 1,nr 2,nr 3
0,04/09/2023,1680,705,128.0
1,05/09/2023,1700,698,124.0
2,06/09/2023,1695,699,126.0
3,07/09/2023,1690,698,122.0
4,08/09/2023,1765,692,125.0
...,...,...,...,...
81,29/12/2023,2000,551,99.4
82,02/01/2024,1970,544,100.0
83,03/01/2024,2070,550,100.0
84,04/01/2024,2020,534,100.0


In [25]:
R_0 = exp(0.05/364.25)-1
R = rate_of_return(DF)
ER_1 = stat.mean(R[0])
ER_2 = stat.mean(R[1])
ER_3 = stat.mean(R[2])

In [44]:
CONSTRAINTS_LEFT = np.array([[1, 1, 1, 1],
                             [0, 20000/2030, 0, 0],
                             [0, 0, 20000/540, 0],
                             [0, 0, 0, 20000/101]])

CONSTRAINTS_RIGHT = np.array([1, 4, 10, 40])

OBJECTIVE_FUNCTION = np.array([R_0, ER_1, ER_2, ER_3])

Simplex_solve(CONSTRAINTS_LEFT, CONSTRAINTS_RIGHT, OBJECTIVE_FUNCTION)

Znaleziono rozwiązanie! 
Wartość funkcji celu: 0.0011287287837831248
Punkt, w którym wartość ta jest przyjmowana: [0.594 0.406 0.    0.   ]


  j, = np.where(np.isclose(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]], min(non_neg(B[:NUM_OF_CONSTRAINTS, NUM_OF_CONSTRAINTS + NUM_OF_VARIABLES]/B[:NUM_OF_CONSTRAINTS, i[0]]))))


In [36]:
OBJECTIVE_FUNCTION

array([ 0.00013728,  0.00257928, -0.00291377, -0.00244279])

### Sprawdzenie:

In [45]:
BOUNDS = [(0,float('inf')) ,(0,float('inf')) ,(0,float('inf')) ,(0,float('inf'))] #There are 4 bounds because 4 variables

optimize = linprog(c = -OBJECTIVE_FUNCTION,
                  A_ub = CONSTRAINTS_LEFT,
                  b_ub = CONSTRAINTS_RIGHT,
                  bounds = BOUNDS,
                  method = 'simplex')
optimize

  optimize = linprog(c = -OBJECTIVE_FUNCTION,


     con: array([], dtype=float64)
     fun: -0.0011287287837831248
 message: 'Optimization terminated successfully.'
     nit: 6
   slack: array([ 0.,  0., 10., 40.])
  status: 0
 success: True
       x: array([0.594, 0.406, 0.   , 0.   ])