# Uslovi optimalnosti u prisustvu ograničenja

Klasičan problem optimizacije sa ograničenjima je slična problemu:

\begin{equation}
min    f(x_1,x_2,...,x_N)
\end{equation}
\begin{equation}
h_k(x_1,x_2,...,x_N)=0, k=1,...,K (K<N)
\end{equation}

Ovakvi problemi mogu se rešiti kao klasičan optimizacioni problem ukoliko se eliminišu K nezavisnih promenljivih. Tako da se problem može redukovati sa dimenzije N na dimenzije N-K. Nakon redukovanja dimenzionalnosti problema koristi se neka od klasičnih optimizacionih metoda za rešavanje problema.

# Lagranžovi multiplikatori

Lagranžov metod vrši prevođenje problema sa ograničenja u problem jednakosti bez ograničenja dodavanjem pomoćnih parametara koji se zovu Lagranžovi multiplikatori.

Ukoliko funkcija poseduje jedno ograničenje jednakost je data u nastavku:

\begin{equation}
min f(x_1,x_2,...,x_N)
\end{equation}
\begin{equation}
h_1(x_1,x_2,...,x_N)=0
\end{equation}

Dati problem se u nastavku prevodi u optimizacioni problem bez ograničenja:

\begin{equation}
min   L(x, \lambda)= f(x) - \lambda h_1(x)
\end{equation}

Gde je L Lagranžova funkcija i lambda Lagranžov multiplikator.

Lagranžov metod se može generalizovati sa slučaj sa više ograničenja. Oblik generalizovane metode je:

\begin{equation}
L(x, \lambda)= f(x) - \sum \limits _{k=1} ^{K} \lambda_k h_1(x)
\end{equation}

Langražove multiplikatora potrebno je odrediti kao i ostale nezavisne promenljive. Izjednačavanjem paracijalnih izvoda funkcije L po x dobija se sistem od N jednačina sa N nepoznatih:

\begin{equation}
\frac{\partial L(x, \lambda)} {\partial x_n} = 0, n=1,...,N
\end{equation}

Ovom sistemu jednačinja dodaje se ograničenja tipa jednakosti:

\begin{equation}
h_k(x)=0, k=1,...,K
\end{equation}

Dakle dobija se sistem od N+K jednačina sa sito toliko nepoznatih. Rešavanjem ovih jednačina dolazi se do stacionarne tačke Lagranžove funkcije. 

# Metode kaznenih funkcija

Ove metode su među najjednostavnijim za rešavanje problema optimizacije sa ograničenjima.

Kod ovih metoda apropksimacija se postiže dodavanjem kaznenih članova funkciji u delu domena koji ne zadovoljava data ograničenja tj. nedopustivo područje. Na ovaj način se "pogoršava" vrednost modifikovane funkcije cilja, i tačke u nedopustivom području vraćaju velike vrednosti (koji teži beskonačnosti). Na ovaj način teži se van nedozvoljenog područja. Modofikovana funkcija se u dopustivom području poklapa sa funkcijom cilja. Iz ovog razloga je bitno da parametar koji određuje težinu kazne ima zanemraljiv uticajna iznos funkcije u dozvoljenom skupu. Ovo znači da u delu domena koji ne zadovoljava ograničenja, modifikovana funkcija cilja treba da prima velike vrednosti. 

## Metoda spoljašnjih kaznenih funkcija

Kod metode kaznenih funkcija problem se svodi na niz pomoćnih problema. Problem se rešava minimizacijom niza problema bez ograničenja.

\begin{equation}
\underset{x \in X_0} {\textrm {min}} F_k(x), k=1,2,...
\end{equation}


\begin{equation}
X \subset X_0 \subset R^n
\end{equation}

Svrha pomoćnih funkcija $F({x})$ je da se sa porastom broja k sve manje razlikuju od ciljne funkcije na skupu $X$, a van tog skupa trpe beskonačno veliku kaznu. Kazne su prisutne zbog uvođenja kaznenog dodatka. Skup $X_{0}$ je najčešće ceo prostor $R^{n}$ ili neki njegov podskup.

Najkorišćenije spoljašnje kaznene funkcije za skup $X$ je

\begin{equation}
q_k(x)=t_kq(x)
\end{equation}

\begin{equation}
q(x) = \sum \limits _{i=1} ^{s} \frac {(g_i(x) + \left\lvert{g_i(x)}\right\lvert)^2} {2}
\end{equation}

gde su $t_k > 0 , k=1,2,...$ sa osobinom

\begin{equation}
\underset{k \rightarrow \infty} {\textrm {lim}} t_k=+\infty
\end{equation}

Za svako $k= 1,2,...$ definiše se:

\begin{equation}
F_k(x)=f(x) + q_k(x)
\end{equation}

i rešava se problem

\begin{equation}
{\textrm {min}}  F_k(x),x \in X_0
\end{equation}

odakle se dobija rešenje $x^k$.

## Metoda unutrašnjih kaznenih funkcija

Za razliku od prethodne metode ova metoda zahteva "unutrašnju" početku tačku. Kada se u procesu traženja optimalne tačke približi ograničenju, iznos modifikovane funkcije cilja $B_k(x)$, mora da poraste zbog kaznenog dodatka da bi se postupak traženja vratio u dopustivo područje.

\begin{equation}
\underset{x \in X \subset R^n} {\textrm {min}} f(x)
\end{equation}

$X$ je dopustiv skup.

Pri rešavanju problema konstruiše se niz $\{x^k\}, k=1,2,...$ čiji elementi konvergiraju ka optimalnom rešenju.

__Definicja 1.__ Neka je $V \subset X$ i neka je fuunkcija $B(x)$ defomosama ma skupu $X / V \neq \emptyset$ sa nenegativnim i konačnim vrednostima. Funkcija $B(x)$ se naziva barijerana funkcija skupa $V$, ukoliko svaki niz $\{x^k\} \in X/V$ koji konvergira ka nekoj tački $v \in V$ važi

\begin{equation}
\underset{k \rightarrow \infty} {\textrm {lim}} B(v^k)=+\infty
\end{equation}

gde je

\begin{equation}
B_k(x)=f(x) + a_kB(x)
\end{equation}

i $a_k$ je niz pozitivnih brojeva sa osobinom $\underset{k \rightarrow \infty} {\textrm {lim}} a_k=0$

Barijerne funkciija se definiše kao:

\begin{equation}
B(x)= - \sum \limits _{i=1} ^{m} \frac {1}{g_i(x)}
\end{equation}

Za svako $k= 1,2,...$ definiše se funkcija


\begin{equation}
B_k(x)=f(x) + a_kB(x)
\end{equation}

i rešava problem 

\begin{equation}
{\textrm {min}}  B_k(x),x \in intX
\end{equation}

gde je $intX = \{ x \in R^n, g_i(x)<0, i=1,...,m \}$

odakle se dobija rešenje $x^k$.


# Implementacija

__Zadatak__. Rešiti opzimizacioni problem

\begin{equation}
{\textrm {min}}  f(x),x \in S
\end{equation}
gde je: $f(x)=(x-1)^4 + 2y^2 +3$ a skup S je opisan nejednakostima $(y-2)^2 \leqslant 2x -1 $ , $(2x-3)^2 + (y-1)^2 \leqslant 2$


In [3]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import minimize

# Ciljna funkcija f(x,y)
f_x = lambda x : (x[0] - 1)**(4) + 2*x[1]**(2) + 3

# Ogranicenja
g1_x = lambda x : (x[1] - 2)**(2) - 2*x[0] + 1
g2_x = lambda x : (2*x[0] - 3)**(2) + (x[1] - 1)**(2) - 2

g_x = [g1_x , g2_x]

# Kaznena funkcija
kazna = lambda x : sum([(g(x) + abs(g(x)))**(2)/2 for g in g_x])

# Pomocna funkcija
F_x = lambda x : f_x(x) + t*kazna(x)

t = 1
eps = 10.0**(-6.0)
distance = eps

i = 0
max_iter = 500
x0 = np.array([100.0, 100.0])


while distance >= eps and i<max_iter:

    F_x_min = minimize(F_x, x0, method='nelder-mead', options={'xatol': 1e-8})
    x1 = F_x_min.x
    distance = np.linalg.norm(x1-x0)
    
    print('Iteracija: ',i+1)
    print('x0 = ',x0)
    print('x1 = ',x1)
    print('d = ', distance)
    print('min F(x) = ',F_x_min.fun)
    print('t = ',t)
    print('*'*50)
    
    x0 = x1
    t*=10
    i+=1

print('Optimalna tacka')
print('x*=',x1)


Iteracija:  1
x0 =  [100. 100.]
x1 =  [1.65328206 0.4360412 ]
d =  139.94662847671754
min F(x) =  3.6012692452864865
t =  1
**************************************************
Iteracija:  2
x0 =  [1.65328206 0.4360412 ]
x1 =  [1.67129986 0.4645113 ]
d =  0.03369254458647554
min F(x) =  3.6391968749321197
t =  10
**************************************************
Iteracija:  3
x0 =  [1.67129986 0.4645113 ]
x1 =  [1.67327267 0.46765823]
d =  0.0037141866483098394
min F(x) =  3.6433514945599788
t =  100
**************************************************
Iteracija:  4
x0 =  [1.67327267 0.46765823]
x1 =  [1.67347188 0.46797634]
d =  0.00037533858282701036
min F(x) =  3.643771006029324
t =  1000
**************************************************
Iteracija:  5
x0 =  [1.67347188 0.46797634]
x1 =  [1.67349774 0.46800433]
d =  3.8105629113858354e-05
min F(x) =  3.6438129983031087
t =  10000
**************************************************
Iteracija:  6
x0 =  [1.67349774 0.46800433]
x1 =  [1.673