# Глобальные градиентные методы оптимизации

#### Подключим необходимые библиотеки

In [37]:
import numpy as np
from interval import imath
from interval import fpu
from interval import interval
from functions import Functions

#### Вспомогательные функции, которые пригодятся далее

In [38]:
# возвращает левую границу интервала
def left(interval):
    return fpu.max(interval)[0]

# возвращает правую границу интервала
def right(interval):
    return fpu.max(interval)[1]

# возвращает середину интервала
def mid(interval):
    return (fpu.max(interval)[0] + fpu.max(interval)[1]) / 2

# возвращает евклидово расстояние между 2 векторами
def dist(p_1, p_2):
    return np.sqrt(np.sum(np.square(np.array(p_1) - np.array(p_2))))

#### Напишем алгоритм, который будет находить локальный минимум функции вдоль заданного направления.
#### Алгоритм будет основываться на методе "золотого сечения", так как является наиболее эффективным среди основных методов одномерной оптимизации.

In [39]:
def GoldenRatio(func_index, index, a, b, p, e_d, e_f):  # f(function), i(index of direction), a(left border), b(right border), p(current point), e_d(error of d), e_f(error of f)
    F = Functions[func_index * 2]
    phi = (1 + np.sqrt(5)) / 2  # constant of golden ratio
    x_1 = b - (b - a) / phi
    x_2 = a + (b - a) / phi
    p_1 = p.copy()  # current point
    p_2 = p.copy()  # current point
    p_1[index] = x_1
    p_2[index] = x_2
    f_1 = F(p_1)  # value in 1-st point
    f_2 = F(p_2)  # value in 2-nd point
    while (b - a > e_d) | (abs(f_1 - f_2) > e_f):  # termination criteria
        if f_1 <= f_2:
            b = x_2
            x_2 = x_1
            x_1 = b - (b - a) / phi

            p_1[index] = x_1
            p_2[index] = x_2

            f_2 = f_1
            f_1 = F(p_1)
        else:
            a = x_1
            x_1 = x_2
            x_2 = a + (b - a) / phi

            p_1[index] = x_1
            p_2[index] = x_2

            f_1 = f_2
            f_2 = F(p_2)

    best_point = []
    for i in range(len(p)):
        best_point.append((p_1[i] + p_2[i]) / 2)

    return best_point  # point of extremum with error e_d

#### Теперь реализуем алгоритм Moore-Skelboe, который находит глобальный минимум функции вдоль направления коллинеарного главным осям.

In [199]:
def MooreSkelboe(func_index, index, a, b, p, e_d,
                 e_f):  # func_index(number of function in list of functions), index(index of direction),
    # a(left border), b(right border), p(current point), e_d(error of d), e_f(error of f)
    F = Functions[func_index * 2 + 1]
    interval_d = []
    for i in range(len(p)):
        interval_d.append(interval[p[i], p[i]])
    interval_d[index] = interval[a, b]

    interval_f = F(interval_d)
    set_of_intervals = [[interval_d, interval_f]]
    U = right(interval_f)
    w_f = right(interval_f) - left(interval_f)
    w_d = right(interval_d[index]) - left(interval_d[index])
    best_interval = set_of_intervals[0]
    while (w_d > e_d) | (w_f > e_f):
        set_of_intervals.pop(0)
        mid_p = mid(best_interval[0][index])
        interval_1 = best_interval[0].copy()
        interval_2 = best_interval[0].copy()
        interval_1[index] = interval[left(best_interval[0][index]), mid_p]
        interval_1_f = F(interval_1)
        interval_2[index] = interval[mid_p, right(best_interval[0][index])]
        interval_2_f = F(interval_2)
        U = min(U, right(interval_1_f))
        U = min(U, right(interval_2_f))


        if (len(set_of_intervals)>0) and (U<left(set_of_intervals[-1][1])):
            l = 0
            r = len(set_of_intervals) - 1
            while l < r:
                m = int((l + r) / 2)
                if left(set_of_intervals[m][1]) > U:
                   r = m
                else:
                    l = m + 1
            set_of_intervals = set_of_intervals[:l]


        # for i in range(len(set_of_intervals)):
        #     if U < left(set_of_intervals[i][1]):
        #         set_of_intervals = set_of_intervals[:i]
        #         break

        set_of_intervals.append([interval_1, interval_1_f])
        set_of_intervals.append([interval_2, interval_2_f])
        set_of_intervals.sort(key=lambda item: left(item[1]))

        # val_1 = left(interval_1_f)
        # val_2 = left(interval_2_f)

        # if (len(set_of_intervals) == 0) or (val_1 > left(
        #         set_of_intervals[-1][1])):
        #     set_of_intervals.append([interval_1, interval_1_f])
        # else:
        #     l = 0
        #     r = len(set_of_intervals) - 1
        #     while l < r:
        #         m = int((l + r) / 2)
        #         if left(set_of_intervals[m][1]) > val_1:
        #             r = m
        #         else:
        #             l = m + 1
        #     set_of_intervals.insert(l, [interval_1, interval_1_f])

        # if val_2 > left(set_of_intervals[-1][1]):
        #     set_of_intervals.append([interval_2, interval_2_f])
        # else:
        #     l = 0
        #     r = len(set_of_intervals) - 1
        #     while l < r:
        #         m = int((l + r) / 2)
        #         if left(set_of_intervals[m][1]) > val_2:
        #             r = m
        #         else:
        #             l = m + 1
        #     set_of_intervals.insert(l, [interval_2, interval_2_f])

        best_interval = set_of_intervals[0]
        w_f = right(best_interval[1]) - left(best_interval[1])
        w_d = right(best_interval[0][index]) - left(best_interval[0][index])

    best_point = []
    for i in range(len(p)):
        best_point.append(mid(best_interval[0][i]))

    return best_point

#### Функция которая реализует метод координатного спуска: последовательно ищет минимум вдоль направлений коллинеарным главным осям и останавливается, когда улучшение точности становится малым.

In [190]:
def CoordinateDescent(func_index, D, p, e_d, e_f, method):  # F(function), D(set), p(start point), e(error)
    while True:
        p_0 = p
        for index in range(len(p)):
            p = method(func_index, index, D[index][0], D[index][1], p, e_d, e_f)
        if (dist(p_0, p) < e_d) & (Functions[func_index * 2](p_0) - Functions[func_index * 2](p) < e_f):
            break

    best_point = p
    best_value = Functions[func_index * 2](p)

    return best_point, best_value

#### Функция для вывода результата работы алгоритма

In [191]:
def CoordinateResult(func_num, D, p, e_d, e_f):
    p_1, v_1 = CoordinateDescent(func_num, D, p, e_d, e_f, GoldenRatio)  # point of minimum
    p_2, v_2 = CoordinateDescent(func_num, D, p, e_d, e_f, MooreSkelboe)  # point of minimum
    print("Результат тестирования:")
    print("Golden Ratio:", v_1)
    print("Moore-Skelboe:", v_2)


In [192]:
def print_result1(func_num, D, p, e_d, e_f):
    p_1, v_1 = CoordinateDescent(func_num, D, p, e_d, e_f, GoldenRatio)  # point of minimum
    print("Результат тестирования:")
    print("Golden Ratio:", v_1)

In [193]:
def print_result2(func_num, D, p, e_d, e_f):
    p_2, v_2 = CoordinateDescent(func_num, D, p, e_d, e_f, MooreSkelboe)  # point of minimum
    print("Результат тестирования:")
    print("Moore-Skelboe:", v_2)

#### Продемонстрируем работу методов на известных тестовых функциях глобальной оптимизации, применяя их в координатном спуске

In [196]:
# Функция Растригина
n = 40
l = -10
r = 10
D = [[l, r]] * n
p = [1] * n
CoordinateResult(5, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 39.79857020564907
Moore-Skelboe: 0.0007390678956511465


In [197]:
# Функция Розенброка
n = 8
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
CoordinateResult(7, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 0.33244082803407593
Moore-Skelboe: 0.14015453688727936


In [200]:
# Функция Стыбинского-Танга
n = 4
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
CoordinateResult(12, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: -156.6646589598015
Moore-Skelboe: -156.66466281009914


In [201]:
# Функция Экли
n = 5
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
CoordinateResult(15, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: -4.440892098500626e-16
Moore-Skelboe: 0.0012256630393632229


In [202]:
# Функция Гриванка
n = 5
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
CoordinateResult(16, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 0.009864698515380743
Moore-Skelboe: 1.0644240466817223e-07


In [203]:
# Функция Растригина новгородская
n = 5
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
CoordinateResult(17, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 1.542458003137213
Moore-Skelboe: 0.0007449817996270092


In [204]:
# Функция Швефеля
n = 2
l = -500
r = 500
D = [[l, r]] * n
p = [2] * n
CoordinateResult(18, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 236.8766946858181
Moore-Skelboe: 2.5455285594944144e-05


### Реализуем теперь градиентные алгоритмы

In [140]:
def Gradient(D, p, f, step):  # градиент с отражением
    gradient = np.array([0.] * len(p))
    p_ = p.copy()
    for i in range(len(p)):
        p_[i] += step
        gradient[i] = (f(p_) - f(p)) / step

        if (abs(p[i] - D[i][0]) < step) & (gradient[i] < 0):
            gradient[i] = 0
        if (abs(p[i] - D[i][1]) < step) & (gradient[i] > 0):
            gradient[i] = 0
        p_[i] -= step
    return gradient

In [86]:
def GradientDescent(func_index, D, p, e_d, e_f,
                method):  # F(function), D(set), p(start point), e(error)
    F = Functions[func_index * 2]
    gradient = Gradient(D, p, F, e_d)
    while np.linalg.norm(gradient) > e_f:
        p_0 = p
        p = method(func_index, gradient, D, p, e_d, e_f)
        gradient = Gradient(D, p, F, e_d)
        if dist(p, p_0) < e_d or abs(F(p) - F(p_0))<e_f:
            break

    best_point = p
    best_value = Functions[func_index * 2](p)
    return best_point, best_value

In [81]:
def Borders(p, gradient, D):
    max_t = np.inf
    min_t = -np.inf
    dir = gradient / np.linalg.norm(gradient)
    for i in range(len(p)):
        if dir[i] > 0:
            max_t = min((D[i][1] - p[i]) / dir[i], max_t)
            min_t = max((D[i][0] - p[i]) / dir[i], min_t)
        elif dir[i] < 0:
            min_t = max((D[i][1] - p[i]) / dir[i], min_t)
            max_t = min((D[i][0] - p[i]) / dir[i], max_t)

    borders = [p + dir * min_t, p + dir * max_t]
    return borders

In [82]:
def GradientGoldenRatio(func_index, gradient, D, p, e_d,
                 e_f):  # f(function), i(index of direction),
    # a(left border), b(right border), p(current point), e_d(error of d), e_f(error of f)
    F = Functions[func_index * 2]
    phi = (1 + np.sqrt(5)) / 2  # constant of golden ratio
    a = Borders(p, gradient, D)[0]
    b = Borders(p, gradient, D)[1]
    x_1 = b - (b - a) / phi
    x_2 = a + (b - a) / phi
    p_1 = x_1
    p_2 = x_2
    f_1 = F(p_1)  # value in 1-st point
    f_2 = F(p_2)  # value in 2-nd point
    while (dist(b, a) > e_d) | (abs(f_1 - f_2) > e_f):  # termination criteria
        if f_1 <= f_2:
            b = x_2
            x_2 = x_1
            x_1 = b - (b - a) / phi

            p_1 = x_1
            p_2 = x_2

            f_2 = f_1
            f_1 = F(p_1)
        else:
            a = x_1
            x_1 = x_2
            x_2 = a + (b - a) / phi

            p_1 = x_1
            p_2 = x_2

            f_1 = f_2
            f_2 = F(p_2)

    best_point = []
    for i in range(len(p)):
        best_point.append((p_1[i] + p_2[i]) / 2)

    return best_point  # point of extremum with error e_d

In [214]:
def GradientMooreSkelboe(func_index, gradient, D, p, e_d,
                  e_f):  # p(current point), e_d(error of d), e_f(error of f)
    F = Functions[func_index * 2 + 1]
    interval_d = [None] * len(p)

    a = Borders(p, gradient, D)[0]
    b = Borders(p, gradient, D)[1]

    for i in range(len(p)):
        interval_d[i] = interval[a[i], b[i]]

    interval_f = F(interval_d)
    set_of_intervals = [[interval_d, interval_f]]
    U = right(interval_f)
    w_f = right(interval_f) - left(interval_f)
    for index in range(len(p)):
        w_d = np.square(right(interval_d[index]) - left(interval_d[index]))
    w_d = np.sqrt(w_d)
    best_interval = set_of_intervals[0]
    while (w_d > e_d) | (w_f > e_f):
        set_of_intervals.pop(0)
        mid_p = [None] * len(p)
        for index in range(len(p)):
            mid_p[index] = mid(best_interval[0][index])

        interval_1 = best_interval[0].copy()
        interval_2 = best_interval[0].copy()
        for index in range(len(p)):
            interval_1[index] = interval[left(best_interval[0][index]), mid_p[index]]
            interval_2[index] = interval[mid_p[index], right(best_interval[0][index])]

        interval_1_f = F(interval_1)
        interval_2_f = F(interval_2)

        U = min(U, right(interval_1_f))
        U = min(U, right(interval_2_f))

        for i in range(len(set_of_intervals)):
            if U < left(set_of_intervals[i][1]):
                set_of_intervals = set_of_intervals[:i]
                break

        set_of_intervals.append([interval_1, interval_1_f])
        set_of_intervals.append([interval_2, interval_2_f])

        set_of_intervals.sort(key=lambda item: left(item[1]))
        best_interval = set_of_intervals[0]
        w_f = right(best_interval[1]) - left(best_interval[1])

        for index in range(len(p)):
            w_d = np.square(right(best_interval[0][index]) - left(best_interval[0][index]))
        w_d = np.sqrt(w_d)
        print(w_f, w_d)
    

    best_point = []
    for i in range(len(p)):
        best_point.append(mid(best_interval[0][i]))

    return best_point

#### А теперь продемонстрируем работу методов на известных тестовых функциях глобальной оптимизации, применяя их в градиентном спуске

In [84]:
def GradientResult(func_num, D, p, e_d, e_f):
    p_1, v_1 = GradientDescent(func_num, D, p, e_d, e_f, GradientGoldenRatio)  # point of minimum
    p_2, v_2 = GradientDescent(func_num, D, p, e_d, e_f, GradientMooreSkelboe)  # point of minimum
    print("Результат тестирования:")
    print("Golden Ratio:", v_1)
    print("Moore-Skelboe:", v_2)


In [156]:
# Функция Растригина
n = 40
l = -10
r = 10
D = [[l, r]] * n
p = [1] * n
GradientResult(5, D, p, 0.001, 0.001)

4799.999999985783
4799.999999988368
1799.9999999961233
1799.9999999974148
1049.999999998869
1049.9999999995157
862.4999999996373
862.4999999999602
815.6249999998693
815.6250000000307
556.9796229410599
556.9796229486451
178.74846928823263
178.74846929502712
47.475634883583794
47.47563488743323
12.048533877402138
12.048533879385975
3.0234449490693187
3.0234449500687184
0.756569536953819
0.7565695374544639
0.18918667375432463
0.18918667400475542
0.04729943683152982
0.047299436956738106
0.011825032224489718
0.011825032287113402
0.0029562688633184564
0.0029562688946214166
0.0007390678878351764
4799.999888667
4799.999888655841
1799.9999721681454
1799.9999721625659
1049.9999930427339
1049.999993039944
862.4999982610342
862.4999982596393
815.6249995654338
815.6249995647352
556.9796127550792
556.9796127223476
178.7484647353894
178.74846470607184
47.475633599001256
47.47563358239121
12.048533549022924
12.048533540463527
3.023444867684532
3.0234448633718216
0.7565695172341194
0.7565695150747089
0

In [207]:
# Функция Розенброка
n = 4
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
# p_1, v_1 = GradientDescent(7, D, p, 0.001, 0.001, GradientGoldenRatio)  # point of minimum
# print(v_1)
p_2, v_2 = GradientDescent(7, D, p, 0.001, 0.001, GradientMooreSkelboe)  # point of minimum
print(v_2)
# GradientResult(7, D, p, 0.001, 0.001)

1773913.516740741
115257.24845873858
6947.789644155746
4892.541896697934
1701486.9638288668
107809.0003715353
7539.155322897223
995.1778357096495
338.1291925973852
1090.7154168471043
546.6686945516816
145.22798299805362
247.5392615807167
116.69731128686063
190.1349025491631
67.59704153395315
77.43386960934322
59.44405467179753
34.933827865720474
32.63857968638814
37.39163790070623
30.500305427260727
88.63824775532979
17.168439137837183
16.594714404495704
40.01759772679246
17.762309480152894
16.040786034162025
58.00947948148287
18.376674677407877
28.631552073720428
15.50630478087173
8.367634882792288
8.511060609159458
8.226694615737287
8.656993622711582
19.01188397556794
14.990921398658585
8.08821798012221
8.805455751322455
7.952183148073658
8.95646882286428
7.81856829171933
9.110054665209873
4.201565747771369
4.166021021775293
4.237421838302623
4.130786296071975
4.27359065761118
4.095860206419701
4.310073569938581
4.061241388576462
4.346871939527375
7.687351583186256
4.026928478300135


KeyboardInterrupt: 

In [175]:
# Функция Стыбинского-Танга
n = 4
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
GradientResult(12, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: -156.6646627964721
Moore-Skelboe: -156.6646628146428


In [176]:
# Функция Экли
n = 8
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
GradientResult(15, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 0.00023862367055516032
Moore-Skelboe: 0.00030548577621924977


In [215]:
# Функция Гриванка
n = 5
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
GradientResult(16, D, p, 0.001, 0.001)

1.9025217971847999 1.018011573309232
1.8224077512026127 0.509005786654616
1.5007796824361945 0.509005786654616
1.0898493807545115 0.25450289332730813
0.5284104078750063 0.12725144666365407
1.2838043422740528 0.2545028933273079
0.7054877429780031 0.12725144666365384
0.30243935672767885 0.06362572333182703
0.3224075359645171 0.06362572333182692
0.15749376827613326 0.03181286166591346
0.7354357799385605 1.018011573309232
0.16255336617409277 0.03181286166591346
0.14996206889125863 0.03181286166591357
0.07824382241041572 0.01590643083295684
0.07985842509642138 0.01590643083295662
0.6289337652065375 0.5090057866546158
0.07635367652541691 0.01590643083295684
0.081127569281229 0.01590643083295662
0.03938115003129672 0.007953215416478532
0.039785170364618705 0.00795321541647831
0.038940347630785244 0.00795321541647831
0.040148023121599374 0.00795321541647831
0.019748270169854476 0.003976607708239266
0.019849298365940404 0.003976607708239044
0.0384673591084721 0.00795321541647842
0.0196425022102

KeyboardInterrupt: 

In [188]:
# Функция Растригина новгородская
n = 5
l = -10
r = 10
D = [[l, r]] * n
p = [2] * n
GradientResult(17, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 1.542309195769226
Moore-Skelboe: 0.00018624891567542434


In [187]:
# Функция Швефеля
n = 2
l = -500
r = 500
D = [[l, r]] * n
p = [2] * n
GradientResult(18, D, p, 0.001, 0.001)

Результат тестирования:
Golden Ratio: 236.87669468569356
Moore-Skelboe: 2.5460353072048747e-05
