<a href="https://colab.research.google.com/github/Demaga/Optimization-Methods-Term-paper/blob/main/Adaptive_Random_Search.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<left>
    <img src="https://kpi.ua/files/images/kpi.png" width="300" alt="kpi logo"  />
</left>

# **Адаптивний алгоритм випадкового пошуку**

Випадковий пошук з адаптивним кроком — алгоритм, який евристично адаптує радіус гіперсфери. На кожному кроці створюються два нових рішення-кандидати, одне з поточним розміром кроку, а інше з більшим розміром кроку. Новий розмір кроку обирається тоді, і тільки тоді, коли відбувається більше покращення. Якщо за декілька ітерацій не відбувається покращення, то тоді крок зменшується.

## Зміст

* Abstract
* Introduction
* Методи та матеріали 
* Реалізація 
  * Імпорти
  * Визначення необхідних функцій
  * Обчислення
  * Результати
* Висновок
* Автор
* Використана література



## Вступ


У прикладних задачах часто виникає потреба мінімізувати деяку функцію. Найбільш простий приклад: витрати на деякому підприємстві. Кожне підприємство має витрати, розмір яких залежить від деяких обставин (параметрів). Якщо формалізувати цю ситуацію, можна окреслити функцію витрат з N аргументами (параметрами), яка на виході дає суму витрат підприємство. Звичайно, кожне підприємство хоче цю функцію мінімізувати.

Таких задач безліч. Вони називаються задачами мінімізації. Їх вирішують Методи Оптимізації. Багато з цих методів спираються на обчислення градієнту. Методи ж, що не вимагають обчислення градієнту, називаються методами випадкового пошуку (також методи прямого пошуку або методами «чорної скриньки»). Метод адаптивного випадкового пошуку відноситься саме до цієї групи методів.

## Методи та матеріали 

Адаптивний алгоритм випадкового пошуку — одна з найчастіше вживаних модифікацій алгоритму випадкового пошуку — використовує змінний крок пошуку залежно від досягненого успіху на попередніх кроках. Якщо дві послідовних ітерації дають покращення цільової функції, крок збільшується в $a_s$ разів; якщо $М$ послідовних ітерацій не дають покращення, крок зменшується в $а_f$ разів. 

Алгоритм методу наступний:

**Крок 1.** Задати початкову точку $x_0$, коефіцієнти розширення $a_s$ та $а_f$, максимальну кількість невдалих кроків на поточній ітерації $М$, початкову довжину крока $d$, мінімальну довжину крока $R$ та максимальну кількість ітерацій $N$. $k=0$, $j=1$.

**Крок 2.** Отримати випадковим чином напрямок руху: $\xi^j=(\xi^j_1,...\xi^j_2)^T$, де $\xi^j_i$ - випадкова величина, рівномірно розподілена на проміжку $[-1, 1]$.

**Крок 3.** Обчислити $y^j=x^k+d_k* \frac {\xi^j} {||\xi^j||} $

**Крок 4.** Перевірити наступні умови:
*   Якщо $f(y^j)<f(x^k)$, крок вдалий. Тоді, покласти $z^j=x^k+a_s(y^j-x^k)$. Перевірити такі умови:
  *   Якщо $f(z^j)<f(x^k)$, напрямок пошуку вдалий. Покласти $x^{k+1}=z^j$, $d_{k+1}=a_s*d_k$, $k=k+1$ та перевірити умови закінчення. Якщо $k<N$, покласти $j=1$ і перейти до кроку 2. Якщо $k=N$, пошук заверишити. 
  *   Якщо $f(z^j)\ge f(x^k)$, напрямок пошуку невдалий, перейти до кроку 5.
* Якщо $f(y^j)\ge f(x^k)$, крок невдалий, перейти до кроку 5.

**Крок 5.** Оцінити кількість невдалих кроків з даної точки:
* Якщо $j<M$, покласти $j=j+1$ і перейти до кроку 2
* Якщо $j=M$, провірити умови закінчення:
  *   Якщо $d_k \le R$, завершити пошук
  *   Якщо $d_k > R$, покласти $d_k=a_f d_k$, $j=1$ і перейти до кроку 2. 

## Реалізація


### Імпорти

Нам знадобиться бібліотека random, яку будемо використувувати для генерації псевдо-випадкових чисел, бібліотека numpy для полегшенної роботи з обчисленням функцій, а також бібліотека math для математичних функцій.

In [None]:
import random
import numpy as np
import math

### Визначення необхідних функцій

Задамо функцію, яку будемо намагатися мінмімізувати. Продовжуючи наш реальний приклад, будемо вважати, що це функція затрат компанії. Поглиблюватися в те, що означає кожен окремий параметр ми не будемо, так як нас це не цікавить у межах цієї курсової.

In [None]:
def function(x_vector):
    x1 = x_vector[0]
    x2 = x_vector[1]
    x3 = x_vector[2]
    x4 = x_vector[3]
    x5 = x_vector[4]
    # return math.sin(x1**2) + math.sqrt(abs(x2/2)) - x3/x4 + 6*x5
    return math.sin(x1+x2*2+x3*3+x4*4+x5*5)
    # return x1+x2+x3+x4+x5

Основна функція, яка рекурсивно виконує ітерації алгоритму.

In [None]:
def step(function, x, d, k, j, N=25, min_step=0.1, M=15):
    direction = np.random.uniform(-1, 1, 5)
    y = x + d * (direction/direction_norm)
    f_y = function(y)

    if f_y < f_x:
        z = x + 1.68*(y-x)
        f_z = function(z)
        if f_z < f_x:
              x = z
              d = 1.68*d
              k = k+1
              if k < N:
                  j = 1
                  print("New point:", x)
                  print("Step:", d)
                  return step(function, x, d, k, j)
              else:
                  return x, function(x)
        else:
            if j < M:
                j = j + 1
                print("New point:", x)
                print("Step:", d)
                return step(function, x, d, k, j)
            else:
                if d <= min_step:
                    print("New point:", x)
                    print("Step:", d)
                    return x, function(x)
                else:
                    d = 0.68*d
                    j = 1
                    return step(function, x, d, k, j)
    else:
        if j < M:
            j = j + 1
            return step(function, x, d, k, j)
        else:
            if d <= min_step:
                return x, function(x)
            else:
                d = 0.68*d
                j = 1
                return step(function, x, d, k, j)

### Обчислення

In [None]:
d = 1
lower_boundary=[1,1,1,1,1]
upper_boundary= [100,100,100,100,100]

x = [lower_boundary[x] + random.random()*(upper_boundary[x]-lower_boundary[x]) for x in range(5)]
f_x = function(x)

print("Starting point: ", x)
print("Function value =", f_x)

Starting point:  [62.93203764965251, 25.815232363599574, 92.03154838612528, 54.6283648707697, 9.573912867370508]
Function value = -0.43253883476437555


In [None]:
solution, result = step(function, x, d, 0, 0)

New point: [62.43451927 24.55276172 92.35861986 54.55797161 10.23851816]
Step: 1.68
New point: [62.22599404 24.87813803 92.33965559 52.56914802 11.94352612]
Step: 2.8223999999999996
New point: [58.85094135 22.06648232 89.93262209 53.44337205 14.43012786]
Step: 4.741631999999999
New point: [54.6489128  18.76960532 85.86492716 50.05132168 15.42209902]
Step: 7.965941759999998
New point: [54.6489128  18.76960532 85.86492716 50.05132168 15.42209902]
Step: 7.965941759999998
New point: [52.583248   26.48572515 96.23339038 41.24714354 26.04684586]
Step: 13.382782156799996
New point: [52.583248   26.48572515 96.23339038 41.24714354 26.04684586]
Step: 13.382782156799996
New point: [ 46.70212388   9.94785021 107.75080665  42.76433238  34.37023251]
Step: 22.483074023423992
New point: [ 46.70212388   9.94785021 107.75080665  42.76433238  34.37023251]
Step: 22.483074023423992
New point: [ 46.70212388   9.94785021 107.75080665  42.76433238  34.37023251]
Step: 22.483074023423992
New point: [ 31.577391

### Результати

In [None]:
print("Minimum point: ", solution)
print("Function value = ", result)

Minimum point:  [-153204.1059453  -161130.05814855  -40748.78896543  -60550.27153129
   69641.46778608]
Function value =  -0.8929018411205817


## Висновок

Методи випадкового пошуку в цілому є корисними, так як не вимагають обчислення похідних для їх виконання. Проте, треба розуміти, що ці методи не гарантують оптимального результату, тому використовувати їх краще лише у тих випадках, коли обчислити похідні функції складно або неможливо.

## Автор

Холоденко Богдан, студент групи КМ-81

## Список літератури

MA SCHUMER, Kenneth Steiglitz Adaptive step size random search. (IEEE Transactions on Automatic Control, 1968)

Химмельблау Д.М. Прикладное нелинейное программирование. (Applied Nonlinear Programming, 1972).

Реклейтис Г., Рейвиндран А., Рэгсдел К. Оптимизация в технике.