# Nelder-Mead algorithm
Реализация метода Нелдера — Мида и оптимизация функции $f(x, y)$с его помощью\
$$f(x, y)=  \sin(y)e^{(1−cos(x))^2} + \cos(x)e^{(1−sin(y))^2} + (x − y)^2$$

In [1]:
import numpy as np

In [2]:
class Nelder_Mead_solver:
    def __init__(self, alpha=1, beta=0.5, gamma=2):
        self.alpha = alpha
        self.beta = beta
        self.gamma = gamma
        
    def solve(self, x_start, eps, func):
        n = len(x_start) - 1
        x = np.copy(x_start)
        values = list()
        for el in x_start:
            values.append([np.array(el), func(el)])
        
        
        iters = 0
        prev = x[0]
        
        while True:
            values.sort(key=lambda x: x[1])
            iters += 1
            if iters > 1 and np.linalg.norm(values[2][0] - prev, ord=2) < eps:
                return values[0][0]
                
            x_h = values[2][0]
            f_h = values[2][1]
            x_g = values[1][0]
            f_g = values[1][1]
            x_l = values[0][0]
            f_l = values[0][1]
            
            prev = x_h
            
            x_c = (x_g + x_l) / 2
            x_r = (1 + self.alpha) * x_c - self.alpha * x_h
            f_r = func(x_r)
            
            if f_r <= f_l:
                x_e = (1 - self.gamma)*x_c + self.gamma*x_r
                f_e = func(x_e)
                if f_e < f_r:
                    values[2][0] = x_e
                    values[2][1] = f_e
                else:
                    values[2][0] = x_r
                    values[2][1] = f_r
                continue
            
            if f_l < f_r <= f_g:
                values[2][0] = x_r
                values[2][1] = f_r
                continue
            
            if f_g < f_r <= f_h:
                values[2][0] = x_r
                values[2][1] = f_r
                x_r, x_h = x_h, x_r
                f_r, f_h = f_h, f_r
            
            x_s = self.beta * x_h + (1 - self.beta) * x_c
            f_s = func(x_s)
            
            if f_s <= f_h:
                values[2][0] = x_s
                values[2][1] = f_s
            else:
                for i in range(1, n + 1):
                    values[i][0] = x_l + (values[i][0] - x_l) / 2
                    values[i][1] = func(values[i][0])
            
            
def sample_function(params):
    x = params[0]
    y = params[1]
    return np.sin(y) * np.exp((1 - np.cos(x)**2)) + np.cos(x) * np.exp((1 - np.sin(y))**2) + (x - y)**2
            
            

In [3]:
solver = Nelder_Mead_solver()
x_start = [[2, 2], [10, 1], [1, 8]]
optimum = solver.solve(x_start, 10**-5, sample_function)
print(f'Результат метода: {optimum}, значение функции: {sample_function(optimum)}\n')

print('Результат питоновской библиотеки:')
import scipy.optimize
scipy.optimize.minimize(sample_function, [0, 0] , method='Nelder-Mead', 
                        options={'initial_simplex': x_start})

Результат метода: [3.19868494 4.69868756], значение функции: -53.24189007390883

Результат питоновской библиотеки:


 final_simplex: (array([[3.19867903, 4.6986934 ],
       [3.19859552, 4.69868028],
       [3.19871924, 4.69863419]]), array([-53.24189007, -53.24188985, -53.24188974]))
           fun: -53.24189006776969
       message: 'Optimization terminated successfully.'
          nfev: 77
           nit: 39
        status: 0
       success: True
             x: array([3.19867903, 4.6986934 ])

Покажем что в зависимости от начальных точек, могут получиться разные ответы алгоритма:

In [4]:
solver = Nelder_Mead_solver()
x_start_1 = [[2, 2], [10, 1], [1, 8]]
optimum_1 = solver.solve(x_start_1, 10**-5, sample_function)
x_start_2 = [[2, 2], [3, 1], [1, 3]]
optimum_2 = solver.solve(x_start_2, 10**-5, sample_function)
x_start_3 = [[5, 4], [6, 12], [10, 7]]
optimum_3 = solver.solve(x_start_3, 10**-5, sample_function)
print(f'Результат №1 метода: {optimum_1}, значение функции: {sample_function(optimum_1)}')
print(f'Результат №2 метода: {optimum_2}, значение функции: {sample_function(optimum_2)}')
print(f'Результат №3 метода: {optimum_3}, значение функции: {sample_function(optimum_3)}')

Результат №1 метода: [3.19868494 4.69868756], значение функции: -53.24189007390883
Результат №2 метода: [2.27869793 1.72130207], значение функции: 1.421253019123029
Результат №3 метода: [ 9.48187166 10.98187351], значение функции: -53.241890073728634


Теперь покажем, что в зависимости от разных гиперпараметров могут получаться разные ответы:

In [5]:
solver1 = Nelder_Mead_solver()
x_start = [[1, 1], [6, 12], [10, 7]]
optimum_1 = solver1.solve(x_start, 10**-5, sample_function)
solver2 = Nelder_Mead_solver(alpha=1.7, beta=0.7, gamma=2)
optimum_2 = solver2.solve(x_start, 10**-5, sample_function)
print(f'Результат №1 метода: {optimum_1}, значение функции: {sample_function(optimum_1)}')
print(f'Результат №2 метода: {optimum_2}, значение функции: {sample_function(optimum_2)}')

Результат №1 метода: [3.19868769 4.69868922], значение функции: -53.24189007316427
Результат №2 метода: [ 2.9690018  -1.52901074], значение функции: -34.39647664948703
