$$f(x, y) = 6x^6 + 2x^4y^2 + 10x^2 + 6xy + 10y^2 - 6x + 4$$

Чтобы применить градиентный спуск, нам нужно задать изначальные параметры:  
- точность. Давайте установим ее на 0.000001  
- скорость градиентного спуска (в виде постоянной величины) -> 0.001  
- начальную точку с координатами cur_x и cur_y (0.001, 0.001)  
- максимальное количество итераций, требуемое для достижения сходимости, может, мы и не пройдем через все, но возьмем на всякий случай максимальное число, если что можем его изменить, если заметим, что за 100 итераций наша программа не достигла конвергенции  
- зададим разницу между 2 любыми взятыми элементами по x и по y, допустим, что она будет равна 1 изначально, она должна быть изначально обязательно быть больше точности (0.001)

И зададим вручную наш градиент-вектор, посчитав производные по x и y: $$(36x^5 + 8x^3y^2 + 20x + 6y - 6, 4x^4y + 6x + 20y)$$ в функция df_x(x,y) и df_y(x, y).


In [37]:
cur_x = 0.001 # начальное значние
cur_y = 0.001 # начальное значение
rate = 0.01 # скорость гардиентного спуска
precision = 0.000001 # это показывает нам, когда нам нужно остановить наш алгоритм 
previous_step_size_x = 1 
previous_step_size_y = 1 
max_iters = 100 # максиммальное количество итераций
iters = 0 # счетчик итераций
def df_x (x, y):
    return 36*(x**5) + 8*(x**3) * (y**2) + 20*x + 6*y - 6 
def df_y(x, y):
    return 4*(x**4) *y + 6*x + 20*y

Теперь мы сделаем цикл, пока условие остановки не нарушится, будем идти вдоль нашего градиента.
Если разница между $$x_j+1 - x_j > epsilon$$ и $$y_j+1 - y_j > epsilon$$, то $$j = j + 1$$

In [38]:
while previous_step_size_x > precision and previous_step_size_y > precision and iters < max_iters:
    prev_x = cur_x 
    prev_y = cur_y
    cur_x = cur_x - rate * df_x(prev_x, prev_y) 
    cur_y = cur_y - rate * df_y(prev_x, prev_y)
    previous_step_size_x = abs(cur_x - prev_x)
    previous_step_size_y = abs(cur_y - prev_y)
    iters = iters+1 
    print("Итерация",iters,"\nX и Y ",cur_x, cur_y) # Print iterations
print("Минимум достигается в точке", cur_x, cur_y)

Итерация 1 
X и Y  0.06073999999999956 0.0007399999999999601
Итерация 2 
X и Y  0.10854730236036475 -0.003052400402894062
Итерация 3 
X и Y  0.14701555998499682 -0.008954741513627632
Итерация 4 
X и Y  0.17812498807913194 -0.015984559482913035
Итерация 5 
X и Y  0.20339439397718959 -0.023474503205838184
Итерация 6 
X и Y  0.22399830107199845 -0.030981659216478823
Итерация 7 
X и Y  0.24085366330253047 -0.03822210551675966
Итерация 8 
X и Y  0.25468283509018785 -0.04502375918497526
Итерация 9 
X и Y  0.26605926911471567 -0.05129240039826262
Итерация 10 
X и Y  0.27544104702505023 -0.056987195673083114
Итерация 11 
X и Y  0.2831958903798473 -0.062103098813625926
Итерация 12 
X и Y  0.289620142110126 -0.06665825452399704
Итерация 13 
X и Y  0.29495339550246846 -0.07068505231238015
Итерация 14 
X и Y  0.29938990817187294 -0.07422384620080155
Итерация 15 
X и Y  0.30308758896783833 -0.0773186179529737
Итерация 16 
X и Y  0.3061751193333676 -0.08001405113203139
Итерация 17 
X и Y  0.30875762

В итоге нам понадобилось 65 итераций, чтобы достигнуть минимума. Подставим точку минимума в нашу функцию f(x,y)

In [39]:
a = 6*(0.3225519311216178**6) + 2*(0.3225519311216178**4)*(0.09655186691340693**2) + 10*(0.3225519311216178**2) - 6*0.3225519311216178*0.09655186691340693 + 10*(0.09655186691340693**2) - 6*0.3225519311216178 + 4

In [40]:
print('Функция принимает минимум в:  ' + str(a))

Функция принимает минимум в:  3.0184093180981275
