In [3]:
import time
import numpy as np
import matplotlib.pyplot as plt
from IPython.display import clear_output


plt.style.use('ggplot')

In [4]:
def plot_2d_function(W, B, J, title, figsize=(12, 8)):
    
    '''
    W – матрица параметров по оси x
    B – матрица параметров по оси y
    J – функция которую мы будем оптимизировать
    
    title – заголовок картинки
    '''
    
    plt.figure(figsize=figsize)
    plt.contourf(W, B, J, levels=25)
    plt.title(title)
    plt.ylabel('$b$')
    plt.xlabel('$W$');


plt.style.use('ggplot')

In [86]:
# Диапазоны, где рисуется функция
W_RANGE = (-10, 100)
B_RANGE = (-10, 100)

def func(x, y):
    return np.sin(x + y) + (x - y) ** 2 - 1.5 * x + 2.5 * y + 1

def grad_x(x, y):
    return np.cos(x + y) + 2 * (x - y) - 1.5

def grad_y(x, y):
    return np.cos(x + y) - 2 * (x - y) + 2.5

In [87]:
def get_function_parameter_space(wrange=W_RANGE, brange=B_RANGE, num=100, function=func):
    
    '''Функция, которая генерирует матрицы значений для параметров'''
    
    w_grid = np.linspace(W_RANGE[0], W_RANGE[1], num=num)
    b_grid = np.linspace(B_RANGE[0], B_RANGE[1], num=num)

    W, B = np.meshgrid(w_grid, b_grid)
    J = function(W, B)
    
    return W, B, J

In [88]:
def plot_2d_gradient_descent(W, B, J, ws: list, bs: list, title: str, iteration_number: int,
                             figsize=(8, 12), levels=25):

    '''
    
    W – матрица параметров по оси x
    B – матрица параметров по оси y
    J – функция, которую мы будем оптимизировать
    
    ws – список с историей координат точки по оси x
    bs – список с историей координат точки по оси y
    
    title – заголовок картинки
    
    iteration_number – номер итерации
    figsize – размер картинки
    
    levels – количество линий уровня для отображения
    
    '''
    
    clear_output(True)
    fig, ax = plt.subplots(figsize=(12, 8))
    
    fig.set_figheight(figsize[0])
    fig.set_figwidth(figsize[1])

    cs = ax.contourf(W, B, J, levels=levels)
    ax.plot(ws, bs, 'r')

    iteration_msg = f'iteration: {iteration_number}' 
    parameters_msg = f'b: {round(bs[-1], 1)}, w: {round(ws[-1], 1)}'
    
    x_text_loc = W_RANGE[0] + (W_RANGE[1] - W_RANGE[0]) / 10
    y_text_loc = B_RANGE[0] + (B_RANGE[1] - B_RANGE[0]) / 2
    
    plt.text(
        s=iteration_msg + '\n' + parameters_msg,
        c='w', x=x_text_loc, y=y_text_loc
    )
    plt.title(title)
    plt.ylabel('$b$')
    plt.xlabel('$W$')
    
    plt.show()

In [125]:
# W, B, J = get_function_parameter_space()
x, y = -10, 10

# xs = [x]
# ys = [y]

iter_num = 0
iter_max = 1000

tolerance = 0.00000000000001
alpha = 0.8

w_x, w_y = 0, 0
beta = 0.25

dfdx, dfdy = 1000000, 1000000

def weighting(w_c, c1, c2, func_grad):
    w_c_new = w_c * beta + func_grad(c1, c2) * (1 - beta)
    c1 = c1 - alpha * w_c_new
    return (w_c_new, c1)

while iter_num < iter_max and np.linalg.norm([dfdx, dfdy]) > tolerance:
    dfdx = grad_x(x, y)
    dfdy = grad_y(x, y)
    
    w_x = w_x * beta + dfdx * (1 - beta)
    x = x - alpha * w_x
    w_y = w_y * beta + dfdy * (1 - beta)
    y = y - alpha * w_y
    
#     w_x, x = weighting(w_c=w_x, c1=x, c2=y, func_grad=grad_x)
#     w_y, y = weighting(w_c=w_y, c1=x, c2=y, func_grad=grad_y)
    
#     xs.append(x)
#     ys.append(y)
    
    print(x, y, func(x, y), np.linalg.norm([dfdx, dfdy]))
    
#     plot_2d_gradient_descent(W, B, J, xs, ys, title= 'Function', iteration_number=iter_num)
    
#     w_y = w_y * beta + grad_x(x, y) * (1 - beta)
#     y = y - alpha * w_y
#     w_y, y = weighting(w_c=w_y, c1=x, c2=y, func_grad=grad_y)
    
    iter_num += 1

14.3 -16.1 862.4861523691219 59.434838268476845
-15.068678743184147 12.491321256815855 813.8501515663886 83.15665239410663
12.068150285172127 -14.425849714827883 648.059144457227 80.78135209961863
-11.615540377973613 9.562559622026406 489.9556451485883 72.1085220872575
9.055486346135165 -11.075828653864853 364.0963979831759 62.72916060324849
-8.773600971351769 6.6828862786482475 268.90275552391677 54.111609426193496
6.514997474811299 -8.627134112688715 198.08679871023267 46.54597513466156
-6.6242397430752185 4.525089770049794 145.6929944444278 39.999994424693064
4.672613670835952 -6.763582372382809 107.00096998452672 34.36349363449277
-5.028390395202614 2.93590267621771 78.44532889125965 29.518020266696055
3.302518623384737 -5.397369397943949 57.375052675921594 25.35484978511384
-3.8543830045136698 1.7594149521592382 41.82910059883982 21.778572144182952
2.2932468007950995 -4.387648844046574 30.359352372620926 18.706645551401525
-2.9869169151191883 0.892663587280512 21.89708293312208 16

In [126]:
# print(func(100, 100))
print(x, y, func(x, y))

-0.5471975511965964 -1.5471975511965992 -1.9132229549810367
