In [69]:
import numpy as np
import matplotlib.pyplot as plt
from numpy import linalg as LA
from sympy import *

In [None]:
# функция для примера, вместо неё может быть любая другая
def f1(x,y):
    return -np.cos(x)*np.cos(y)*np.exp(-((x-np.pi)**2+(y-np.pi)**2))

In [71]:
x = np.linspace(-10,10,2000)
y = np.linspace(-10,10,2000)
X,Y = np.meshgrid(x,y)
Z = f1(X,Y)


In [72]:
# x, y = symbols('x y')
# eq=-cos(x)*cos(y)*exp(-((x-pi)**2+(y-pi)**2))

In [73]:
def f(x,y):
    return -np.cos(x)*np.cos(y)*np.exp(-((x-np.pi)**2+(y-np.pi)**2))

In [2]:
def SGD_grad(X, Y):
    
    """
    Функция для нахождения градиента функции
    
    Parameters
    ----------
    X: numpy.ndarray
        Массив значений переменной x
    Y: numpy.ndarray
        Массив значений переменной y
        
    Returns
    -----------
    np.array
        Массив значений градиента
        
    """
    
    v = list(ordered(eq.free_symbols))
    gradient = lambda f, v: Matrix([f]).jacobian(v)
    subs_grad=gradient(eq, v).subs([(x,X),(y,Y)]).evalf()
    return np.array(subs_grad).astype(np.float64)[0]

In [3]:
def stochastic_gradient_descent(max_epochs, xy_start, obj_func, grad_func):
    
    """
    Функция для нахождения градиента функции
    
    Parameters
    ----------
    max_epochs: int
        Максимальное количество итераций для запуска
    xy_start: np.array
        Начальная точка, с которой начинается градиентный спуск
    obj_func: function
        Ссылка на функцию, которая вычисляет целевую функцию
    grad_func: function
        Ссылка на функцию, вычисляющую градиент функции
    Returns
    -----------
    xy_history
        Все точки в пространстве, посещенные градиентным спуском, в которых оценивалась целевая функция
    f_history
        Соответствующее значение целевой функции, вычисленное в каждой точке
        
    """
        
    xy = xy_start
    xy_history = xy_start
    f_history = obj_func(*xy_start)
    delta_xy = np.zeros(xy_start.shape)
    i = 0
    diff = 1
    l_rate=0.01
    while  i < max_epochs and diff > 1e-8:
        
        choose_var = np.random.randint(xy_start.shape[0])
        grad = np.zeros(shape = xy_start.shape[0])
        grad[choose_var] = grad_func(*xy)[choose_var]
        delta_xy = -l_rate*np.array(grad) + 0.6*delta_xy
        xy = xy+delta_xy
            
        i += 1
        xy_history = np.vstack((xy_history,xy))
        f_history = np.vstack((f_history,obj_func(*xy)))
        diff = np.absolute(f_history[-1]-f_history[-2])
    return xy_history, f_history

In [76]:
opt_res,f_opt = stochastic_gradient_descent(max_epochs = 500,xy_start = np.array([2.5,2.5]),
                                          obj_func = f,grad_func = SGD_grad)

opt_res,f_opt

(array([[2.5       , 2.5       ],
        [2.50572024, 2.5       ],
        [2.50915238, 2.50578672],
        [2.51701255, 2.50925875],
        [2.52757947, 2.51134197],
        [2.53391962, 2.51865035],
        [2.53772371, 2.52917682],
        [2.54000616, 2.54168821],
        [2.54762342, 2.54919505],
        [2.55853142, 2.55369915],
        [2.56507621, 2.56284879],
        [2.57549657, 2.56833858],
        [2.58174879, 2.57827229],
        [2.59215866, 2.58423252],
        [2.59840458, 2.59462608],
        [2.60215213, 2.60773499],
        [2.61136588, 2.61560033],
        [2.62392712, 2.62031954],
        [2.63146386, 2.63025315],
        [2.64312173, 2.63621332],
        [2.65011645, 2.64705176],
        [2.66155907, 2.65355481],
        [2.66842464, 2.66484557],
        [2.67988926, 2.67162003],
        [2.68676804, 2.68317252],
        [2.69089531, 2.69759129],
        [2.69337167, 2.71367101],
        [2.70254956, 2.72331884],
        [2.71577366, 2.72910754],
        [2.731

In [77]:
opt_res[-1]# Итоговая точка

array([3.14027939, 3.14143054])

In [4]:
help(SGD_grad)

Help on function SGD_grad in module __main__:

SGD_grad(X, Y)
    Функция для нахождения градиента функции
    
    Parameters
    ----------
    X: numpy.ndarray
        Массив значений переменной x
    Y: numpy.ndarray
        Массив значений переменной y
        
    Returns
    -----------
    np.array
        Массив значений градиента



In [5]:
help(stochastic_gradient_descent)

Help on function stochastic_gradient_descent in module __main__:

stochastic_gradient_descent(max_epochs, xy_start, obj_func, grad_func)
    Функция для нахождения градиента функции
    
    Parameters
    ----------
    max_epochs: int
        Максимальное количество итераций для запуска
    xy_start: np.array
        Начальная точка, с которой начинается градиентный спуск
    obj_func: function
        Ссылка на функцию, которая вычисляет целевую функцию
    grad_func: function
        Ссылка на функцию, вычисляющую градиент функции
    Returns
    -----------
    xy_history
        Все точки в пространстве, посещенные градиентным спуском, в которых оценивалась целевая функция
    f_history
        Соответствующее значение целевой функции, вычисленное в каждой точке

