In [1]:
import numpy as np

In [2]:
# Определение функции Химмельблау
def himmelblau(x, y):
    return (x**2 + y - 11)**2 + (x + y**2 - 7)**2

In [3]:
class AdamOptimizer:
    def __init__(self, alpha=0.01, beta1=0.9, beta2=0.9, epsilon=1e-8):
        self.alpha = alpha
        self.beta1 = beta1
        self.beta2 = beta2
        self.epsilon = epsilon
        self.m_t =  np.zeros(2)
        self.v_t =  np.zeros(2)
        self.t = 0
    
    def optimize(self, func, x, y, max_iter):
        for _ in range(max_iter):
            # Вычисление градиента
            # Просто посчитает частные производные используя при этом правило дифференцирования сложной функции
            grad = np.array([4 * x * (x**2 + y - 11) + 2 * (x + y**2 - 7),
                             4 * y * (x + y**2 - 7) + 2 * (x**2 + y - 11)])
            
            # Обновление момента первого порядка
            self.m_t = self.beta1 * self.m_t + (1 - self.beta1) * grad
            
            # Обновление момента второго порядка
            self.v_t = self.beta2 * self.v_t + (1 - self.beta2) * (grad**2)
            
            # Вычисление скользящего среднего градиента первого порядка и второго порядка
            m_hat = self.m_t / (1 - self.beta1**(self.t+1))
            v_hat = self.v_t / (1 - self.beta2**(self.t+1))
            
            # Обновление параметров модели
            x = x - self.alpha * m_hat[0] / (np.sqrt(v_hat[0]) + self.epsilon)
            y = y - self.alpha * m_hat[1] / (np.sqrt(v_hat[1]) + self.epsilon)
            
            self.t += 1
        
        return x, y, func(x, y)

In [4]:
x = np.random.uniform(-5, 5)
y = np.random.uniform(-5, 5)
optimizer = AdamOptimizer()
X, Y, Z = optimizer.optimize(himmelblau, x, y, 1000)
print(f'X = {X:.4f}, Y = {Y:.4f}, Z = {Z:.4f}')

X = -3.7794, Y = -3.2835, Z = 0.0000
