In [1]:
import numpy as np

def function(w1, w2):
    # Hàm cần tối ưu hóa (thay thế bằng hàm thực tế của bạn)
    return w1**2 + w2**2

def df_w(w1, w2):
    # Đạo hàm của hàm trên theo w1 và w2
    dw1 = 2 * w1
    dw2 = 2 * w2
    return np.array([dw1, dw2])

def rmsprop(grad, S, alpha, gamma, epsilon):
    """
    Hàm RMSProp
    grad: Gradient tại điểm hiện tại (numpy array)
    S: Giá trị tích lũy bình phương gradient (numpy array)
    alpha: Learning rate
    gamma: Decay rate
    epsilon: Giá trị để tránh chia cho 0
    """
    S = gamma * S + (1 - gamma) * grad**2  # Cập nhật S
    W = -alpha * grad / (np.sqrt(S) + epsilon)  # Cập nhật weights
    return S, W

def train_rmsprop(learning_rate, gamma, epsilon, epochs, init_w1, init_w2):
    results = []  # Để lưu các điểm trong quá trình tối ưu
    w1, w2 = init_w1, init_w2
    S = np.array([0.0, 0.0])  # S khởi tạo ban đầu (numpy array)

    for epoch in range(epochs):
        # Tính gradient
        grad = df_w(w1, w2)
        # Cập nhật S và weights
        S, delta_W = rmsprop(grad, S, learning_rate, gamma, epsilon)
        w1 += delta_W[0]
        w2 += delta_W[1]
        results.append([w1, w2])  # Lưu kết quả sau mỗi epoch

    return results

# Tham số đầu vào
learning_rate = 0.1
gamma = 0.9
epsilon = 1e-8
epochs = 30
init_w1, init_w2 = -5, -2

# Thực thi bài toán
results = train_rmsprop(learning_rate, gamma, epsilon, epochs, init_w1, init_w2)

# In kết quả
for i, (w1, w2) in enumerate(results):
    print(f"Epoch {i+1}: w1 = {w1:.4f}, w2 = {w2:.4f}")


Epoch 1: w1 = -4.6838, w2 = -1.6838
Epoch 2: w1 = -4.4616, w2 = -1.4739
Epoch 3: w1 = -4.2793, w2 = -1.3087
Epoch 4: w1 = -4.1201, w2 = -1.1698
Epoch 5: w1 = -3.9762, w2 = -1.0489
Epoch 6: w1 = -3.8433, w2 = -0.9415
Epoch 7: w1 = -3.7189, w2 = -0.8446
Epoch 8: w1 = -3.6011, w2 = -0.7567
Epoch 9: w1 = -3.4887, w2 = -0.6764
Epoch 10: w1 = -3.3808, w2 = -0.6028
Epoch 11: w1 = -3.2768, w2 = -0.5353
Epoch 12: w1 = -3.1760, w2 = -0.4733
Epoch 13: w1 = -3.0781, w2 = -0.4164
Epoch 14: w1 = -2.9828, w2 = -0.3644
Epoch 15: w1 = -2.8897, w2 = -0.3170
Epoch 16: w1 = -2.7987, w2 = -0.2739
Epoch 17: w1 = -2.7095, w2 = -0.2350
Epoch 18: w1 = -2.6220, w2 = -0.2000
Epoch 19: w1 = -2.5362, w2 = -0.1687
Epoch 20: w1 = -2.4518, w2 = -0.1411
Epoch 21: w1 = -2.3689, w2 = -0.1167
Epoch 22: w1 = -2.2873, w2 = -0.0956
Epoch 23: w1 = -2.2069, w2 = -0.0773
Epoch 24: w1 = -2.1278, w2 = -0.0618
Epoch 25: w1 = -2.0499, w2 = -0.0487
Epoch 26: w1 = -1.9731, w2 = -0.0379
Epoch 27: w1 = -1.8975, w2 = -0.0290
Epoch 28: 