In [11]:
import numpy as np

# 1. Dữ liệu mẫu (mẫu nhỏ để minh họa)
X = np.array([[1, 2, 3],  # Ma trận đặc trưng (m x n)
              [1, 4, 9],
              [1, 6, 7]])  # Mỗi hàng là một mẫu (3 mẫu, 3 đặc trưng)
Y = np.array([[0],         # Vector nhãn (m x 1)
              [1],
              [1]])

# 2. Hàm sigmoid
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# 3. Hàm tính mất mát (log loss)
def compute_loss(h, y):
    m = y.shape[0]
    return -1 / m * np.sum(y * np.log(h) + (1 - y) * np.log(1 - h))

# 4. Cài đặt Gradient Descent
def gradient_descent(X, Y, theta, learning_rate, iterations):
    m = X.shape[0]  # Số mẫu
    for i in range(iterations):
        # Dự đoán với hàm sigmoid
        z = np.dot(X, theta)          # z = X * theta
        h = sigmoid(z)                # h = sigmoid(z)
        # err = h - Y
        # print(z)
        # print(h)
        # print(err)

        # Tính gradient: grad = (1/m) * X.T * (h - Y)
        grad = (1 / m) * np.dot(X.T, (h - Y))

        # Cập nhật theta: theta = theta - alpha * grad
        theta -= learning_rate * grad

        # Tùy chọn: In loss mỗi 100 vòng
        if i % 100 == 0:
            loss = compute_loss(h, Y)
            print(f"Iteration {i}: Loss = {loss:.4f}")
    return theta

# 5. Khởi tạo tham số
theta = np.zeros((X.shape[1], 1))  # Vector trọng số (n x 1), ban đầu là 0
learning_rate = 0.1
iterations = 1000

# 6. Chạy thuật toán
theta_final = gradient_descent(X, Y, theta, learning_rate, iterations)

# 7. In kết quả
print("Trọng số tối ưu (theta):")
print(theta_final)


Iteration 0: Loss = 0.6931
Iteration 100: Loss = 0.3194
Iteration 200: Loss = 0.2300
Iteration 300: Loss = 0.1747
Iteration 400: Loss = 0.1388
Iteration 500: Loss = 0.1141
Iteration 600: Loss = 0.0963
Iteration 700: Loss = 0.0830
Iteration 800: Loss = 0.0728
Iteration 900: Loss = 0.0647
Trọng số tối ưu (theta):
[[-5.56716794]
 [ 0.56612821]
 [ 0.81141435]]
