In [7]:
import numpy as np

def tao_du_lieu(so_mau=100, seed=None):
    if seed is not None:
        np.random.seed(seed)  # Đặt seed để kết quả tái lập

    # Tạo dữ liệu X
    dien_tich = np.random.randint(20, 200, size=so_mau)  # Diện tích từ 20 đến 200
    so_phong = np.random.randint(1, 10, size=so_mau)     # Số phòng từ 1 đến 10
    X = np.column_stack((dien_tich, so_phong))           # Ghép thành mảng 2D

    # Tạo dữ liệu Y
    nhieu = np.random.randint(1, 11, size=so_mau)        # Nhiễu ngẫu nhiên từ 1 đến 10
    Y = dien_tich * 10 + so_phong * 5 + nhieu            # Tính giá thuê

    return X, Y

# Dữ liệu: Diện tích (Area), Số phòng (Rooms), Giá nhà (Price)
X_nit, Y = tao_du_lieu(so_mau=100, seed=42)

# Chuẩn hóa dữ liệu (tiêu chuẩn hóa về phạm vi 0-1)
X_norm = (X_nit - X_nit.mean(axis=0)) / X_nit.std(axis=0)

# Thêm cột 1 vào X để đại diện cho hệ số chệch w0 (thêm cột hệ số chệch)
X_bias = np.c_[np.ones(X_norm.shape[0]), X_norm]  # Thêm cột 1 cho hệ số bias (tạo ma trận X với 3 cột)

# Khởi tạo trọng số ngẫu nhiên nhỏ
w = np.random.randn(X_bias.shape[1]) * 0.01

# Hyperparameters
learning_rate = 0.01  # Giảm tốc độ học
iterations = 1000     # Số vòng lặp

# Gradient Descent
m = len(Y)            # Số mẫu
cost_history = []     # Lưu trữ chi phí trong mỗi bước

for i in range(iterations):
    # Tính toán dự đoán
    y_pred = X_bias.dot(w)

    # Tính toán sai số
    error = y_pred - Y

    # Cập nhật trọng số
    w -= (learning_rate / m) * X_bias.T.dot(error)

    # Tính chi phí và lưu vào lịch sử
    cost = (1 / (2 * m)) * np.sum(error ** 2)
    cost_history.append(cost)

print("Trọng số tối ưu:", w)

# Dự đoán giá nhà cho tất cả dữ liệu
y_pred = X_bias.dot(w)
print(Y[0:10], y_pred[0:10])
print("ERROR:", np.linalg.norm(y_pred - Y) ** 2 / Y.shape[0])


Trọng số tối ưu: [1076.61351919  504.59730708   13.10238157]
[1241 1996 1154  381 1308  949  449 1263 1430  948] [1239.89862064 1999.85510263 1149.79053309  379.83631387 1309.49742384
  949.70733601  449.69202202 1264.57183254 1424.92098564  950.09269342]
ERROR: 7.596057376080535
