In [10]:
import numpy as np
from sklearn.linear_model import Lasso
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Tạo dữ liệu giả lập
np.random.seed(42)
X = np.random.rand(100, 10)  # 100 mẫu, 10 đặc trưng
true_coef = np.array([1.5, 0, -2.0, 0, 0.5, 0, 0, 0, 1.0, 0])  # Hệ số thực tế
y = X.dot(true_coef) + np.random.randn(100) * 0.5  # Thêm nhiễu

# Chia dữ liệu thành tập train và test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Khởi tạo mô hình Lasso
lasso_model = Lasso(
    alpha=0.1,            # Hệ số điều chỉnh L1
    fit_intercept=True,   # Tính toán hệ số chặn (intercept)
    precompute=False,     # Không sử dụng Gram matrix được tính sẵn
    copy_X=True,          # Sao chép X để bảo toàn dữ liệu gốc
    max_iter=1000,        # Số lần lặp tối đa
    tol=0.0001,           # Ngưỡng dừng thuật toán
    warm_start=False,     # Không khởi tạo bằng kết quả từ lần fit trước
    positive=False,       # Không bắt buộc các hệ số phải dương
    random_state=42,      # Đặt seed cho tính ngẫu nhiên
    selection='cyclic'    # Cập nhật tuần tự các đặc trưng
)

# Huấn luyện mô hình
lasso_model.fit(X_train, y_train)

# Dự đoán trên tập test
y_pred = lasso_model.predict(X_test)

# Đánh giá mô hình
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print("Mean Squared Error:", mse)
print("R^2 Score:", r2)
print("Số lần lặp:", lasso_model.n_iter_)
print("Hệ số hồi quy (coef_):", lasso_model.coef_)
print("Hệ số chặn (intercept_):", lasso_model.intercept_)

# Hiển thị các hệ số không bằng 0
print("Các đặc trưng được chọn (coef khác 0):", np.nonzero(lasso_model.coef_)[0])


Mean Squared Error: 0.29919524470499
R^2 Score: 0.5084494508378135
Số lần lặp: 4
Hệ số hồi quy (coef_): [ 0.56338237 -0.         -1.21891361  0.          0.          0.
  0.         -0.          0.          0.        ]
Hệ số chặn (intercept_): 0.867138727450695
Các đặc trưng được chọn (coef khác 0): [0 2]
