In [1]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import FunctionTransformer, PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.pipeline import Pipeline

# Đọc dữ liệu từ file 'boston.csv'
data = pd.read_csv('boston.csv')

# Chọn các đặc trưng 'age' và 'lstat' và biến mục tiêu 'medv'
X = data[['AGE', 'LSTAT']]
y = data['MEDV']

# Chia dữ liệu thành tập huấn luyện và tập kiểm thử theo tỉ lệ 75:25 với random_state=16
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=16)

# Định nghĩa hàm SiLu: SiLu(x) = x / (1 + exp(-x))
def silu_transform(x):
    return x / (1 + np.exp(-x))

# Tạo transformer cho SiLu và đối tượng PolynomialFeatures với degree=2 (không thêm bias)
silu_transformer = FunctionTransformer(silu_transform)
poly_transformer = PolynomialFeatures(degree=2, include_bias=False)

# Xây dựng pipeline gồm các bước:
# 1. Áp dụng SiLu Transformation
# 2. Mở rộng đặc trưng bằng PolynomialFeatures (degree=2)
# 3. Huấn luyện mô hình Linear Regression
pipeline = Pipeline([
    ('silu', silu_transformer),
    ('poly', poly_transformer),
    ('lr', LinearRegression())
])

# Huấn luyện mô hình trên tập huấn luyện
pipeline.fit(X_train, y_train)

# Lấy hệ số tự do từ mô hình Linear Regression đã được huấn luyện
intercept = pipeline.named_steps['lr'].intercept_

print("Hệ số tự do (intercept) của mô hình huấn luyện là:")
print(intercept)


Hệ số tự do (intercept) của mô hình huấn luyện là:
37.72824962136811


In [3]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import FunctionTransformer, PolynomialFeatures

# Đọc dữ liệu từ file
data = pd.read_csv('boston.csv')
X = data[['AGE', 'LSTAT']]
y = data['MEDV']
# Chia dữ liệu: 75% train, 25% test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=16)

# Định nghĩa hàm SiLu
def silu_transform(x):
    return x / (1 + np.exp(-x))

# Áp dụng SiLu transformation
silu_transformer = FunctionTransformer(silu_transform)
X_train_silu = silu_transformer.fit_transform(X_train)

# Áp dụng PolynomialFeatures bậc 2
poly = PolynomialFeatures(degree=2, include_bias=False)
X_train_poly = poly.fit_transform(X_train_silu)

# Lấy tên các đặc trưng sau khi biến đổi
feature_names = poly.get_feature_names_out(input_features=['AGE', 'LSTAT'])

# Biến thành DataFrame để dễ xem
X_train_poly_df = pd.DataFrame(X_train_poly, columns=feature_names)

# In dòng đầu tiên
print("Dòng đầu tiên của đặc trưng sau khi đặc trưng hóa trên tập huấn luyện:")
print(X_train_poly_df.iloc[-1])


Dòng đầu tiên của đặc trưng sau khi đặc trưng hóa trên tập huấn luyện:
AGE            95.200000
LSTAT          11.319863
AGE^2        9063.040000
AGE LSTAT    1077.650930
LSTAT^2       128.139292
Name: 378, dtype: float64
