# Chapter 16
# Improve Performance with Alogrithm Tuning

## Grid Search Parameter Tuning

In [None]:
# Nhập các thư viện cần thiết
import numpy as np  # Thư viện cho các phép toán số học
from pandas import read_csv  # Thư viện để đọc các tệp CSV
from sklearn.linear_model import Ridge  # Mô hình hồi quy Ridge
from sklearn.model_selection import GridSearchCV  # Thư viện để tìm kiếm tham số bằng Grid Search

# Tải dữ liệu
filename = 'diabetes.csv'  # Đường dẫn tới tệp dữ liệu
datafrmae = read_csv(filename)  # Đọc tệp CSV vào một DataFrame

# Chuẩn bị dữ liệu
array = datafrmae.values  # Chuyển đổi DataFrame thành một mảng NumPy
X = array[:, 0:8]  # Chọn 8 cột đầu tiên làm đặc trưng (features)
y = array[:, 8]  # Chọn cột thứ 9 làm biến mục tiêu (target variable)

# Định nghĩa lưới tham số
alphas = np.array([1, 0.1, 0.01, 0.001, 0.0001, 0])  # Mảng các giá trị alpha cần kiểm tra
param_grid = dict(alpha=alphas)  # Tạo một từ điển cho lưới tham số

# Thực hiện tìm kiếm tham số bằng Grid Search
grid = GridSearchCV(estimator=Ridge(), param_grid=param_grid)  # Khởi tạo GridSearchCV với mô hình Ridge
grid.fit(X, y)  # Huấn luyện mô hình với dữ liệu

# Xuất kết quả
print(grid.best_score_)  # In ra điểm số tốt nhất từ Grid Search
print(grid.best_estimator_.alpha)  # In ra giá trị alpha tốt nhất

0.27610844129292433
1.0


## Random Search Parameter Tuning

In [None]:
# Nhập các thư viện cần thiết
from scipy.stats import uniform  # Để tạo phân phối đều
from sklearn.model_selection import RandomizedSearchCV  # Để tìm kiếm tham số ngẫu nhiên

# Định nghĩa phân phối tham số
param_grid = {'alpha': uniform()}  # Sử dụng phân phối đều cho tham số alpha

# Khởi tạo RandomizedSearchCV với mô hình Ridge
rsearch = RandomizedSearchCV(estimator=Ridge(), param_distributions=param_grid, n_iter=100, random_state=7)

# Huấn luyện mô hình với dữ liệu
rsearch.fit(X, y)  # Thực hiện tìm kiếm ngẫu nhiên trên tập dữ liệu

# Xuất kết quả
print(rsearch.best_score_)  # In ra điểm số tốt nhất từ tìm kiếm ngẫu nhiên
print(rsearch.best_estimator_.alpha)  # In ra giá trị alpha tốt nhất

0.2761075573402853
0.9779895119966027
