Introduction to Grid Search

Grid Search is a hyperparameter optimization technique used in machine learning. It involves defining a grid of hyperparameter values and then exhaustively evaluating the model’s performance for each combination of these values. The combination that yields the best performance is selected.


جستجوی شبکه یک تکنیک بهینه‌سازی ابرپارامتر است که در یادگیری ماشین استفاده می‌شود. این روش شامل تعریف یک شبکه از مقادیر ابرپارامترها و سپس ارزیابی جامع عملکرد مدل برای هر ترکیب از این مقادیر است. ترکیبی که بهترین عملکرد را به دست می‌دهد، انتخاب می‌شود.

Why Use Grid Search?

Machine learning models have hyperparameters that are not learned from the data but set prior to training . The performance of a model is highly sensitive to these hyperparameters. Grid Search automates the process of finding the best hyperparameter values.



مدل‌های یادگیری ماشین دارای ابرپارامترهایی هستند که از داده‌ها یاد گرفته نمی‌شوند، بلکه قبل از آموزش تنظیم می‌شوند 
. عملکرد یک مدل به شدت به این ابرپارامترها حساس است. جستجوی شبکه فرآیند یافتن بهترین مقادیر ابرپارامتر را خودکار می‌کند.

Steps Involved in Grid Search



    1.Define the Hyperparameter Grid: Specify the hyperparameters you want to tune and the range of values for each.
    2.Define the Evaluation Metric: Choose a metric to evaluate the model’s performance 
    3.Model Training and Evaluation: For each combination of hyperparameters, train the model and evaluate its performance using the chosen metric.
    4,Select the Best Hyperparameters: Select the hyperparameter combination that yields the best performance.


    تعریف شبکه ابرپارامتر: ابرپارامترهایی را که می‌خواهید تنظیم کنید و محدوده مقادیر برای هر کدام را مشخص کنید.1
    تعریف معیار ارزیابی: یک معیار برای ارزیابی عملکرد مدل انتخاب کنید .2
    آموزش و ارزیابی مدل: برای هر ترکیب از ابرپارامترها، مدل را آموزش دهید و عملکرد آن را با استفاده از معیار انتخابی ارزیابی کنید.3
    انتخاب بهترین ابرپارامترها: ترکیبی از ابرپارامترها را که بهترین عملکرد را به دست می‌دهد، انتخاب کنید.4


In [1]:
from sklearn import datasets
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import SVC
from sklearn.metrics import classification_report

# Load the digits dataset
digits = datasets.load_digits()

# Split data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size=0.3, random_state=42)

# Define the hyperparameter grid
param_grid = {
    'C': [0.1, 1, 10, 100],
    'gamma': [0.001, 0.01, 0.1, 1],
    'kernel': ['rbf']
}

# Create a GridSearchCV object
grid = GridSearchCV(SVC(), param_grid, refit=True, verbose=2, cv=3) # Added cross-validation (cv)

# Fit the model
grid.fit(X_train, y_train)

# Print the best parameters
print("Best parameters found: ", grid.best_params_)

# Evaluate the model
grid_predictions = grid.predict(X_test)
print(classification_report(y_test, grid_predictions))


Fitting 3 folds for each of 16 candidates, totalling 48 fits
[CV] END .....................C=0.1, gamma=0.001, kernel=rbf; total time=   0.0s
[CV] END .....................C=0.1, gamma=0.001, kernel=rbf; total time=   0.0s
[CV] END .....................C=0.1, gamma=0.001, kernel=rbf; total time=   0.0s
[CV] END ......................C=0.1, gamma=0.01, kernel=rbf; total time=   0.0s
[CV] END ......................C=0.1, gamma=0.01, kernel=rbf; total time=   0.0s
[CV] END ......................C=0.1, gamma=0.01, kernel=rbf; total time=   0.0s
[CV] END .......................C=0.1, gamma=0.1, kernel=rbf; total time=   0.0s
[CV] END .......................C=0.1, gamma=0.1, kernel=rbf; total time=   0.0s
[CV] END .......................C=0.1, gamma=0.1, kernel=rbf; total time=   0.0s
[CV] END .........................C=0.1, gamma=1, kernel=rbf; total time=   0.0s
[CV] END .........................C=0.1, gamma=1, kernel=rbf; total time=   0.0s
[CV] END .........................C=0.1, gamma=1

Explanation of the Code:


   1. We load the digits dataset from scikit-learn.
   2. We split the dataset into training and testing sets.
   3. We define the param_grid which specifies the hyperparameters (C, gamma, kernel) and their possible values.
   4. We create a GridSearchCV object, passing the SVM classifier, the param_grid, refit=True (which retrains the model with the best parameters found), verbose=2 (to display progress), and cv=3 for cross-validation.
   5. We fit the GridSearchCV object to the training data.
   6. We print the best parameters found by Grid Search.
   7. We evaluate the model on the test set and print the classification report.



    ما مجموعه داده ارقام را از سایکیت لرن بارگیری می‌کنیم.1
    ما مجموعه داده را به مجموعه‌های آموزشی و آزمایشی تقسیم می‌کنیم.2
    ما دیکشنری از پارامترها را تعریف می‌کنیم که ابرپارامترها  و مقادیر ممکن آنها را مشخص می‌کند.3
    ما یک شی GridSearchCV ایجاد می‌کنیم، با عبور دادن طبقه‌بندی‌کننده SVM، param_grid، refit=True (که مدل را با بهترین پارامترهای یافت شده دوباره آموزش می‌دهد)، verbose=2 (برای نمایش پیشرفت) و cv=3 برای اعتبارسنجی متقابل.4
    ما شی GridSearchCV را با داده‌های آموزشی مطابقت می‌دهیم.5
    ما بهترین پارامترهای یافت شده توسط جستجوی شبکه را چاپ می‌کنیم.6
    ما مدل را روی مجموعه آزمایشی ارزیابی می‌کنیم و گزارش طبقه‌بندی را چاپ می‌کنیم.7
