In [5]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.pipeline import Pipeline
from sklearn.metrics import accuracy_score

iris = load_iris()
X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

pipeline = Pipeline([
    ('scaler', StandardScaler()),  # Standaryzacja danych
    ('classifier', RandomForestClassifier(random_state=42))  # Model klasyfikacji
])

pipeline.fit(X_train, y_train)

predictions = pipeline.predict(X_test)

accuracy = accuracy_score(y_test, predictions)
print("Accuracy:", accuracy)


param_grid = {
    'classifier__n_estimators': [50, 100, 200],
    'classifier__max_depth': [None, 10, 20],
    'classifier__min_samples_split': [2, 5, 10]
}

# Tworzę obiekt GridSearchCV
grid_search = GridSearchCV(estimator=pipeline, param_grid=param_grid, cv=5)

# Przeprowadzam Grid Search na danych treningowych
grid_search.fit(X_train, y_train)

# Wyświetlam najlepsze hiperparametry znalezione przez Grid Search
print("Najlepsze hiperparametry:", grid_search.best_params_)

# Ocena dokładności najlepszego modelu na danych testowych
best_model = grid_search.best_estimator_
predictions = best_model.predict(X_test)
accuracy = accuracy_score(y_test, predictions)
print("Dokładność najlepszego modelu:", accuracy)

Accuracy: 1.0
Najlepsze hiperparametry: {'classifier__max_depth': None, 'classifier__min_samples_split': 5, 'classifier__n_estimators': 50}
Dokładność najlepszego modelu: 1.0
