In [2]:

from sklearn.model_selection import cross_val_score, train_test_split
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.metrics import accuracy_score, classification_report, mean_squared_error
from sklearn.cluster import KMeans
from sklearn.datasets import load_digits
from sklearn.preprocessing import StandardScaler
import numpy as np
import warnings

# Ignorowanie ostrzeżeń
warnings.filterwarnings("ignore", category=UserWarning)
warnings.filterwarnings("ignore", category=FutureWarning)
warnings.filterwarnings("ignore", category=RuntimeWarning)

# Wczytaj dane - przykładowy zbiór danych (load_digits)
data = load_digits()
X, y = data.data, data.target

# Skalowanie danych
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 1. Modele sprawdzianu krzyżowego (K-krotny sprawdzian krzyżowy)
cross_val_scores = cross_val_score(LogisticRegression(max_iter=1000), X_scaled, y, cv=5)
print("1. Modele sprawdzianu krzyżowego:")
print("Średnia dokładność:", np.mean(cross_val_scores))
print()

# 2. Tworzenie modelu regresji bazowej
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
regression_model = LinearRegression()
regression_model.fit(X_train, y_train)
regression_predictions = regression_model.predict(X_test)
print("2. Tworzenie modelu regresji bazowej:")
print("Średni błąd kwadratowy:", mean_squared_error(y_test, regression_predictions))
print()

# 3. Tworzenie modelu klasyfikacji bazowej
classification_model = LogisticRegression(max_iter=1000)
classification_model.fit(X_train, y_train)
classification_predictions = classification_model.predict(X_test)
print("3. Tworzenie modelu klasyfikacji bazowej:")
print("Dokładność klasyfikacji:", accuracy_score(y_test, classification_predictions))
print()
# 4. Ocena prognoz klasyfikatora binarnego
binary_y = (y > 4).astype(int)
binary_X_train, binary_X_test, binary_y_train, binary_y_test = train_test_split(X, binary_y, test_size=0.2, random_state=42)
binary_classification_model = LogisticRegression()
binary_classification_model.fit(binary_X_train, binary_y_train)
binary_classification_predictions = binary_classification_model.predict(binary_X_test)
print("4. Ocena prognoz klasyfikatora binarnego:")
print("Dokładność klasyfikacji:", accuracy_score(binary_y_test, binary_classification_predictions))
print()

# 5. Ocena progowania klasyfikatora binarnego
threshold = 0.5
binary_classification_probabilities = binary_classification_model.predict_proba(binary_X_test)[:, 1]
binary_classification_predictions_threshold = (binary_classification_probabilities > threshold).astype(int)
print("5. Ocena progowania klasyfikatora binarnego:")
print("Dokładność klasyfikacji po progowaniu:", accuracy_score(binary_y_test, binary_classification_predictions_threshold))
print()

# 6. Ocena prognoz klasyfikatora wieloklasowego
print("6. Ocena prognoz klasyfikatora wieloklasowego:")
print("Raport klasyfikacji:\n", classification_report(y_test, classification_predictions))
print()

# 7. Ocena modelu regresji
regression_model = LinearRegression()
regression_model.fit(X_train, y_train)
regression_predictions = regression_model.predict(X_test)
print("7. Ocena modelu regresji:")
print("Średni błąd kwadratowy:", mean_squared_error(y_test, regression_predictions))
print()

# 8. Ocena modelu klasteryzacji
kmeans = KMeans(n_clusters=len(np.unique(y)))
kmeans.fit(X)
cluster_predictions = kmeans.labels_
print("8. Ocena modelu klasteryzacji:")
print("Inertia (suma kwadratów odległości punktów do ich najbliższych centrów klastrów):", kmeans.inertia_)


1. Modele sprawdzianu krzyżowego:
Średnia dokładność: 0.9193361188486536

2. Tworzenie modelu regresji bazowej:
Średni błąd kwadratowy: 3.2574990113964546

3. Tworzenie modelu klasyfikacji bazowej:
Dokładność klasyfikacji: 0.9722222222222222

4. Ocena prognoz klasyfikatora binarnego:
Dokładność klasyfikacji: 0.9055555555555556

5. Ocena progowania klasyfikatora binarnego:
Dokładność klasyfikacji po progowaniu: 0.9055555555555556

6. Ocena prognoz klasyfikatora wieloklasowego:
Raport klasyfikacji:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        33
           1       0.97      1.00      0.98        28
           2       1.00      1.00      1.00        33
           3       0.97      0.97      0.97        34
           4       1.00      0.98      0.99        46
           5       0.94      0.94      0.94        47
           6       0.97      0.97      0.97        35
           7       1.00      0.97      0.99        34
          