In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

iris = load_iris()

X, y = iris.data, iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LogisticRegression()

model.fit(X_train, y_train)

predictions = model.predict(X_test)
accuracy = accuracy_score(y_test, predictions)

print(f'model accuracy: {accuracy}')
print(f'predictions: {predictions}')

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA

# Reducera till 2 dimensioner med PCA för att kunna plotta
pca = PCA(n_components=2)
X_reduced = pca.fit_transform(X)

# Dela upp i tränings- och testset igen
X_train_reduced, X_test_reduced, y_train, y_test = train_test_split(
    X_reduced, y, test_size=0.2, random_state=42
)

# Träna modellen igen på reducerad data
model.fit(X_train_reduced, y_train)

# Skapa en grid för att plotta beslutsgränser
x_min, x_max = X_reduced[:, 0].min() - 1, X_reduced[:, 0].max() + 1
y_min, y_max = X_reduced[:, 1].min() - 1, X_reduced[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.01), np.arange(y_min, y_max, 0.01))

# Förutsäga varje punkt i griden
Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

# Rita beslutsgränserna
plt.contourf(xx, yy, Z, alpha=0.8, cmap=plt.cm.Paired)

# Plotta datapunkter med färger som representerar klasser
scatter = plt.scatter(
    X_reduced[:, 0], X_reduced[:, 1], c=y, edgecolor="k", s=30, cmap=plt.cm.Paired
)

# Lägg till en manuell legend med arternas namn
legend_labels = iris.target_names
for i, label in enumerate(legend_labels):
    plt.scatter([], [], c=plt.cm.Paired(i / len(legend_labels)), label=label)
plt.legend(title="Arter", loc="upper right")

# Titel och axelbeskrivningar
plt.title("Beslutsgränser för Logistic Regression (PCA-reducerad data)")
plt.xlabel(f"Komponent 1 ({round(pca.explained_variance_ratio_[0] * 100, 2)}% varians)")
plt.ylabel(f"Komponent 2 ({round(pca.explained_variance_ratio_[1] * 100, 2)}% varians)")

# Visa grafen
plt.show()


In [None]:
import pandas as pd

# Skapa en DataFrame för att jämföra faktiska och förutsagda värden
comparison = pd.DataFrame({'Faktiskt': y_test, 'Prediktion': predictions})
print(comparison)

# Plotta en förväntad vs. förutsagd jämförelse
plt.figure(figsize=(6, 4))
plt.scatter(range(len(y_test)), y_test, label="Faktiskt", alpha=0.7)
plt.scatter(range(len(predictions)), predictions, label="Prediktion", marker='x', alpha=0.7)
plt.legend()
plt.title("Faktiskt vs Prediktion")
plt.xlabel("Index")
plt.ylabel("Klass")
plt.show()


In [None]:
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay

# Skapa konfusionsmatris
cm = confusion_matrix(y_test, predictions)
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=iris.target_names)

# Plotta matrisen
disp.plot(cmap=plt.cm.Blues)
plt.title("Konfusionsmatris för Logistic Regression")
plt.show()
