# Wir implementieren einen Hund-Katze Klassifikator mit neuronalen Netzen

In [3]:
import sklearn
from sklearn import metrics
from sklearn.utils import shuffle
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras import utils
import numpy as np
import cv2
import os

## Folgende Funktion nimmt ein Bild entgegen, skaliert das Bild auf 32x32 RGB-Pixel, und liefert einen 3072-dim Merkmalevektor zurueck

In [4]:
def image_to_feature_vector(image, size=(32, 32)):
    return cv2.resize(image, size).flatten()

## Laden Sie die Daten aus dem gitlab:

- data/train.zip

- data/test100.zip


Schreiben Sie eine Funktion, die die Bilder einliest und mit Hilfe der Funktion image_to_feature_vector vorverarbeiten. Anschließend sollen die Vektoren in eine data-Matrix geschrieben werden. 
Zusätzlich ist ein label-Vektor zu erzeugen. Wie sehen die Labels sinnvollerweise aus?

In [5]:
def load_images(directory, size=(32, 32)):
    data = []
    labels = []

    for filename in os.listdir(directory):
        if filename.endswith(".jpg"):
            image = cv2.imread(os.path.join(directory, filename))
            features = image_to_feature_vector(image, size)
            data.append(features)
            label = filename.split(".")[0]
            if label == "cat":
                label = 0
            if label == "dog":
                label = 1
            labels.append(label)

    data = np.array(data)
    labels = np.array(labels)
    
    label_encoder = LabelEncoder()
    labels = label_encoder.fit_transform(labels)
    labels = keras.utils.to_categorical(labels, num_classes=2)

    return data, labels

In [6]:
data, labels = load_images("...\\cat_dog_train_data\\train")
print(data.shape)

(25000, 3072)


## Splitten Sie die Daten in ein train/test-set.

Macht es Sinn die Daten zu normieren?

Es macht Sinn die Daten zu normieren in Bezug auf input feature scaling und diesbezüglich overfitting

In [7]:
normalized_data = utils.normalize(data)

shuffled_data, shuffled_labels = shuffle(data, labels, random_state=42)

In [8]:
X_train, X_dev, y_train, y_dev = train_test_split(shuffled_data, shuffled_labels, test_size=0.25, random_state=42)

X_train_reshaped = X_train.reshape(-1, 32, 32, 3)
X_dev_reshaped = X_dev.reshape(-1, 32, 32, 3)

In [9]:
datagen = ImageDataGenerator(
    rotation_range=20,       
    width_shift_range=0.1,   
    height_shift_range=0.1,  
    shear_range=0.2,         
    zoom_range=0.2,          
    horizontal_flip=True,    
    fill_mode='nearest'      
)

datagen.fit(X_train_reshaped)

augmented_train_data = datagen.flow(X_train_reshaped, y_train, batch_size=2)

augmented_dev_data = datagen.flow(X_dev_reshaped, y_dev, batch_size=2)

# Erstellen Sie ein Neuronales Netz mit Keras

In [10]:
image_height, image_width, channels = 32, 32, 3

model = keras.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(128, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(2, activation='softmax')
])

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# ... und starten Sie das Training

In [11]:
model.fit(augmented_train_data, epochs=5, validation_data=augmented_dev_data)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x1b15ce0ef50>

# Evaluieren Sie das Netz auf den held-back Test-Daten


Berechnen Sie die Akkuratheit und die Verwechselungsmatrix

In [18]:
def evaluate_model(model, test_directory):
    test_data, test_labels = load_images(test_directory, size=(32, 32))
    normalized_test_data = utils.normalize(test_data)

    test_data_reshaped = normalized_test_data.reshape(-1, 32, 32, 3)

    predictions = model.predict(test_data_reshaped)
    predicted_labels = np.argmax(predictions, axis=1)
    true_labels = np.argmax(test_labels, axis=1)
    acc = sklearn.metrics.accuracy_score(true_labels, predicted_labels)
    print(f"Accuracy: {acc}")

In [19]:
evaluate_model(model,"...\\cat_dog_test_data\\test100")

Accuracy: 0.51
