# UE 4 Mehrklassenklassifikation mit Deep Learning Frameworks

In der dritten Übungsaufgabe habt ihr eine Klassifikationspipeline für 15 Klassen aus dem **Subset InVar-100** Datensatze aufgebaut und eure Ergebnisse evaluiert. 



## Nachtrag UE 3
Lösungsansätze für HOG-SVM-Klassifikation und HOG-Multi-layer-Perceptron-Klassifikation
### HOG-SVM-Klassifikation

In dieser Aufgabe solltet ihr eure eure Klassifikationspipeliene aus der UE 3 auf 15 Klassen des Industrial 100 Datensatzes erweitern und die Evaluation der Ergebnisse durchführen.

Für diese Aufgabe wurde sklearn.[svm.SVC](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC)-Klassifikator verwendet. 

Dieser Klassifikator bietet folgende Vorteile: 
- Wirksam in höherdimensionalen Merkmalsräumen
- Wirksam, sogar wenn die Anzahl der Dimensionen größer ist als die Anzahl der Samples 

Die im Folgenden abgebildete Confusion Matrix visualisiert beispielhaft die Ergebnisse für diese Aufgabe.
Übersicht der Ergebnisse:
- Number of mislabeled points out of a total 195 points : 11
- Accuracy score for HOG-svm.svc is: 0.94
***

**Confusion Matrix** für HOG-SVM-Klassifikator
<img src="./ipynb_bilder/cm_svm_svc_acc_94_all_classes.png"  />

Zum Extrahieren der HOG-Features wurde folgende Konfiguration verwendet: 

- img = imread(img_path)
- img = resize(img, (128, 128),anti_aliasing=True)
- hog_fd = hog(img, orientations=9, pixels_per_cell=(8, 8), cells_per_block=(2, 2), channel_axis=-1)
***

*train_test_split_fct* - Parameter:

- test_size=0.25
- random_state=42
***

Code für svm.SVC-Klassifikation:

- from sklearn import svm
- clf = svm.SVC()
- clf.fit(X_train_hog, y_train_hog)
- print("Number of mislabeled points out of a total %d points : %d" % (X_test_hog.shape[0], 
                                                                    (y_test_hog != clf.predict(X_test_hog)).sum()))

- accuracy_score_hog_svc = accuracy_score(y_test_hog, clf.predict(X_test_hog))
- print('Accuracy score for HOG-svm.svc is: {}'.format(accuracy_score_hog_svc))

### HOG-Multi-layer-Perceptron-Klassifikation

Anbei ist die Codevorlage und beispielhahte Visualisierung der Ergebnisse:

- Number of mislabeled points out of a total 195 points : 14
- Accuracy score for HOG-MLP is: 0.928
***
**Confusion Matrix** für HOG-MLP-Klassifikator
<img src="./ipynb_bilder/cm_hog_mlp_acc_93_all_classes.png"  />


## Vorbereitende Aufgabe UE 4 - Theorie

In der heutigen Übung macht ihr euch die Deep Learning Frameworks zunutze, um die Klassifikation ohne explizite Merkmalsextraktion durchzuführen.


In der Übung lernt ihr [Tensorflow-Open-Source-Plattform](https://www.tensorflow.org) und [Keras](https://keras.io/) kennen. 



Die **Tensorflow-Tutorials für Anfänger** https://www.tensorflow.org/tutorials?hl=de könnt ihr als Einstieg in die Keras-Grundlagen nutzen.

Das Ziel ist, dass ihr euch mit den **4 Schritten einer Modellentwicklung mit Keras** vertraut macht:

1. Aufbau eines Modells
2. Kompilieren eines Modells
3. Training eines Modells 
4. Evaluation des trainierten Modells


Folgende Fragen solltet ihr dabei beantwortet haben: 
- Wie erfolgt die Datenaufbereitung („Loading & Preprocessing“)?
- Was ist ein Layer? 
- Welche Modelltypen bietet Keras an?
- Was ist ein Sequential model? 
- Wofür werden folgende Befehle / Funktionen benutzt, welche Parameter müssen für die Verwendung dieser Befehle in Abhängigkeit von der Aufgabenstellung und den verwendeten Daten festgelegt werden: 
    - Model()
    - Sequential()
    - keras.layers.Dense()
    - add()
    - compile()
    - fit()
    - evaluate()
    - predict()
    
Als Informationsquelle bietet sich auch https://keras.io/ an. Gerne könnt ihr euch alles anschauen, fokussiert euch in diesem Schritt primär auf die beiden **Beispiele** mit den Hinweisen zu den einzelnen Schritten: 
- https://www.tensorflow.org/tutorials/images/classification
- https://keras.io/getting_started/intro_to_keras_for_engineers/ 


Ich werde diese Aufgabe mit euch in der Übung gemeinsam duchgehen und die einzelnen Schritte erläutern. 

Ihr könnt euch aber auch selbstständig den ersten Überblick verschaffen. 

## Praktische Aufgabe 
### Klassifikation mit einem ConvNet-Modell

In dieser Aufgabe werdet ihr eine andere Netzarchitektur – Convolutional Neural Networks (ConvNets) – kennenlernen. Diese Netzarchitektur wurde speziell für die Verarbeitung von Bildern konzipiert. Zusätzlich zu den Dense-Layers, die für die Klassifikationsaufgabe zuständig sind, kommen zwei weitere ConvNets Layer-Typen, die die Merkmalsextraktionsaufgabe übernehmen. Das sind Convolutional Layers und Pooling Layers.


Eure Aufgabe besteht darin, ein simples ConvNet-Klassifikationsmodell zu implementieren, zu trainieren und zu testen. 

Ihr werdet einen **Subset aus dem Industrial 100** Datensatz verwenden. Der Subset enthält die ersten 15 Klassen des Datensatzes. Eine Übersicht über alle ClassIDs und deren Bezeichnungen findet ihr in der csv-Datei Industrial100-labels.csv.
Den Datensatz könnt ihr (wenn nicht in der dritten Übung gemacht) von der tubCloud herunterladen und in den BGA2-Ordner ablegen (oder auf eurem eigenen Rechner). Anbei der Link zum Datensatz: https://tubcloud.tu-berlin.de/s/7ZRADfF4kdJGSma

Diese Aufgabe könnt ihr angelehnt an die Schritte der Modellentwicklung mit Keras in folgende Teilaufgaben unterteilen:
1. Datenaufbereitung
2. Aufbau des Modells
3. Kompilieren des Modells
4. Training des Modells
5. Evaluation des trainierten Modells
6. Speichern des Modells
7. Verwendung des gespeicherten Modells zur Klassifikation eigener Beispielbilder

Zur optimalen Nutzung des Arbeitsspeichers deines Rechners könnt ihr zum Laden von Daten die Funktion [image_dataset_from_directory](https://keras.io/api/preprocessing/image/#image_dataset_from_directory-function)  nutzen. 

Alternative [Moeglichkeiten](https://keras.io/api/preprocessing/image/): 

- ImageDataGenerator + flow_from_directory()
- ImageDataGenerator + flow_from_dataframe()
- load_img()
- img_to_array()

### Zusätzuliche Ressourcen
Schaut euch die im Übungsordner abgelegte Dokumentation mit den ersten Hinweisen zu Google [Colab](https://colab.research.google.com/notebooks/intro.ipynb) und den Introlink. 

Ihr könnt diese Umgebung für die Übung 4 und 5 nutzen. 


### Ab hier - Eure Implementierung anhand der Beispiele

In [45]:
# Imports
import tensorflow as tf
from tensorflow import keras
from keras.callbacks import EarlyStopping
from keras import layers, models, regularizers
from keras.models import load_model
from keras.preprocessing import image
import numpy as np
import pandas as pd

In [46]:
# 1. Datenaufbereitung
data_dir = "/Users/chexuanyou/TUB/SS_25/ABGA2/ABGA2/UE_4_Aufgaben-20250618/Industrial100_Auszug/SUBSET_Industrial_100"
batch_size = 32
img_height = 224
img_width = 224
seed = 42

train_ds = keras.preprocessing.image_dataset_from_directory(
    data_dir,
    validation_split=0.2,
    subset="training",
    seed=seed,
    image_size=(img_height, img_width),
    batch_size=batch_size
)

val_ds = keras.preprocessing.image_dataset_from_directory(
    data_dir,
    validation_split=0.2,
    subset="validation",
    seed=seed,
    image_size=(img_height, img_width),
    batch_size=batch_size
)

class_names = train_ds.class_names
print(class_names)


Found 780 files belonging to 15 classes.
Using 624 files for training.
Found 780 files belonging to 15 classes.
Using 156 files for validation.
['0', '1', '10', '11', '12', '13', '14', '2', '3', '4', '5', '6', '7', '8', '9']


In [47]:
from keras import layers, models, regularizers

model = models.Sequential([
    layers.Input(shape=(224, 224, 3)),
    layers.Rescaling(1./255),

    layers.Conv2D(32, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),

    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),

    layers.Conv2D(128, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),

    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(15, activation='softmax')
])


In [48]:
# 3. Kompilieren des Modells
model.compile(
    optimizer='adam',  # 优化器
    loss='sparse_categorical_crossentropy',  # 多类分类的损失函数
    metrics=['accuracy']  # 评估指标
)


In [49]:
# 定义 EarlyStopping 回调
early_stop = EarlyStopping(monitor='val_loss', patience=3, restore_best_weights=True)

# 训练模型
epochs = 15
history = model.fit(
    train_ds,
    validation_data=val_ds,
    epochs=epochs,
    callbacks=[early_stop]
)

Epoch 1/15
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m16s[0m 734ms/step - accuracy: 0.0850 - loss: 3.8473 - val_accuracy: 0.2179 - val_loss: 2.6714
Epoch 2/15
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 681ms/step - accuracy: 0.1491 - loss: 2.5861 - val_accuracy: 0.3910 - val_loss: 2.1035
Epoch 3/15
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 697ms/step - accuracy: 0.3361 - loss: 2.0616 - val_accuracy: 0.4359 - val_loss: 1.8332
Epoch 4/15
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m15s[0m 721ms/step - accuracy: 0.4549 - loss: 1.6598 - val_accuracy: 0.5577 - val_loss: 1.4347
Epoch 5/15
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m15s[0m 752ms/step - accuracy: 0.6191 - loss: 1.1990 - val_accuracy: 0.6474 - val_loss: 1.2399
Epoch 6/15
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m15s[0m 753ms/step - accuracy: 0.6493 - loss: 1.0317 - val_accuracy: 0.6538 - val_loss: 1.0382
Epoch 7/15
[1m20/20[

In [50]:
# 5. Evaluation des trainierten Modells
loss, acc = model.evaluate(val_ds)
print(f"Validation accuracy: {acc:.4f}")


[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 220ms/step - accuracy: 0.7339 - loss: 0.8694
Validation accuracy: 0.7500


In [51]:
# 6. Speichern des Modells
model.save("my_convnet_model.keras")


In [52]:
# 7. Verwendung des gespeicherten Modells zur Klassifikation eigener Beispielbilder

model = load_model("my_convnet_model.keras")



In [54]:
# 加载图片并预处理（和训练保持一致）
img_path = "/Users/chexuanyou/TUB/SS_25/ABGA2/ABGA2/UE_4_Aufgaben-20250618/Industrial100_Auszug/SUBSET_Industrial_100/8/Industrial_9.jpg"
img = image.load_img(img_path, target_size=(224, 224))  # Resize
img_array = image.img_to_array(img)             # Normalize
img_array = np.expand_dims(img_array, axis=0)           # Add batch dim

# 预测
pred = model.predict(img_array)
predicted_class = np.argmax(pred, axis=1)[0]
print(f"Predicted class ID: {predicted_class}")


label_map = pd.read_csv(
    "/Users/chexuanyou/TUB/SS_25/ABGA2/ABGA2/UE_4_Aufgaben-20250618/Industrial100_Auszug/SUBSET_Industrial_100/Industrial100-labels.csv",
    header=None, names=["class_id", "label"]
)

print("Predicted label name:", label_map.iloc[predicted_class]['label'])



[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 181ms/step
Predicted class ID: 13
Predicted label name: Edelstahlschraube-DIN912
