# Aufgabe 1

## Wrap-Up Deep Learning

### Übung 1: Implementierung eines linearen Klassifikators für binäre Klassifikation

Implementieren Sie mit TensorFlow einen linearen Klassifikator, um eine binäre Klassifikation auf einem synthetischen Datensatz durchzuführen.

In [1]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic data for binary classification
X, y = make_classification(n_samples=1000, n_features=20, n_classes=2, random_state=42)
# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


# Your code here

Lösung:

In [1]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic data for binary classification
X, y = make_classification(n_samples=1000, n_features=20, n_classes=2, random_state=42)
# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Define the model with a single dense layer, using a sigmoid activation function for binary classification
model = Sequential([
    Dense(1, activation='sigmoid', input_shape=(20,))
])

# Compile the model using stochastic gradient descent (SGD) as the optimizer and binary crossentropy as the loss function
model.compile(optimizer='sgd', loss='binary_crossentropy', metrics=['accuracy'])

# Train the model on the training data
model.fit(X_train, y_train, epochs=10, batch_size=32, validation_data=(X_test, y_test))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x29e5b0190>

Das Modell besteht aus einer einzelnen "dense" Schicht mit einer Einheit und einer Sigmoid-Aktivierungsfunktion. Diese Konfiguration repräsentiert die einfachste Form eines neuronalen Netzes, das im Wesentlichen eine logistische Regression durchführt. Der Grund für die Verwendung einer Sigmoid-Aktivierungsfunktion liegt darin, dass sie Werte zwischen 0 und 1 ausgibt, was sie für binäre Klassifikationsaufgaben geeignet macht, bei denen die Wahrscheinlichkeit vorhergesagt werden muss, dass eine Eingabe zu einer von zwei möglichen Klassen gehört.

Das Modell wird mit dem Stochastic Gradient Descent (SGD) Optimizer und der Binary Crossentropy Loss Function kompiliert. SGD wird aufgrund seiner Einfachheit und Effektivität bei der Suche nach dem Minimum der Loss Function für binäre Klassifikationsaufgaben gewählt. Binary Crossentropy wird als Loss Function verwendet, da sie die Leistung eines Klassifikationsmodells misst, dessen Ausgabe ein Wahrscheinlichkeitswert zwischen 0 und 1 ist. Sie eignet sich für die Vorhersage von binären Klassen.

Das Training des Modells erfolgt mit der .fit()-Methode, wobei der Datensatz in Trainings- und Testsets aufgeteilt wird.

### Übung 2: Erstellung eines Multi-Layer Perceptrons (MLP) für die Multiklassifikation

Konstruieren Sie ein Multi-Layer Perceptron mit TensorFlow, um Instanzen in mehrere Kategorien zu klassifizieren.

In [2]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_blobs
from sklearn.preprocessing import OneHotEncoder
from sklearn.model_selection import train_test_split

# Generate synthetic data for multiclass classification
X, y = make_blobs(n_samples=1000, centers=5, n_features=20, random_state=42)

# Reshape labels for one-hot encoding
y = y.reshape(-1, 1)
encoder = OneHotEncoder(sparse_output=False)
# One-hot encode the labels
y = encoder.fit_transform(y)

# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Your code here

Lösung:

In [3]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_blobs
from sklearn.preprocessing import OneHotEncoder
from sklearn.model_selection import train_test_split

# Generate synthetic data for multiclass classification
X, y = make_blobs(n_samples=1000, centers=5, n_features=20, random_state=42)

# Reshape labels for one-hot encoding
y = y.reshape(-1, 1)
encoder = OneHotEncoder(sparse_output=False)
# One-hot encode the labels
y = encoder.fit_transform(y)

# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Define a multi-layer model
model = Sequential([
    # Input layer with ReLU activation
    Dense(64, activation='relu', input_shape=(20,)),
    # Hidden layer with ReLU activation
    Dense(32, activation='relu'),
    # Output layer with softmax activation for multiclass classification
    Dense(5, activation='softmax')
])

# Compile the model with Adam optimizer and categorical crossentropy loss function
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Train the model on the training data
model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.src.callbacks.History at 0x2a5a2b890>

Die Netzwerkarchitektur umfasst einen Input Layer, zwei Hidden Layers mit ReLU-Aktivierungsfunktionen und eine Ausgabeschicht mit einer Softmax-Aktivierungsfunktion. ReLU wird für die Hidden Layers gewählt, weil es das Problem des "vanishing Gradients" abschwächt und es dem Modell ermöglicht, komplexe Muster zu lernen. Die Softmax-Aktivierungsfunktion in der Ausgabeschicht wird für die Multiklassifikation verwendet, da sie die Logits des Modells in Wahrscheinlichkeiten für jede Klasse umwandelt.

Als Optimizer wird der Adam Optimizer und Categorical Crossentropy als Loss Function gewählt. Adam wird aufgrund seiner Effizienz im Umgang mit sparse Gradients und adaptiven Lernraten ausgewählt.   
Categorical Crossentropy ist für Multiklassifikationsprobleme geeignet, bei denen jedes Ziel als ein One-Hot-codierter Vektor dargestellt wird.

### Übung 3: Neuronales Netzwerk für Regression

Entwickeln Sie ein neuronales Netzwerk mit TensorFlow, um eine Regression auf einem synthetischen Datensatz durchzuführen.

In [None]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Generate synthetic data for regression
X, y = make_regression(n_samples=1000, n_features=20, n_targets=1, noise=0.1, random_state=42)
# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Your code here

Lösung:

In [6]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Generate synthetic data for regression
X, y = make_regression(n_samples=1000, n_features=20, n_targets=1, noise=0.1, random_state=42)
# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# It's important to scale features for regression problems to improve model performance
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Define the model architecture
model = Sequential([
    # Input and hidden layer with ReLU activation
    Dense(64, activation='relu', input_shape=(20,)),
    # Additional hidden layer
    Dense(32, activation='relu'),
    # Output layer for regression (note the lack of activation function)
    Dense(1)
])

# Compile the model using mean squared error (MSE) as the loss function and Adam as the optimizer
model.compile(optimizer='adam', loss='mean_squared_error')

# Train the model on the training data
model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.src.callbacks.History at 0x2c96c39d0>

Das Ziel besteht darin, ein neuronales Netzwerk für Regressionsaufgaben zu verwenden, um kontinuierliche Werte aus einem synthetischen Datensatz vorherzusagen. Die Architektur besteht aus einem Input Layer, zwei Hidden Layers mit ReLU-Aktivierungsfunktionen und einem Output Layer ohne Aktivierungsfunktion. Das Fehlen einer Aktivierungsfunktion in der Ausgabeschicht ermöglicht es dem Netzwerk, einen Bereich kontinuierlicher Werte auszugeben (muss, da Regression).

Das Modell wird mit der Mean Squared Error (MSE) Loss Function und dem Adam Optimizer kompiliert. MSE wird gewählt, weil es effektiv die Differenz zwischen den vorhergesagten und den tatsächlichen Werten quantifiziert, was es ideal für Regressionsaufgaben macht. Adam wird aufgrund seiner Vorteile bei der Geschwindigkeit der Konvergenz und dem Umgang mit spärlichen Gradienten verwendet.