# Beispiele

In [1]:
# Import
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split

## Beispiel: SVM from Scratch: Loss Function

<div>
    <img src=attachment:e80571fc-03da-4770-8246-a47e01f41c60.png width=200>
</div>

Wir haben gesehen, dass man durch ein paar mathematische Umformungen zu einem übersichtlichen Optimierungsproblem bzw. einer relativ überschaubaren Kostenfunktion gelangt. Wir wollen uns nun in diesem Beispiel damit beschäftigen die Loss Function in

$$ \min_{\mathbf{w},b} \frac{1}{2}||\mathbf{w}||^2 + C\sum_i \max\{0, 1 - y_i(\langle\mathbf{w}, \mathbf{x}_i\rangle + b)\}$$

als Funktion in Python abzubilden.

In [2]:
# Data and parameters
X, y = make_blobs(n_samples=1000, centers=2, cluster_std=0.1)
X = StandardScaler().fit_transform(X)
w = np.random.rand(X.shape[1])
b = np.random.rand()

In [None]:
def svm_loss_function(
    

## Session Exercise: SVM from Scratch: Gradienten

Alleine mit der Kostenfunktion kommen wir nicht weit - wir müssen die Gradienten dieser nach $\mathbf{w}$ und $b$ bilden. Schreiben Sie eine Funktion `svm_gradients`, die diese Gradienten basierend auf den Eingabeargumenten `X, y, w, b, C` berechnet und ausgibt.

In [7]:
def svm_gradients(X, y, w, b, C):

    return dw, db

In [8]:
svm_gradients(X, y, w, b, 1)

(array([-0.12472325,  0.74694641]), np.float64(-0.5))

## Session Exercise: SVM from Scratch: Gradientenabstieg

Um nun die SVM zu trainieren wählen wir eine Minimalversion des sog _Gradientenabstiegs_. Wir führen dieses in der _Full Batch_ Version durch, d.h. für jeden Update-Schritt (Epoche) von `w` berechnen wir die Gradienten anhand der gesamten Daten. Wir müssen im Grunde nur

<div>
    <img src=attachment:09d4f2cf-cc40-4e77-9c11-089bdc77c63b.png width=150>
</div>

`epochs` Epochen lang ausführen und darin

<div>
    <img src=attachment:adb4d7ea-1cd5-4bf2-a1bc-f213e092460c.png width=150>
</div>

berechnen. D.h. unsere zu erstellende `svm_train`-Funktion benötigt noch dieses $\eta$, das wir nun _learning rate_ nennen und mit `lr` als weiteres Eingabeargument in `svm_train` eingehen soll. Lassen Sie sich auch noch den Wert der Kostenfunktion zu jeder Epoche in eine Liste schreiben und diese - neben `w, b` - als Ausgabeargument ausgeben. Diese Liste plotten wir dann, um den Lernfortschritt zu visualisieren.

In [9]:
def svm_train(X, y, w, b, C, lr, epochs):
    

    return w, b, list_of_costs

In [None]:
w, b, list_of_costs = svm_train(X, y, w, b, 1, 0.01, 1000)
plt.plot(list_of_costs)
plt.xlabel('Epochs')
plt.ylabel('Loss')

## Session Exercise: SVM from Scratch: Visualize Training

<div>
    <img src=attachment:24ab4d84-a5ea-4152-8678-ca1eff8f50f7.png width=500>
</div>

Schreiben Sie eine Funktion `visualize_svm_training`, die Ihnen die trainierten Parameter `w, b` nach dem Gradientenabstieg aufnimmt und daraus die entsprechende Hyperebene in den Feature-Raum zeichnet. Damit die Visualisierung zumindest einigermaßen klappt, muss `w` normalisiert werden. Bonus: wenn das funktioniert, dann können Sie versuchen eine Funktion `animate_svm_training` zu bauen, die Ihnen das Training der SVM dynamisch visualisiert. Hierzu könnten Sie z.B. die `svm_train` so anpassen, dass sie Ihnen Zwischenschritte für `w` und `b` in Listen abspeichert. Diese können Sie dann für die Animation verwenden.

In [13]:
def plot_decision_line(w, b, x_range):
    fig, ax = plt.subplots(figsize=(6,5))
    xmin, xmax = x_range
    xs = np.linspace(xmin, xmax, 400)




    
    ax.set_xlabel('x1')
    ax.set_ylabel('x2')
    ax.legend()
    ax.grid(True)
    return ys

In [None]:
ys = plot_decision_line(w, b, x_range=(X[:, 0].min(), X[:, 0].max()))
plt.scatter(X[:, 0], X[:, 1], c=y)

## SVM zur Handschrifterkennung

<div>
    <img src=attachment:c92fe058-bc7b-42f3-8ca7-40a2f2f4422d.png width=350>
</div>

Stellen Sie sich vor Sie müssten einem Modell aus handschriftlichen Notizen beibringen geschriebene Zahlen zu erkennen. Dieser Use Case kann Ihnen an vielen Stellen begegnen - z.B.
* wenn Sie als Post von Briefen die geschriebene Postleitzahl und Hausnummer digitalisieren müssten und so die Weiterverarbeitung von Briefen beschleunigen würden
* wenn in hochautomatisierten Produktionsanlagen in Bauteilen eingestanzte Seriennummern erkannt und digitalisiert werden müssen
* wenn Sie im Rahmen einer Absatzprognose Notizen von Mitarbeitern erhalten, auf denen noch Absatzzahlen handschriftlich festgehalten werden.

In diesem Beispiel wollen wir eine SVM nutzen, um genau diesen Use Case zu lösen. Hierzu nutzen wir das sog. _Digits-Dataset_ aus `sklearn`, in dem eine Vielzahl handschriftlicher Zahlen in `(8, 8)` großen Arrays abgespeichert sind. Unser Ziel ist es, dass die SVM so trainiert wird, dass sie __ungesehene__ handschriftliche Zahlen in die richtige Klasse (die zugrundeliegende Zahl) einordnen kann. Bemerkung: wir kommen hier mit einer _Multi-Class SVM_ in Berührung.

**Bonus**: schreiben Sie selbst Ziffern auf einen Zettel, fotografieren Sie diese und _scoren_ sie an unserem Modell. Wie schneidet es ab?

In [2]:
# Import
from sklearn.datasets import load_digits
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split

# Get digits data

# Look at data

# Plot some digits


In [1]:
# Do train test split

# Look at split sizes

# Get SVM instance

# Train SVM

# Predict test data

# Visualize prediction

# Score own image


## SVM and Face Recognition
<div>
    <img src=attachment:28a0f4ea-9a28-44a6-b47c-9fae015f25b8.png width=350>
</div>

Wir wollen uns in diesem Beispiel gleich einem interessanten Anwendungsfall im maschinellen Lernen widmen: der Gesichtserkennung. Hierzu laden wir uns mittels eines sog. _Fetchers_ aus `sklearn.datasets` einen Datensatz, der Bilder von Gesichtern berühmter Personen beinhaltet. Unser Ziel ist es eine SVM zu trainieren, die diese Gesichter erkennen - also __klassifizieren__ - kann. Zu jeder Person gibt es eine Vielzahl verschiedener Aufnahmen - jede Person stellt also eine __Klasse__ dar. Die Bilder haben die Dimensionalität `(62,47)` und somit ca. 3000 Pixel. Wenn jeder Pixel einer Dimension in einem Raum entsprechen würde, dann wäre ein Gesicht ein Datenpunkt in diesem Raum. Dieser Raum ist uns zu hochdimensional. Daher _projizieren_ wir die Gesichter in einen niedrigdimensionaleren Raum (wir greifen hier den Themenblock PCA vorweg).

In [1]:
# Import
import seaborn as sns; sns.set()
from sklearn.datasets import fetch_lfw_people
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
from sklearn.datasets import fetch_lfw_people
from sklearn.metrics import accuracy_score
from sklearn.decomposition import PCA
from sklearn.svm import SVC
import seaborn as sns; sns.set()

# Get face images

# Look at the structure


In [2]:
# Let's have a look


In [8]:
# Download the data, if not already on disk and load it as numpy arrays

# introspect the images arrays to find the shapes (for plotting)

# Assign feature matrix

# the label to predict is the id of the person

# split into a training and testing set

# Compute a PCA on the face dataset

# Train a SVM classification model


In [9]:
# Quantitative evaluation of the model quality on the test set
      
# Qualitative evaluation of the predictions using matplotlib

# plot the result of the prediction on a portion of the test set


## Beispiel: Fault Classification of Bearing Faults

<div>
    <img src=attachment:16768a86-e1c2-4a06-bb6c-889a8c0b1997.png width=200>
</div>
(Bildquelle: Wikipedia)

In diesem Beispiel wollen wir uns dem Apsekt der _Fault Classification_ annehmen. Hierzu nutzen wir Vibrationsdaten von Kugellagern, die verschiedene Schadensklassen aufweisen. Diese Kugellager sind in einem Servomotorverbaut. Neben den "Gesunddaten" liegen uns Daten von Beschädigungen an einer Kugel (B021), des Innenrings (IR021) und des Außenrings (OR021@6) vor. Wir wollen diese Zeitserien in _Fenster_ aufteilen, aus diesen dann bestimmte einfache Features extrahieren und anhand derer dann eine SVM trainieren, die uns ungesehene Daten dann klassifizieren soll.

In [12]:
# Import
from scipy.io import loadmat
import os
from sklearn.svm import SVC
from sklearn.model_selection import GridSearchCV
from scipy.stats import skew, kurtosis
import glob

In [13]:
# Load single file

# Shape

# Plot it


In [14]:
# Get list of files

# Stack time series

# Get splits

# Calculate features for each split
    
    # Std
    
    # Skewness
    
    # Kurtosis

# Reshape

# Train test split

# Train SVM by GridSearchCV

# Get the best model and predict the test data set

# Get accuracy
