# Business Analytics und Künstliche Intelligenz
Wintersemester 2023/2024

Prof. Dr. Jürgen Bock

## Übungen zur Arbeit mit Python und den relevanten Bibliotheken

Dieses Notebook bietet Übungsaufgaben zum Umgang mit Python und den in dieser Vorlesung wichtigen Bibliotheken. Die einzelnen Aufgaben sind in Markdown-Zellen beschrieben. Fügen Sie Ihre Lösung in die jeweils nachfolgende Code-Zelle ein und fügen Sie bei Bedarf gerne weitere Code-Zellen hinzu.

### Lernziele
* Sie sind in der Lage Python-Module zu importieren und zu verwenden.
* Sie erkunden die Python-Dokumentation bestimmter Module und sind in der Lage die dort beschriebenen Funktionalitäten anzuwenden.
* Sie können wichtige Evaluationsmetriken für Klassifikatoren beschreiben und sind in der Lage deren Aussagekraft zu beurteilen.
* Sie sind in der Lage Rechen- und Umform-Operationenen auf *PyTorch*-Tensoren anzuwenden.

### *scikit-learn*

#### Klassifikator-Evaluation

Stellen Sie sich folgendes Anwendungsbeispiel vor:

Ein Automobilhersteller produziert in einer Fertigungslinie von Kunden individuell konfigurierte Fahrzeuge. Der Kunde kann dabei unter anderem eine Bereifung wählen. Im Rahmen einer automatischen Endkontrolle soll überprüft werden, ob an einem Fahrzeug der richtige Reifentyp montiert ist. Ein kamerabasiertes Inspektionssystem nimmt dabei ein Bild des Reifens auf und klassifiziert das Bild in eine den Auswahlmöglichkeiten entsprechende Klasse und vergleicht das Ergebnis mit dem erwarteten (bestellten) Reifentyp.

Um das System zu evaluieren, soll eine Testreihe von tatsächlichen Bestellungen mit den durch das Inspektionssystem erkannten Reifentypen verglichen werden.

Die Testreihe besteht aus folgenden tatsächlichen Bestellungen `y_test` und durch den Klassifikator erkannten Typen `y_predict`:

In [None]:
import numpy as np

y_test = ['205/55 R16 91V', '225/55 R16 99V', '205/55 R16 94H', 
          '195/45 R16 84H', '255/45 R20 105V', '255/45 R20 105V',
          '195/65 R16 92H', '255/45 R20 105V', '225/55 R16 99V',
          '195/45 R16 84H', '205/55 R16 91V', '225/55 R16 99V',
          '255/45 R20 105V', '225/55 R16 99V', '205/55 R16 91V',
          '225/55 R16 99V', '255/45 R20 105V', '195/65 R16 92H',
          '255/45 R20 105V', '205/55 R16 94H', '255/45 R20 105V',
          '205/55 R16 91V', '205/55 R16 91V', '205/55 R16 91V',
          '225/55 R16 99V', '205/55 R16 94H', '225/55 R16 99V',
          '205/55 R16 94H', '205/55 R16 94H', '205/55 R16 94H']

y_predict = ['205/55 R16 91V', '255/45 R20 105V', '205/55 R16 91V',
             '195/45 R16 84H', '255/45 R20 105V', '255/45 R20 105V',
             '195/65 R16 92H', '255/45 R20 105V', '225/55 R16 99V',
             '195/45 R16 84H', '205/55 R16 91V', '225/55 R16 99V',
             '255/45 R20 105V', '225/55 R16 99V', '205/55 R16 91V',
             '225/55 R16 99V', '255/45 R20 105V', '195/45 R16 84H',
             '255/45 R20 105V', '205/55 R16 91V', '255/45 R20 105V',
             '205/55 R16 91V', '255/45 R20 105V', '205/55 R16 91V',
             '225/55 R16 99V', '205/55 R16 94H', '225/55 R16 99V',
             '195/45 R16 84H', '205/55 R16 94H', '205/55 R16 94H']

Verwenden Sie *scikit-learn* um precision, recall, f1-score und accuracy des Klassifikators zu ermitteln. Warum ist hier eine Durchschnittsberechnung notwendig? Was sagen uns diese Metriken?

Warum ist hier eine Durchschnittsberechnung notwendig?

*Antwort:*

Was sagen uns diese Metriken?

*Antwort:*

Erstellen sie mittels *scikit-learn* einen *classification report*.

Welche der Metriken dürfte für den Automobilhersteller besonders interessant sein und warum?

*Antwort:*

#### Datensätze

Laden Sie den *iris* Datensatz mittels *scikit-learn* (über das `datasets` Modul).

Dieser bekannte Datensatz beschreibt vier Merkmale von drei verschiedenen Schwertlilienarten. Die Aufgabe ist es, anhand der Merkmale die Art vorherzusagen.

Machen Sie sich mit dem Datensatzobjekt vertraut. Es beinhaltet die Daten selbst, die Labels, sowie Beschreibungen der Klassen und der Merkmale.

### matplotlib

Verwenden Sie `matplotlib.pyplot` um Scatter-Plots von Kombinationen von jeweils zwei Merkmalen darzustellen. Zeigen Sie die jeweilige Klasse (Label) über die Farbe der Punkte an.

### *PyTorch*

#### Tensoren

Durchlaufen Sie die folgenden Tensor-Manipulationen korrekt, können Sie am Ende ein "Lösungswort" ablesen.

Speichern Sie die Tensor-Objekte in beliebigen Variablen ab, außer Sie werden dazu angehalten die Operation *in place* durchzuführen. Geben Sie sich zur Kontrolle auch Zwischenergebnisse aus oder zeigen Sie sich sich Größe, Dimensionalität oder Form der Tensoren an.

Erstellen Sie einen zweidimensionalen der Form (7x7) gefüllt mit normalverteilten Zufallszahlen.

Teilen sie jedes Element im Tensor durch 10 und speichern Sie das Ergebnis in einem neuen Tensor.

Addieren Sie 1 zu jedem Element in jeder zweiten Spalte (beginnend bei der 2. Spalte). Beachten Sie: Die zweite Spalte ist **nicht** die Spalte mit Index 2.

Ersetzen Sie die erste und letzte Zeile durch einen Vektor aus normalverteilten Zufallszahlen und Teilen sie diese Zufallszahlen durch 10.

Erstellen Sie einen eindimensionalen View des Tensors.

Addieren Sie folgenden "Code" auf den View.

In [None]:
code = torch.tensor([0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0])

Definieren Sie folgende Funktion (einfach die Zelle ausführen):

In [None]:
def view_code(x):
    import matplotlib.pyplot as plt
    %matplotlib inline

    xx, yy = torch.meshgrid((torch.arange(7), torch.arange(7)))

    plt.scatter(xx, yy, c=torch.rot90(x, 3), marker="s", s=3000)

Übergeben Sie Ihren Tensor an die Funktion:

In [None]:
view_code( ... )  ## Ersetzen Sie ... durch ihre Tensor-Variable

Wie lautet das Lösungswort? ;)

*Antwort:*