# Eine kurze Einführung in die Programmiersprache Python
Dieses Jupyter Notebook soll eine Einführung in die wichtigsten Python Befehle, Bibliotheken und Methoden geben. Die Codebeispiele können durch das Makieren der jeweiligen Zelle und anschließendem Drücken der 'Run Cell' Funktion (Str + Enter) ausgeführt werden. 

Da angenommen wird, dass alle Kursteilnehmer ein Grundverständnis anderer Programmiersprachen besitzen, wird im Folgenden lediglich auf die fundamentalen Unterschiede bei der Verwendung von Python eingegangen.

Disclaimer: Die verwendete Python-Version ist Python 3.6 (Python 2 - Shame on you!)

**Tipp: Generell können verfügbare Methoden über ``dir(Objekt)`` oder der jeweilige API-Referenzeintrag über ``help(Objekt)`` abgefragt werden:**

In [None]:
List = []

print('Selection of objekt methods:\n')
print(dir(List)[:5])
print('\n')
print(help(List.pop))

## Kapitel I: Variablen Deklaration & Datentypen
Variablen müssen bei der Deklaration keinem explizitem Typ zugewiesen werden. Vielmehr erkennt der Interpreter den Datentyp selbst und allokiert dementsprechend Speicher.

In [None]:
n = 45
print (n + 100)

In [None]:
n = 'Das ist ein Test'
print(n)

## Kapitel II: Listen, Dictonaries und Numpys
Oftmals ist es nötig, Daten innerhalb einer Datenstruktur zu speichern, um einen späteren Zugriff zu erleichtern. Python bietet hierfür unteranderem die Built-In Datenstrukturen List, Dict und Tuple an. Ein weitere weit verbreitete Datenstruktur ist Numpy, welche oft für wissenschaftliche Berechnungen genutzt wird.

- List: Entspricht der Datenstruktur **stack** und besitzt unteranderem die Methoden append (vgl. push) und pop. Listen folgend dem LIFO (Last In - First Out) Prinzip.
- Dictonaries: Entspricht der **Map** in Java und 'mapped' Schlüsselpaare zu Objekten. 
- Numpys: Numpy ist eine Bibliothek für performante wissenschaftliche Berechnungen. Unteranderem enthält es die Möglichkeit **Arrays** zu instanzieren. Über numpy.array(Liste) können konfortable Listen in Arrays gecastet werden.

In [None]:
List = [1, 2, 3]
print(List)

In [None]:
Dictonary = {'Hello': 'Hallo',
            'Good': 'Gut',
            'Bad': 'Schlecht'}
print(Dictonary)

In [None]:
import numpy 

array = numpy.array([1, 0, 0, 1])
print(array)

## Kapitel III: Indexierung & Slices
Einzelne Elemente innerhalb von Numpys und Listen (und sogar Strings) können durch den Syntax *Variable[index]* ausgewählt werden.
Durch Slices können **Elementbereiche** ausgewählt werden, wodurch Datensätze bspw. geteilt werden können. Dabei wird der Anfang und das Ende des Bereiches innerhalb einer eckigen Klammer durch einen Doppelpunkt getrennt: *Variable[start:ende]*. 

**Tipp: Das letzte Element eines Objektes kann durch ein -1 komfortable indexiert werden.**

In [None]:
List = ['Hallo', 'wie', 'geht', 'es', 'dir', '?']

index_element =  List[3]
print('Element an Index 3:', index_element)

index_element =  List[3:6]
print('Elemente im Indexbereich 3 - 6:', index_element)

index_element =  List[-1]
print('Letzte Element:', index_element)

## Kapitel IV: Klassen
Klassen verhalten sich in Python wie in jeder anderen objektorientierten Programmiersprache. Es können Attribute und Methoden definiert werden um Modularisierung und Zugriffskontrolle zu erreichen.

Syntax
- Klassen definition: ``class klassen_namen:``
- Methoden definition: ``def methoden_namen(self, Übergabeparameter):``
- Konstruktor definition: ``def __init__(self):``

**Tipp: Verweise bzw. Aufrufe auf Attribute und Methoden innerhalb einer Klasse müssen immer mit einem expliziten self. referenziert werden. Wird dies nicht gemacht, wird das referenzierte Attribut bzw. die Methode nicht gefunden.**

In [None]:
class Beispiel_Klasse:
    def __init__(self, vorname, name):
        self.name = name
        self.vorname = vorname
    def get_full_name(self):
        return self.vorname + ' ' + self.name

beispiel_klasse = Beispiel_Klasse('Eric', 'Schmidt')
print(beispiel_klasse.get_full_name())

## Kapitel IV: Methoden
Bei der Programmierung von Methoden ist das, von Python vorgegebene, Indent um eine Stelle zu beachten. Wird dies ignoriert wird ein *invalid syntax SyntaxError* ausgegeben. Dies gilt auch für Schleifen und If-Statements und erzwingt einen übersichtlichen Programmierstil.

Syntax
- ``def methoden_namen(Übergabeparameter):``

**Tipp: Methoden können schlank durch sogenannte Lambda Functions dargestellt werden. Dies sorgt jedoch oftmals zu unleserlichen Sourcecode und ist nur bei bestimmten Anforderungen sinnvoll.**

In [None]:
def beispiel_methode(übergabe_parameter):
    übergabe_parameter = übergabe_parameter + 100
    return übergabe_parameter

ergebnis = beispiel_methode(100)
print(ergebnis)

## Kapitel V: Schleifen 
Python unterscheidet zwischen zwei Schleifen: **For-Loops** und **While-Loops**. der Syntax beider Schleifenarten ist durch untenstehendes Codebeispiel ersichtlich. 

Für For-Loops:
- Der ``range`` Befehl gibt die Wiederholungszahl der Schleife an.
- Auf Elemente multidimensionaler Listen kann durch (dimension_1, dimension_2) einfach zugegriffen werden.

**Tipp: Der Befehl enumerate, welchem die Wiederholungsanzahl als Parameter übergeben wird, fügt der Schleife einen Zähler hinzu.**

In [None]:
#Standard For-Loop

for i in range(5):
    print('For-Loop Iteration', i)

In [None]:
#Objektelement Iteration

List = ['Hallo', 'wie', 'geht', 'es', 'dir', '?']

for count, wort in enumerate(List):
    print('Wort %d: %s' % (count, wort))

In [None]:
#Multidimensionale Objektelement Iteration

List = [['Wie','Sehr'], ['gehts','gut']]

for (D1, D2) in List:
    print('Dimension 1 %s \t Dimension 2 %s' % (D1, D2))

In [None]:
#Standard While-Loop
i = 0
while i < 5:
    print('While-Loop Iteration', i)
    i = i + 1

## Kapitel VI: If-Statements
Der Syntax der If-Statements folgt den Regeln der bereits vorgestellten Implementierungen.

In [None]:
value = True

if value:
    print('Value == True')
else:
    print('Value == False')

## Kapitel VII: Import von Bibliotheken
Ein großer Vorteil von Python ist die einfach Einbindung der vielzähligen Bibliotheken. Installierte Pakete - beispielsweise über PIP - können einfach über ``import bibliothek`` eingebunden werden.

**Tipp: Bibliotheken können mit dem Schlüsselwort *as* ein Alias gegeben werden um schlankeren Code zu schreiben.**

In [None]:
import numpy as np

np.array([5, 1, 2, 4])

## Kapitel VIII: Packages und __init__.py
Ordner, welche als Bibliothek bzw. Paket importiert werden können, benötigen eine __init__.py Datei, die den Ordner als Python Package initialisiert.

# Python Übung: Handschrifterkennung mit sklearn
Da ein einfaches Hello Word ein wenig zu gewöhnlich und einfach ist, versuchen wir mithilfe der Data Analysis Bibliothek scikit-learn (oder sklearn) eine automatisierte Erkennung von Handschriftlichen Zahlen zu programmieren. 

** Versuche durch die oben gelernten Python Werkzeuge, die fehlenden Passagen zu ergänzen und das Programm zum laufen zu bekommen! Ihr könnt euch die Variablen ausgeben lassen, rumspielen und versuchen die gestellten Probleme zu lösen!** 

### Aufgabe 1
Der erste Programmteil importiert die Bibliotheken und läd den Datensatz mit den handschriftlichen Zahlen in den Speicher. Die Zeile ``images_and_labels = list(zip(digits.images, digits.target))`` schreibt die numerische repräsentation der handschriftlichen Bilder, sowie das zugehörige Label (Die Nummer der dargestellten Zahl) in die Liste images_and_labels. 

Aufgabe: Schreibe eine **For-Loop**, welche die **ersten 6 Elemente aus dem Datensatz images_and_labels** mit deren zugehörigen Labels darstellt. Rufe dazu in der geschriebenen Schleife die Methode **plot_data(index, image, label)** auf. Die Methode benötigt folgende Parameter:

- index: Der Index der aktuellen Iteration
- image: die Bilddaten des aktuellen Elements aus der ersten Dimension der Liste images_and_labels
- label: Die Labeldaten des aktuellen Elements aus der zweiten Dimension der Liste images_and_labels

In [None]:
import matplotlib.pyplot as plt
from sklearn import datasets, svm, metrics

# Lade den Datensatz
digits = datasets.load_digits()

# Erstelle die multidimensionale Liste images_and_labels. 
# Die erste Dimension beinhaltet die numerische Repräsenation des Bildes, 
# die zweite Dimension das zugehörige Label
images_and_labels = list(zip(digits.images, digits.target))

In [None]:
def plot_data(index, image, label):
    plt.subplot(2, 3, index + 1)
    plt.axis('off')
    plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
    plt.title('Training Data: %i' % label)

In [None]:
# Plotte die ersten 6 Zahlen des Datensatzes
""" 
ERGÄNZEN  
"""

In [None]:
plt.show()

### Aufgabe 2
Nachdem wir nun wissen wie der Datensatz aussieht, möchten wir einen Algorithmus lernen, welcher die Zahlen erkennt. Dazu trainieren wir ein Model mit der ersten Hälfte der Daten (images & labels) und validieren unser Model mit der anderen Hälfte. 

Aufgabe: Erstelle die Variablen **img_train, labels_train und img_test**, welche den Datensatz in **zwei gleichgroße Teile trennt** (Benutze hierfür die Variable split_size).

In [None]:
# Anzahl der Samples
n_samples = len(digits.images)
#Umformen der Bilder für den Algorithmus und zuweisung der Daten auf die Variablen images und labels
images = digits.images.reshape((n_samples, -1))
labels = digits.target

In [None]:
#Größe des Subsets train und test. Wir müssen den Wert runden, da es zu Fließkommatar kommen kann,
#was zu einem Fehler beim Slicen führt.
split_size = round((len(images)/2))

#Erstelle img_train, labels_train und img_test welche den Datensatz in zwei gleichgroße Teile trennt
""" 
ERGÄNZEN  
"""

In [None]:
# Erstelle das Model und trainiere es mit 
classifier = svm.SVC(gamma=0.001)
classifier.fit(img_train, labels_train)

# Now predict the value of the digit on the second half:
predicted = classifier.predict(img_test)

images_and_predictions = list(zip(digits.images[round(n_samples / 2):], predicted))
for i, (img, prediction) in enumerate(images_and_labels[:8]):
    plt.subplot(2, 4, i + 1)
    plt.axis('off')
    plt.imshow(img, cmap=plt.cm.gray_r)
    plt.title('Prediction: %i' % prediction)
print('Klassifikation von bisher nicht gesehen Zahlen!!')
plt.show()