# AKGI - Crashkurs in Python

<center>
    <img src="img/xkcd_python.png" width="500">
</center>

## Kommentare und Formatierung 

Zur Verständlichkeit und Wartbarkeit von Software sind Kommentare ein wichtiges Werkzeug. In Python werden Kommentare in einzeilige und mehrzeilige unterschieden.

In [None]:
# single line comment
print ('Hello')

# multi line comment
"""
print ('Hello')
print ('Python')
"""
print ('Python')

Ein wichtes Kernelement zur Lesbarkeit und Strukturierung von Quellcode ist seine Formatierung. Einige Programmiersprachen, beispiesweise Java, verwenden geschweifte Klammern, um die Codeblöcke zu definieren und von einander abzugrenzen. Python rückt rückt stattdessen ein:

In [None]:
for i in [1, 2, 3]:
    print (i)
    for j in [1, 2, 3]:
        print (i + j)
    print ('done inner looping for {0}'.format(i))
print ('done outer looping')


Python-Code ist im Allgemeinen durch diese Eigenschaft sehr gut lesbar. Zu beachten ist jedoch, dass der Interpreter **Leerzeichen zwischen runden und eckigen Klammern ignoriert**. So wird es bespielsweise möglich eine Liste von Listen sehr übersichtlich als Matrix darzustellen.

In [None]:
matrix_hard_to_read = [[1,2,3],[4,5,6],[7,8,9]]

matrix_easy_to_read = [[1,2,3],
                       [4,5,6],
                       [7,8,9]]

print(matrix_hard_to_read == matrix_easy_to_read)

## Module/Packete
Viele Funktionalitäten von Python im Kern nicht mit ausgeliefert und somit auch nicht automatisch geladen. Um diese Module in der jeweiligen Anwendung freizuschalten müssen die entsprechenden Module mit dem Befehl _import_ aktiviert werden.
Eine Möglichkeit ist es das Modul selbst zu importieren:

In [None]:
# import package math
import math

x = 42 * math.cos(2 * math.pi)
print(x)

Hier wird das Modul _math_ hinzugefügt. Dadurch werden Funktionen und Konstanten der Mathematik aktiviert, welche in Python sonst nicht verfügbar sind. In dem Beispiel ist das die  _cos_ Funktion und die Konstante _pi_. Wenn Sie diese Art des Importierens verwenden, muss allen Elementen des Moduls der Präfix _math_ voran gestellt werden, um ihn in dem Programm zu nutzen. 

Dies kann zu einem Konfilkt führen, sofern Sie selber etwas mit dem Namen _math_ definiert haben, daher können Sie auch einen Alias für das importierte Modul verwenden.

In [None]:
import math as myMath

x = 42 * myMath.cos(2 * myMath.pi)
print(x)

Dies kann ebenfalls sehr nützlich sein, sofern Ihr Modul einen langen oder komplizierten Namen hat. Zu einigen Modulen gibt es auch Konventionen, so ist es beispielsweise üblich für das Modul _matplotlib_ den Alias _plt_ als Notation zu verwenden. Als eine dritte Möglichkeit sei der direkte Import von Funktionen oder Konstanten aus Modulen noch erwähnt. Bei dieser Variante ist nicht die Verwendung des Präfixes notwendig. Mit _*_ können Sie auch alle Elemente eines Moduls hinzufügen.

In [None]:
from math import cos, pi

x = 42 * myMath.cos(2 * myMath.pi)
print(x)

Mit _*_ können Sie auch alle Elemente eines Moduls hinzufügen. Doch achten Sie hierbei auf den Namensraum, da Sie sonst eigene definierte Parameter überschreiben oder die Elemente des Moduls überschreiben.

In [None]:
pi = 4
print (pi)

from math import *
print(pi)

pi = "Pangalactic Gargleblaster"
print(pi)

Welche Funktionen ein Modul zur Verfügung stellt kann man über die Dokumentation oder die _help_-Funktion herausbekommen.

In [None]:
help(math)

## Variablen und Zuweisungen

Variablen in Python bestehen aus alphanumerischen Zeichenketten _a-z_, _A-Z_, _0-9_ und einigen speziellen Zeichen, wie beispielsweise *_*. Normalerweise beginnen Variablennanmen in Python mit einem Buchstaben. 

Die Konvention in Python für Variablen ist, dass die Namen mit Minuskeln (Kleinbuchstaben) starten. Hingegen fangen Klassennamen immer mit Majuskeln (Großbuchstaben) an. Zusätzlich gibt es einige Schlüsselwörter, welche in Python nicht verwendet werden dürfen. Dies sind die folgenden:

    and, as, assert, break, class, continue, def, del, elif, else, except, 
    exec, finally, for, from, global, if, import, in, is, lambda, not, or,
    pass, print, raise, return, try, while, with, yield

Zuweisungen werden in Python, wie in anderen Programmiersprachen auch üblich, mit dem Operator *=* durchgeführt. Die Typisierung der so erzeugten Variable geschiet implizit. (implizite Typisierung = Datentyp muss nicht davor geschrieben werden; Gegenteil explizite Typisierung).
Den Typ einer Variable können Sie jedoch durch die Funktion *type()* identifizieren.

In [None]:
final_answer = 42
print (final_answer)
print (type(final_answer))

In [None]:
import math

print (type(math.pi))

## Arithmetik

Die bekannten arithmetischen Operationen funktionieren analog zu vielen anderen Programmiersprachen:

In [None]:
# Addition + 
print("7 + 4 = ", 7 + 4)

# Subtraktion -
print("7 - 4 = ", 7 - 4)

# Multiplikation *
print("7 * 4 = ", 7 * 4)

# Division /
print("7 / 4 = ", 7 / 4)
 
# Division (ganzzahlig) //
print("7 / 4 (ganzzahlig) = ", 7 // 4)

# Modulo %
print("7 / 4 (Rest) = ", 7 % 4)

# Exponentialfunktion **
print("7 ^ 4 = ", 7 ** 4)


## Strings

String lassen sich durch einfache oder doppelte Anführungszeichen in Python deklarieren. Es ist nur wichtig, dass Sie eine Variante bei der Dekleration konsistent verwenden.

In [None]:
single_quoted = 'Zaphod Beeblebrox'
double_quoted = "Marvin"
test1 = "teststring"
test2 = 'teststring'
print(test1==test2)

Zur Verwendung von Sonderzeichen in Strings kann man in Python einen Backslash benutzen, wie: 

In [None]:
single_quoted  = 'The Hitchhiker\'s Guide to the Galaxy'
print(single_quoted)

some_tabs = "Earth\tMoon\tMars"
print (some_tabs)    
print (len(some_tabs))      


Sollten Sie einen Bckslash in einem String selbst benötigen, wie es in einem Dateipfad unter Windows oder in regulären Ausdrücken vorkommen kann, ist es möglich einen _raw_ String zu deklarieren. Dies geht mit einem _r_ vor dem String.

In [None]:
without_tab = r"Earth\tMoon\tMars"
print (without_tab)
print (len(without_tab))

Wie bei den Kommentaren kann man einen String ebenfalls über mehrere Zeilen deklarieren. Zeilenumbrüche, Tabulatoren etc., die Sie in dieser Art formatieren, werden übernommen.

In [None]:
very_long_string = """The Hitchhiker's Guide to the Galaxy (sometimes referred to as HG2G, HHGTTG or H2G2) is 
    a comedy science fiction series created by Douglas Adams. Originally a radio comedy 
        broadcast on BBC Radio 4 in 1978, it was later adapted to other formats, including stage 
            shows, novels, comic books, a 1981 TV series, a 1984 computer game, and 2005 feature 
                film. """

print(very_long_string)

## Funktionen

Eine Funnktion nimmt keine oder beliebige Eingabewerte an und liefert basierend darauf eine entsprechende Ausgabe. In Python werden Funktionen durch das Schlüsselwort _def_ deklariert.

In [None]:
# use 'def' to declare a function and use ':' at the end of the declaration
def myPowerOfTwo(x):
    """Here you can provide information about your function as a docstring
       That function returns the power of two to a given number (x -> x^2).
    """
    return x*x

print (myPowerOfTwo(3)) # call custom power of two with 3

Funktionen in Python sind generell [first-class-Funktion](https://en.wikipedia.org/wiki/First-class_function). Es ist entsprechend erlaubt Funktionen einer Variablen zu zuweisen oder Funktionen als Argument einer anderen Funktion zu übergeben. 

In [None]:
def seven(function):
    """Applies one to a given function"""
    return function(7)

boxed_function = myPowerOfTwo # assign function to a variable
print (seven(boxed_function))  # call boxed_function with seven

Anonyme Klassen lassen sich in Python über das Schlüsselwort _lambda_ definieren. 

In [None]:
print (seven(lambda x: x**3)) # call and print seven with anonym function x**3

Eine weitere, schöne Eigenschaft von Funktionen in Python ist, dass sich Standardwerte für die Argemunte definieren lassen. Diese werden verwendet, wenn keine Argumente oder nur anteilig übergeben werden.

In [None]:
# define default value for your argument
def replyMessage(answer="42 is always a good answer"):
    """returns a given message or a default one"""
    return answer

print (replyMessage("My personal answer!")) # prints your message
print (replyMessage())                      # prints default message
print ("---")

def xToThePowerOfy(base=0,power=0):
    return base**power

print (xToThePowerOfy(3,3)) # returns 3**3
print (xToThePowerOfy(3))   # returns 3**0
print (xToThePowerOfy(power=3)) # returns 0**3 - you can assign a specific argument 
print (xToThePowerOfy()) # returns 0**0

## Exceptions

Sofern es zu einem Fehler beim Interpretieren kommt, generiert Python eine _Exception_. Ist diese nicht behandelt bricht Python das Programm an der Stelle ab. Mit den Schlüsselwörtern _try_ und _except_ können Sie eine eigene Ausnahme generieren. Welche vordefinierten Ausnahmen es gibt, kann der [Dokumentation](https://docs.python.org/3.6/library/exceptions.html) entnommen werden.

In [None]:
try:
    print (3/0)
    print (0/3)
except ZeroDivisionError:
    print ("you cannot divide a number by zero")


## Kontrollfluss
Wie in den meisten Programmiersprachen auch könne Anweisung in Python durch _if_ bedingt ausgeführt werden.

In [None]:
num = 1
# num = "hallo?"
try:
    if num > 0:
        print ("one or more")
    elif num < 0:
        print ("under zero")
    else:
        print ("zero, right?")
except TypeError:
    print("Irgendwas stimmt nicht")

Eine ternäre Anweisung (if-then-else) lässt sich in Python auch in einer Zeile schreiben.

In [None]:
x = 42

print (True if x == 42  else False) # correct answer?
print ("even" if x % 2 == 0 else "odd") # is the number even or odd?

In Python existiert eine _while_-Schleife.

In [None]:
# while loop
x = 0
while x < 10:
    print (x, "is less than 10")
    x += 1

Am weitesten verbreitet ist jedoch die _for_-Schleife, die zusammen mit Objekten verwendet wird, die sich iterieren lassen. Hier die allgemeine Syntax:

    for item in list:
        print (item) # do something with one item of the list

Die Schlüsselwörter _for_ und _in_ sind notwendig. _list_ kann eine Variable oder Objekt sein, welches sich wie eine Liste iterieren lässt. _item_ ist der Name, welcher innerhalb der Schleife das aktuelle Objekt aus _list_ referenziert. Jede Iteration passt sich _item_ dem nächsten Element aus _list_ an.

Hier ein paar Beispiele:

In [None]:
# for loop with list of numbers 
for x in [1,2,3]:
    print(x)
    
# for loop with list of strings     
sentence = ""
for word in ["Medical", "data", "science", "with", "python"]:
    sentence += word + " "
print (sentence)

Mit den Schlüsselworten _continue_ und _break_ kann man Einfluß auf den Schleifendurchlauf nehmen. _continue_ ermöglichte es die Iteration zu beenden und _break_ beendet die gesamte Schleife.

In [None]:
for x in [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]:
    if x % 2 == 0:
        continue # jump over even numbers
    if x == 7: 
        break    # break out of loop at 7
    print(x)

## Listen
- Eine wichtigesten Datenstrukturen in Python sind Listen _list_. Ähnlich einem Arrays in anderen Programmiersprachen, aber sie bieten mehr Funktionalität. Erläutern Sie _list_
- Geben Sie ein Beispiel für das Erzeugen einer Liste von einem Datentyp, unterschiedlichen Datentypen und einer Liste von Listen. Zeigen Sie wie die Länge einer Liste berechnet werden kann.
- Erläutern Sie das Zugreifen auf Listen über einen Index. Berücksichtigen Sie dabei Index 0 und negative Indizes.
- Geben Sie dazu Beispiele
- Erläutern Sie _slicing_ (:) in Kontext von Listen
- Geben Sie dazu Beispiele.
- Erläutern Sie den Operator _in_
- Geben Sie ein Beispiel
- Erläutern Sie die Funktionen (_extend, append, insert, remove_) auf Listen und stellen Sie dar, wie man durch _+_ Listen verbinden kann. Wie unterscheidet sich dies zu _extend_?
- Geben Sie Beispiele
- Listen kann man bequem in einzelne Variablen aufteilen: x,y = [1, 2]. Erläuterns Sie dies und geben Sie ein Beipiel. Was passiert, wenn die Elemente unterschieldlichen Länge haben? Wofür kann man eine Wildcard \_ in diesem Zusammenhang verwenden?
- Denken Sie sich eine kleine Übung aus.

List Erläuterung

### Erzeugen von Listen, Länge
- 6 Typen von Sequenzen in Python -> Listen, Tupel am häufigsten
- sind veränderbar!
- Werte durch Kommata getrennt in eckigen Klammern
- len() gibt die Länge der Liste zurück

In [None]:
schrott_l1 = ["h","a","l","l","ü"]
schrott_l2 = [1,3,3,7,7,3,3,1]
list_list = [[],[0,0,0],[1,2,3],["a","b","c"],[5,4,"f"]] # 5 Elemente: leere Liste, Nullenliste, Zahlenliste, Buchstabenliste, beides

print(schrott_l1)
print(schrott_l2)
print(list_list)
print("Länge Liste 2: ", len(schrott_l2))
print("Länge Listeliste: ", len(list_list)) 

### Listenindex
- Index beginnt bei 0 (wie Arrays in Java)
- Zugriff über Listenname + eckigen Klammern mit dem Index darin
- Elemente werden also angesprochen von 0 bis Länge -1 
- rückwarts gehts auch: dann negativer Index
- [-1] ist also das erste Element von rechts usw...

In [None]:
try:
    print(schrott_l1[0])
    print(schrott_l1[1])
    print(schrott_l1[2])
    print(schrott_l2[8]) # Fehler! Schrott2 hat 8 Elemente, also Index 0 bis 7
except IndexError:
    print("Index falsch!")

try: # negative Indices gehen auch
    print(schrott_l1[-1]) 
    print(schrott_l1[-2])
    print(schrott_l1[-3])
    print(schrott_l1[-4])
    print(schrott_l1[-5])
    print(schrott_l1[-6]) # Fehler! Schrott1 hat 5 Elemente, also Negativ-Index -1 bis -5
except IndexError:
    print("Negativ-Index falsch!")

### Listen slicing
- zum Zerteilen von Listen 
- Syntax 
        [start:ende:skip]

In [None]:
werte = [0,1,2,3,4,5,6,7,8,9,10]

print(werte[3:]) # 3. Index bis zum Ende
print(werte[:3]) # Anfang bis zum 3. Index (3. Index selber nicht mit drin)
print(werte[3:7]) # 3. Index bis 7. Index (7. Index selber nicht mit drin)
print(werte[::3]) # Anfang bis Ende, immer 3 Indices weiterspringen
print(werte[3:-1]) # 3. Index bis 1 Indices vor dem Ende (vorletztes Element also)
print(werte[3:-2:2]) # 3. Index bis 2 Indices vor dem Ende (vor-vorletztes Element also), immer 2 Indices weiterspringen

### Operator in
- gibt True zurück, wenn ein Wert in einer Liste vorhanden ist, ansonsten False
- Gegenteil ist not in

In [None]:
print(11 in werte) # nein
print(5 in werte) # ja
print(11 not in werte) # ja

### Funktionen für Listen
- extend() erweitert eine Liste um eine Sequenz -> Liste wird verändert
- append() erweitert die Liste um ein Element -> Liste wird verändert
- remove() entfernt ein Element aus der Liste -> Liste wird verändert
- insert() fügt ein Element in die Liste an einem bestimmten Index ein -> Liste wird verändert
- alle Funktionen haben keine Rückgabe

In [None]:
aList = [1,2,3,4,"a","b","c"]
bList = ["d", "e","f"]
cList = [9,8,7,"g","h"]
dList = [5,6,"i"]

print(aList)
aList.extend(dList)
print(aList) # aList ist verändert

bList.append("z")
print(bList)
try:
    bList.remove("z")
    print(bList)
    bList.remove("y")
    print(bList)
except ValueError:
    print("Ich kann nicht etwas entfernen, was nicht da ist!")

cList.insert(0,10) # 10 vorne ranhängen
cList.insert(0,11) # 11 vorne ranhängen
print(cList)


### Unterschied "+" und "extend"
- "extend" verändert die Liste
- "+" konkateniert Listen, d.h. es ensteht eine neue Liste, die alten Listen werden nicht verändert

In [None]:
dList.extend(cList)
dList.extend(bList)
print(dList) # dList ist verändert

neu = cList + bList
print(neu)
print("c: ", cList, "; b: ", bList) # c und b List sind gleich geblieben

### Listen aufteilen + Wildcards
- man kann Listen "auspacken" und Variablen zuordnen
- Liste mit 3 Elementen auf 3 Variablen aufteilen
- Liste bleibt aber unberührt
- \_ kann als Wildcard benutzt werden, falls ein Wert nicht gebraucht wird
- für mehrere unbenutzte Werte geht auch \*

In [None]:
listr1 = [1,2,3]
listr2 = [1,2,3,4,5]

a,b,c = listr1
print("a =",a, ",b =",b, ",c =",c)
print(listr1)
try:
    d,e,f = listr2 # geht nicht
    g,h,i,j,k,l = listr2 # geht auch nicht
except ValueError:
    print("Zu viele oder zu wenige zum Auspacken!")
    
d,e,f,_,_ = listr2 # das geht, wir ignorieren einfach die letzten beiden
print("d =",d, ",e =",e, ",f =",f)

_,x,*muell = listr2 # geht auch, erster ignoriert, 2. wird in x gepackt, die anderen kommen in die Liste muell
print(x)
print(muell) # Rest

## Tupel
- Tupel _(x,y)_ sind ähnlich zu Listen mit zwei Elementen, können jedoch nicht verändert werden. 
- Erläutern Sie die zwei Möglichkeiten ein Tupel deklarieren. Geben Sie diese als Beipiele.
- Erläutern Sie einige Funktionen die sowohl auf Listen als auch auf Tupeln funktionieren.
- Geben Sie dafür Beispiele.
- Erläutern Sie Tupel als Rückgabewert von Funktionen. So können zwei Rückgabewerte bequem über eine Funktion erfolgen.
- Geben Sie ein Beispiel.
- Durch Tupel kann man multiple Zuweisungen realisieren x,y = 1,2 und es wird möglich Variablen Inhalte bequem zu tauschen. Erläutern Sie dies und geben Sie Beipiele.
- Denken Sie sich eine kleine Übung aus.
- Erläutern Sie die Funktion _zip_ um aus zwei Listen eine Liste von Tupel zu machen. Was passiert beispielsweise, wenn die Listen unterschiedlicher Länge sind? Geben Sie ein paar Beispiele.
- Mit dem _*_ Operator kann man dieses Packen wieder umkehren. Geben Sie ein Beispiel.

### Erzeugen von Tupel
- 6 Typen von Sequenzen in Python -> Listen, Tupel am häufigsten
- sind nicht veränderbar!
- Werte durch Kommata getrennt in normalen Klammern
- Indices wie bei Listen
- können ebenfalls zerteilt und zusammengefügt werden

In [None]:
tup1 = ('schrott', 'mehr schrott', 1337, 7331);
tup2 = (1, 2, 3, 4, 5 );
tup3 = "a", "b", "c", "d";
tupleer = ()
tuplesingle = (23,) # Tupel mit nur einem Wert braucht trotzdem ein Komma!

print(tup1[0]) # Indexen wie bei Listen
print(tup1[-1])
print(tup2[2:4]) # Slicen wie bei Listen
try:
    tup1[3] = "neu" # das geht nicht
except TypeError:
    print("Schade schade schokolade")

print(tup2+tup3) # geht auch wie bei Listen
print(len(tuplesingle)) # geht auch
print("c" in tup3) # geht auch


In [None]:
def functest(x):
    return (x ** 2, x ** 3, x ** 4) # tupel zurückgeben

values = functest(4) # entweder das tupel ausdrucken
print(values)

v1, v2, v3 = functest(4) # oder die werte in variablen auspacken, wie bei listen
print(v1, v2, v3)

a = 5
b = 9
print(a,b)
(b,a) =(a,b) # damit kann man easy Variablen vertauschen; a wird ausgepackt und in b reingesteckt, b in a reingesteckt
print(a,b)

In [None]:
a = [1,2,3,4,5]
b = [9,8,7,6,5]
tup_neu = zip(a,b) # eine Liste mit 5 2er Tupel
print(tup_neu)

c,d = zip(*tup_neu) # wieder ausgepackt in die Liste
print(c,d)

## Dictionaries
- Erläutern Sie die Datenstruktur Dictonary _{}_, das Schlüssel (keys) eindeutig Werten (values) zuordnet. Was sind beispielhafte Anwendungszwecke von Dictonaries. 
- Geben Sie ein Beispiel zum Erstellen eines Dictonaries
- Erläutern Sie wie man auf einen Wert im Dictonary zugreift. Was passiert, wenn ein Schlüssel nicht vorhaden ist? Gibt es eine Möglichkeit die Existenz eines Schlüssel zu prüfen? Was macht die Funktion _get_?
- Gebene Sie Beispiele hierzu.
- Erläutern Sie wie man einem Dictonary einen Key-Value-Paar hinzufügt und einem Schlüssel einen neuen Wert zuweist.
- Geben Sie ein Beipiel.
- Wie bekommt man eine Liste von Schlüsseln, Werten oder Key-Value-Paaren zurück? 
- Geben Sie Beispiel.
- Übung: Aus einem Textdokument sollen alle Wörter als Schlüssel übernommen werden. Für jedes Vorkommen des Wortes im Text wird der Wert des Schlüssels um 1 erhöht. Implementieren Sie diese Lösung.

### Dictionary Anwendungen
- wie eine Map
- besteht aus Schlüssel-Werte-Paaren, getrennt durch Kommata, in geschweiften Klammern
- Doppelpunkt zwischen Schlüssel und Wert
- Schlüssel müssen einzigartig sein, dürfen nicht veränderbar sein (Tupel oder Strings z.b.)
- Zugriff geht über eckige Klammern um Schlüsselname
- nicht vorhandene Schlüssel schmeißen KeyError

- Schlüsselexistenz kann man mit in Operator prüfen

- get() gibt für einen Schlüssel den Wert zurück, oder einen default-Wert, wenn der Schlüssel nicht existiert

In [None]:
ndict = {'Name': 'Hoi', 'Alter': '20', 'Wohnort': 'Hier', 'lirum': 'larum'}
print(ndict)
print("Wohnort:", ndict['Wohnort'])

try:
    print(ndict['Beruf']) # das geht so nicht
except KeyError:
    print("Probieren Sie's nochmal!")
    
if 'Beruf' in ndict: # so ist's besser
    print(ndict['Beruf'])
print("gibbet nich")


print(ndict.get('Name'))
print(ndict.get('Beruf')) # das geht ohne Probleme, wir haben ja einen default

### Dictionary updaten + Liste von Schlüsseln, Werten etc
- für neues Paar einfach den neuen Schlüsselwert in eckigen Klammern schreiben und den neuen Wert zuweisen
- fürs updaten genauso
- keys() gibt eine Liste aller Schlüssel zurück
- ebenso gibt es values() für eine Werte-Liste
- und items() für eine Liste aller Tupel

In [None]:
ndict['neuer key'] = 'neuer wert' #unkompliziert
ndict['Name'] = 'Löffelstiel' # auch
print(ndict) # tada

print(ndict.keys()) # selbsterklärend
print(ndict.values())
print(ndict.items()) # Liste von Tupeln

In [None]:
# implement your own word count
wordcount = {} # dict to count words

with open('hhgttg.txt') as file:  # opens you the txt file and will close it after
    for word in file.read().split(): 
        
        if word not in wordcount: # wenn word nicht im Dictionary ist, 
            wordcount[word] = 0 # füge word hinzu (und setze seinen Count auf 0)
        
        # hier muss word in wordcount existieren, also...
        wordcount[word] += 1 # ...erhoehe Count für word um 1
        
    print (wordcount) # ausdrücken

### defaultdict

- Erläutern Sie ein _defaultdict_ aus dem Modul _collections_.  
- Geben sie ein Beispiel.

- erweitert dict
- damit wird es möglich, Keys abzufragen, die noch nicht im dict sind
- anstelle eines KeyErrors wird einfach ein neuer Wert angelegt
- Typ davon kann man als Argument angeben, z.b int

In [None]:
# aus der python docu
from collections import defaultdict # erstmal ranholen

s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] # eine Liste von Tupeln

d = defaultdict(list) # Werte für nicht vorhandene Schlüssel werden mit list() erzeugt, also leere Listen

for k, v in s: # auspacken in Schlüssel und Wert
    d[k].append(v) 
    
print(d.items())

### counter
- Ein _counter_ aus _Collections_ wandelt ein Abfolge von Werten in ein _defaultdict(int)_-ähnlichhes Objekt um. Erläutern Sie was die Funktionalität ist.
- Geben sie ein Beispiel.
- Wie sieht eine Lösung zum Zählen der Wörter mit _counter_ aus? Geben Sie mittels _most\_common_ die häufigsten Elemente an.

In [None]:
# aus der python docu
from collections import Counter # auch eine Art von dict, optimiert für schnelles Zählen von z.b. Worten

cnt = Counter()
for word in ['schrott', 'schrott', 'red', 'blue', 'schrott', 'red', 'green', 'blue', 'blue', 'schrott']:
    cnt[word] += 1
    
print(cnt)

knut = Counter()

with open('hhgttg.txt') as file:  # opens you the txt file and will close it after
    for word in file.read().split():
        knut[word] += 1
        
print(knut.most_common(10)) # die 10 häufigsten Elemente



## Sets
- Erläutern Sie die Datenstruktur set, die Mengen repräsentieren. Was passiert wennn ein Element wiederholt in eine Menge aufgenommen wird?
- Geben Sie ein Beispiel.
- Mit _in_ kann auch auf Sets prüfen, ob ein Element enthalten ist. Es funktioniert schneller als auf Listen, da sich Listen in sets umwandeln lassen, sollte man dies tun bevor man auf Elemente prüft. Geben Sie hierzu ein Beispiel.
- Ein weiterer Vorteil dieser cast-Operation ist es, dass schnell eine Liste von Duplikaten bereinigt werden kann. Geben Sie auch hierzu ein Beispiel.

- sind praktisch Listen ohne Doppelte
- Elemente werden nicht doppelt aufgenommen
- Liste in set umwandeln und das dann wieder als Liste entfernt schnell und einfach alle doppelten
- sets lassen sich schneller durchsuchen, da in einer Hashtabelle gesucht wird, d.h. O(1) anstelle von O(n)

In [None]:
setx = set("Hallo das ist ein Löffelstiel mit Lirum und Larum")
print(setx) # jeder Buchstabe nur einmal

sety = set("jjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj")
print(sety)

setlist = set(["das", "ist", "eine", "liste"]) # Liste umwandeln
print(setlist)

print(True if "das" in setlist else False)

listee = [1,4,3,2,1,1,2,3,4,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,4,5,6,7,8,6,5,4,4,3,2,1]

print(list(set(listee))) # weg mit den Doppelten


## Aussagenlogik
Boolsche Werte funktionieren in Python wie in anderen Sprachen. Es wird zwischen _True_ und _False_ unterschieden. Boolsche Operatoren and, or, not werden in Python ausgeschrieben, Vergleichsoperatoren nicht.

In [None]:
# boolean operators
print (True and True) 
print (True or False)
print (not False)

In [None]:
# comparison operators
print (1 > 0)  # x greater as y x > y
print (1 < 0)  # x smaller as y, x < y
print (1 > 1, 1 < 1) # both false
print (1 >= 0) # x greater or equal to y, x => y
print (1 <= 0) # x smaller or equal to y, x =< y

print ("---")

x = [1,0]
y = z= [1,0]
print (x == y) # tests of equality 
print (y == z) 
print (x is y) # tests if objects are identical?
print (y is z)  

In diesem Zusammenhang sind die Schlüsselwörter _all_ und _any_ in Python sehr interessant. Beide Funktionen nehmen eine Liste als Argument an. Sofern kein Element in der Liste den Wert False besitzten gibt _all_ den Wert True zurück. Hingegen reicht es bei _any_ aus, dass ein Element der Liste den Wert True besitzt, um ein True zurückzugeben.

In [None]:
print (all([True, 3, not False, 2 > 0, {2}]))
print (all([True, 3, not False, 2 > 0, {}]))
print (any([True, 3, not False, 2 > 0, {2}]))
print (all([])) # no element is False -> True
print (any([])) # no element is True, cause there are no elements -> False

## Sortieren von Listen

Eine weitere Funktion, welche jede Liste in Python besitzt, ist _sort_. Durch diese Funktion kann man eine Liste sortieren. Jedoch wird die Liste durch die Anwendung von _sort_ wirklich verändert. Eine weitere Möglichkeit eine Liste zu sortieren und dabei nicht ändern bietet _sorted_. Hier ein Beispiel:

In [None]:
abc = ["d", "b","a","g","h","z","x"]
print (sorted(abc)) # sorts the list without touching the object
print (abc)
print ("---")
abc.sort()  # runs a sort funtion on the object
print (abc)

Beide Funktionen _sort_ und _sorted_ sortieren eine Liste aufsteigend vom kleinsten zum größten Element, indem sie die Elemente miteinander vergleichen.

Möchte man diese standardmäßige Reihenfolge ändern, so kann man durch setzten des Parameters _reverse=True_ eine aufsteigende Liste erzeugen. Zusätzlich können durch den Parameter _key_ nicht die Elemente selbst mit einander verglichen werden, sondern die Ergebnisse einer spezifizierten Funktion.

In [None]:
# print a list in descending order of their absolute values
print(sorted([1,-2,-5,7,-11], key = abs, reverse=True))

## Generator und List Comprehensions

Ein Generator erzeugt ein Objekt, welches sich gut iterieren lässt. Eine tolle Eigenschaft von _range()_ in Python 3.x ist es, dass die Werte erst produziert werden, wenn diese gebraucht werden (lazy). Mit _range()_ haben wir also ein flexibles Werkzeug zum Erzeugen eines passenden Iterators.

In [None]:
# Iterate from 0 to 9, range starts at index 0
for x in range(10):
    print (x)
print ("---")
    
# you can customize the iterator with range(start,stop,step) 
for x in range(10,20,2):
    print (x)
print ("---")

# range is like a list and you can cast it to one
print(range(10,20,2))
print(list(range(10,20,2)))

List Comprehension ist in Python relativ häufig. Hierbei wandeln wir eine Liste in eine andere Liste um, indem man nur bestimmte Elemente auswählt, Elemente gezielt umwandelt oder beides.

In [None]:
even_only = ([x for x in range(10) if x % 2 == 0]) # iterate over all number between 0 and 9 that are even
squares = [x * x for x in range(10)]               # iterate over 0-9 and square the number
even_squares = [x * x for x in even_only]          # iterate over even numbers between 0-9 and square them
print (even_only)
print (squares)
print (even_squares)

zeros = [0 for _ in even_only] # you can use a wildcard if you do not need a variable of the iteration item
print (zeros)

# You can use multiple for loop for list compresension
permutation = [(x,y) 
               for x in range(3) 
               for y in range(3)]
print (permutation)

# You can use the parameter from one loop in another one
odd_permutation = [(x,y) 
               for x in range(5) 
               for y in range(x+1,5)]
print (odd_permutation)

Neben dem Erzeugen von Listen können wir auf diese Weise auch Dictionaries oder Sets generieren.

In [None]:
square_dict = { x : x * x for x in range(5)}
square_set = { x * x for x in [-2,-1,0,1,2]}
print(square_dict)
print(square_set)

## Zufall
- Im Bereich des Machine Learning ist es häufig notwendig Zufallszahlen zu generieren. Schauen Sie sich das Modul _random_ an und erläutern Sie es mit den wichtigsten Funktionen.
- Erklären Sie die Funktion _random()_
- Geben Sie ein Beispiel wie man eine Zufallszahl erzeugt oder eine Liste von Zufallszahlen. Verwenden Sie dazu _range()_.
- Erläutern Sie _seed()_ und geben ein Beispiel.
- Was macht die Funktion _randrange()_? Erläutern Sie und geben ein Beispiel.
- Erklären Sie die Funktionen _shuffle(), choice() und sample()_. Unterlegen Sie die Erläuterungen mit Beispielen.

### random() 

- gibt einen Zufallswert vom Typ float zurück, für den gilt 0<= Wert < 1
- kann nicht direkt benutzt werden, es muss erst das modul random importiert und ein statisches random-Objekt erzeugt werden


In [None]:
import random as rand

print ("Zufallswert: ", rand.random())

### range() 

In [None]:
zufallsliste = [rand.random() for _ in range(10)]

print(zufallsliste)

### seed()
- Startwert für den Algorithmus, der "zufällig" eine Zahl errechnet
- bei gleichem Seed kommt immer die gleiche "Zufallszahl" heraus
- muss vor allen anderen random() Aufrufen stehen

In [None]:
print ("Zufallswert: ", rand.random()) # irgendwas

rand.seed(10)
print ("Zufallswert: ", rand.random()) # irgendwas mit seed 10

print ("Zufallswert: ", rand.random()) # irgendwas neues

rand.seed(10)
print ("Zufallswert: ", rand.random()) # das gleiche wie "irgendwas mit seed 10"

### randrange()
- gibt zufällig einen Wert aus range(start, stop, step) zurück

In [None]:
print("Irgendwas Gerades zwischen 0 und 100: ", rand.randrange(0,100,2))

print("Irgendwas zwischen 0 und 10: ", rand.randrange(10))

### shuffle, choice, sample
- shuffle() würfelt die Elemente einer Liste "in place" durcheinander, d.h. die Liste wird verändert
- choice() wählt zufällig einen Wert aus einer Sequenz aus (Liste, Tupel, etc...)
- sample() wählt aus einer Liste zufällig eine spezifizierte Anzahl von Elemente in einer neuen Liste zurück

In [None]:
list_zufall = [1,2,3,4,5]
string = "hallo das ist ein test"

rand.shuffle(list_zufall)
print("Shuffel1: ", list_zufall)

rand.shuffle(list_zufall)
print("Shuffel2: ", list_zufall)

print("Choice1: ", rand.choice(list_zufall))
print("Choice2: ", rand.choice(list_zufall))

print("Sample1: ", rand.sample(list_zufall, 2))
print("Sample2: ", rand.sample(string, 10))

## Objektorientierte Programmierung

In Python können wir auch Klassen definieren, die Daten und Funtkionen zu deren Bearbeitung kapseln. Dies wird uns helfen komplexeren Code besser zu strukturieren und diesen so lesbar halten. Hier wird der Aufbau einer Klasse anhand eines Beispiels kurz skizziert.

In [None]:
# Classnames are written in CamelCase
class FibGenerator:
    '''
    Please add a comment about your class at the beginning
    Iterator that yields numbers in the Fibonacci sequence
    '''
    # now you can declare the methods
    # by convention the first parameter is always self
    def __init__(self, max):
        # __init__ is the constructor of the class and gets called with a new instance
        self.max = max

    def __iter__(self):
        # An iterable object is an object that implements __iter__. __iter__ is expected to return an iterator object. 
        self.a = 0
        self.b = 1
        return self

    def __next__(self):
        # An iterable Object needs to implement a __next__ function
        fib = self.a
        if fib > self.max:
            raise StopIteration
        self.a, self.b = self.b, self.a + self.b
        return fib
    
myGen = FibGenerator(25)
print(list(myGen))

## Crash into Python - done

Sollten Sie hier angekommen sein, besuchen Sie die [CodeAcademy](https://www.codecademy.com/learn/python) und testen Sie ihr neu erworbenes Wissen bzw. vertiefen es. 