## Anaconda

In Anaconda findet sich eine **Sammlung von Programmen und Bibliotheken** für das Arbeiten mit Datensätzen (Data Science), sei das in Python, der statistischen Programmiersprache R oder anderen.

+ **NumPy, Pandas, matplotlib, SciPy** und viele andere Bibliotheken befinden sich in Anacondas Standard-Umgebung.


+ Die IPython **QT Console** eignet sich für Tests kleiner Code-Fragmente.


+ **Jupyter Notebooks** eignen sich hervorragend für  kleinere Projekte und das Arbeiten mit Datensätzen.


+ Mit **Spyder** steht auch eine Matlab-ähnliche Programmierumgebung für größere Projekte zur Verfügung.


+ Wer einfach ```python``` und einen Editor gemeinsam verwenden will, ist mit **Visual Studio Code** gut beraten.

# Python 101
### Angewandte Systemwissenschaften II 
#### Python - Wonderland
Einheit 1 / 10

# Semesterplan
---
0. Anaconda und Pip
1. **Einführung in Python (Wiederholung der Comp. Basics VO Inhalte)**
2. Matplotlib: Eine Einführung ins Wonderland - Modell
3. Jupyter-Notebooks: Wonderland in Python
4. Funktionale Programmierung & Python-Module
5. Python-Pakete und Workflow
6. Agenten-basierte Modellierung
7. Objekt-orientierte Programmierung 
8. Animationen zur Modellentwicklung
9. Multiprocessing & Sensitivity Analysis
10. Projektpräsentationen

## Inhalt
+ Programmiergrundlagen
+ Python-Einleitung
+ Typen
+ Kollektionen
+ Funktionen
+ If-Abfragen
+ Rekursion
+ Schleifen
+ Comprehensions

## Warum brauchen wir Programmiersprachen?

+ Computer 'verstehen' nur binären Code, also 0-er & 1-er \
  Der Befehlscode ```1 0 0 0 0 s s s``` sagt zB dem Intel 8008 Prozessor, \
  dass er die binäre Zahl ```s s s``` zum Wert in seinem Register addieren soll.
  

+ Ein **Assembler** kann uns für diese Computersprache ein anderes Vokabular geben: \
  ```ADD s``` wird vom Intel 8008 Assembler zu ```1 0 0 0 0 s s s``` übersetzt. \
  ```ADD 3``` wird also zu ```1 0 0 0 0 0 1 1``` und addiert 3 zum Wert im Register. 

+ Ein **Compiler** kann von einer Sprache wie zB C oder C++ in die binäre Sprache übersetzen. \
  Man nennt diesen Vorgang **kompilieren**. \
  Der Compiler tausch also nicht nur einfach die Vokabeln aus, sondern übersetzt auch \
  grammatikalische Unterschiede. Die sogenannte Syntax. \
  \
  Das Ergebnis ist dann eine **Binärdatei**. Auf Windows ist eine ausführbare Binärdatei zB ```Internet Explorer.exe```

+ Ein **Interpreter** übersetzt nicht mehr ein ganzes Programm, sondern interpretiert Zeile für Zeile. \
  Dies abstrahiert noch etwas mehr vom eigentlichen, binären Computercode. \
  **Python** wird oft als interpretierte Sprache bezeichnet. Das Program ```python``` ist der zugehörige Interpreter.

## Python-Einleitung

Den Python-Interpreter startet man mit dem Konsolenbefehl ```python```. \
Um Anaconda's Python zu benutzen, öffnet man die Anaconda-Shell:

+ Windows: ```[Win]```-Taste drücken und dann "Anaconda" eingeben und die "Anaconda Powershell" auswählen.

+ macOS: In der Spotlight-Suche (Tastaturbefehl: ```[CMD] + [Leer]```) "Terminal" eingeben und auswählen.

+ Linux: Den Terminal öffnen.

Die Kommandozeile sollte nun mit ```(base)``` beginnen.

<div class="alert alert-block alert-info">
<h3>Tipp: Anaconda initialisieren</h3>
<p>
    Du möchtest die <code>conda</code>-Befehle auch in der normalen Powershell oder einer anderen Shell benutzen können? <br>
    <code>conda activate</code> funktioniert nicht, weil Anaconda nicht initialisiert ist? <br>
    <br>
    Mit <code>conda init</code> kannst du die Anaconda initialisieren. Für die Powershell lautet der Befehl dann zB <code>conda init powershell</code>.
    </p>
    <p>
    <b>Achtung:</b> Oft benötigt dieser Befehl Administratorrechte!
    </p>
</div>

Python kann man benutzen wie einen **Taschenrechner**,
einfach mir einfachen Grundrechenarten ausprobieren:

In [1]:
1+6

7

**Kommentare** werden vom Python Interpreter einfach ignoriert. Sie beginnen mit einem ```#```:

In [0]:
# Kommentare beginnen mit einer Raute (Hashtag): #
'''
Blockkommentare können in einem String welcher 
mit drei ' umfasst wird geschrieben werden
'''

*Übrigens:* Ein **String** ist in Python eine **Kollektion** von Buchstaben-Strings:

In [0]:
'abc'[0] # erstes Element von 'abc' -> Index ist 0 ; Ergebnis: 'a'

'a'

## Typen
Daten welche man in Python eingibt, werden vom Interpreter im Speicher abgelegt. \
Vorerst ist wichtig, dass sie dabei einen **Typ zugewiesen** bekommen.

Dieser Typ lässt sich mit der **Funktion** ```type``` abrufen. \
Den Typ ```str``` für Buchstaben (Strings) kennen wir nun schon:

In [0]:
type('abc'), type( "Python" ) # Strings werden von ' oder " Zeichen umfasst

(str, str)

**Ganzzahlen** bekommen den Typ ```int``` (Englisch: Ganzzahl = Integer) zugewiesen, \
**Gleitkommazahlen** werden als ```float``` (Englisch: Floating Point) abgelegt.

In [0]:
type( 10 )==int, type( 1.0 )

(True, float)

Für Werte die entweder **Wahr** (```True```) oder **Falsch** (```False```) sein können, benutzen wir ```bool```s (aus der *Bool'schen Algebra*):

In [0]:
type( True )

bool

## Operatoren
Operatoren sind Zeichen, die zwischen zwei Werte gesetzt eine Funktion ausführen.
+ Vergleichsoperatoren
+ Mathematische Operatoren
+ Binäre Operatoren

Das ```==``` dient als Vergleich zweier Bool'scher Werte, oder auch für Ganzzahlen. \
Es gibt auch ```>=```, ```<=```, ```!=```, ```<``` und ```>```

Alle folgenden Beispiele ergeben ```True```:

In [0]:
1 != 2    ,    1 > 0    ,    True == 1    , \
\
0 != True    ,    1 > False    ,    -2 < False    , \
\
True and True    ,   False or True

Alle folgenden Beispiele ergeben ```False```:

In [0]:
# Alle folgenden Beispiele ergeben False!
not True
False and True
False or False

Einfach ausprobieren:

In [0]:
1 > False

<div class="alert alert-block alert-info">
<h3>Tipp: Vergleich von 'float's</h3>
    
Die Darstellung von Zahlen des Typs ```float``` ist sehr genau. \
Oft will man aber, dass ```17.00000 == 17.00001``` trotzdem ```True``` ergibt. \
Deshalb prüft man bei ```float```s besser: ```a > b-i and a < b+i``` wobei ```i``` das Toleranzintervall darstellt.
</div>

**Ganzzahlen und Gleitkommazahlen** lassen sich  **in mathematischen Operationen mischen**,\
das Ergebnis ist dann (fast) immer ein ```float```.

Folgende Beispiele funktionieren so:

In [0]:
1 + 2.0 # float
2.0 * 3 # float
1 / 3 # float -> auch eine Operation auf zwei Ganzzahlen kann eine float ergeben
1 // 3 # int -> "floor divide" runded auf die nächste Ganzzahl ab
6 // 5.0 # float -> rundet trotzdem weiter ab
6%5 # int -> Gibt den Rest der Division 6/5, also 1 

1

Einfach ausprobieren:

In [0]:
1 + 2.0

Mit der Funktion ```print``` kann man sich Werte ausgeben lassen:

In [0]:
print(False > -1)

# Das letzte Element einer Zelle wird immer automatisch ausgegeben
"Ende der Mini-Einleitung"

True


'Ende der Mini-Einleitung'

<div class="alert alert-block alert-info">
<h3>Tipp: Nützliche Funktionen um Python besser kennen zu lernen und zu verstehen</h3>
    
Mit der Funktion ```dir``` lassen sich alle Methoden welche man auf einem Objekt aufrufen kann anzeigen:
</div>

In [0]:
print(dir(list()))

<div class="alert alert-block alert-info">
    <h3>Tipp: Nützliche Funktionen der <b>QT Console</b>, von <b>Jupyter</b> und anderen IPython-Anwendungen</h3>
    
Alternativ kann man den Cursor auch einfach hinter ```list().``` oder eine Liste setzen und \
dann die ```Tabulator``` - Taste drücken!

Drückt man die ```Shift``` - und die ```Tabulator``` - Taste gleichzeitig, wird einem auch ein kleines Hilfsfenster angezeigt. \
Dieses ist angepasst daran, wo man sich gerade mit dem Cursor befindet. Probier es aus!
</div>

<div class="alert alert-block alert-info">
    <h3>Tipp: Mit 'dis' den Interpreter erkunden</h3>
    
Die Funktion ```dis``` zeigt euch, was im Hintergrund in einer Python-Funktion passiert. \
Um eine Funktion zu erzeugen kann man einfach ```lambda : ``` vor alles schreiben,
was man zerlegt angezeigt haben will:
</div>

In [0]:
from dis import dis
print( dis(lambda : print('Hallo')) )
print( "" )  # Leerzeile
print( dis(lambda : 1+3) )

#eval("abs")

## Abfalldaten importieren

Mit der Software - Bibliothek ```pandas``` können wir Datensätze importieren, durchsuchen und bearbeiten. \
Wir importieren die Abfalldaten der Steiermark für das Jahr 2016 aus einer ```.csv``` - Datei (**C**omma **S**eparated **V**alues) um damit in Folge **Python zu üben**.

In [0]:
import pandas as pd

data = pd.read_csv("OGD_Abfalldaten_Stmk_2016_auf_Gemeindeebene.csv",encoding='ansi',sep=';'
                  ,thousands='.',decimal=',')
data

Unnamed: 0,Jahr,VKZ,Abfallwirtschaftsverband,GKZ_2015,Gemeindename,EW_Gde,HFR,Abfallgruppen,FNr,Abfallfraktion,Masse in kg,kg/EW
0,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,3.0,Restmüll inkl. Sperrmüll,1.0,Gemischte Siedlungsabfälle (Restmüll),50927769.0,181.72
1,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,3.0,Restmüll inkl. Sperrmüll,2.0,Sperrige Siedlungsabfälle (Sperrmüll),8830870.0,31.51
2,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,4.0,Bioabfall - Biogene Siedlungsabfälle,4.0,Bioabfall getrennt erfasst (Biotonne),21996780.0,78.49
3,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,4.0,Bioabfall - Biogene Siedlungsabfälle,27.0,kommunale Garten- und Parkabfälle,6208450.0,22.15
4,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,5.0,Straßenkehricht,6.0,Straßenkehricht,626730.0,2.24
...,...,...,...,...,...,...,...,...,...,...,...,...
7336,,,,,,,,,,,,
7337,,,,,,,,,,,,
7338,,,,,,,,,,,,
7339,,,,,,,,,,,,


Betrachtet man sich die **unteren Zeilen** in ```data``` fällt einem auf, dass hier alle Werte nur ```NaN``` lauten.
Dieses ```NaN``` steht für **Not a Number** und bedeutet nichts anderes, als dass keine Werte vorhanden sind. 

Um solche **Leerzeilen** aus unserem Datensatz zu filtern, können wir auf ```data``` die **Methode** ```dropna``` aufrufen. Dies geschieht indem wir einen Punkt ```.``` zwischen **Objekt** und **Methode** setzen und sie mit ```()``` **aufrufen**.

In [0]:
data_gefiltert = data.dropna()
data_gefiltert

Unnamed: 0,Jahr,VKZ,Abfallwirtschaftsverband,GKZ_2015,Gemeindename,EW_Gde,HFR,Abfallgruppen,FNr,Abfallfraktion,Masse in kg,kg/EW
0,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,3.0,Restmüll inkl. Sperrmüll,1.0,Gemischte Siedlungsabfälle (Restmüll),50927769.0,181.72
1,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,3.0,Restmüll inkl. Sperrmüll,2.0,Sperrige Siedlungsabfälle (Sperrmüll),8830870.0,31.51
2,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,4.0,Bioabfall - Biogene Siedlungsabfälle,4.0,Bioabfall getrennt erfasst (Biotonne),21996780.0,78.49
3,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,4.0,Bioabfall - Biogene Siedlungsabfälle,27.0,kommunale Garten- und Parkabfälle,6208450.0,22.15
4,2016.0,0.0,Graz-Stadt,60101.0,Graz,280258.0,5.0,Straßenkehricht,6.0,Straßenkehricht,626730.0,2.24
...,...,...,...,...,...,...,...,...,...,...,...,...
4416,2016.0,16.0,Weiz,61766.0,Weiz,11431.0,8.0,Diverse Abfälle,50.0,Sonstige Abfälle - nicht einzeln angeführt,8606.0,0.75
4417,2016.0,16.0,Weiz,61766.0,Weiz,11431.0,9.0,Baurestmassen,21.0,Bauschutt,296670.0,25.95
4418,2016.0,16.0,Weiz,61766.0,Weiz,11431.0,9.0,Baurestmassen,54.0,Asbestzement,9530.0,0.83
4419,2016.0,16.0,Weiz,61766.0,Weiz,11431.0,9.0,Baurestmassen,90.0,Baurestmassen - nicht einzeln angeführt,840.0,0.07


<div class="alert alert-block alert-warning">
    <h2>Kollektionen</h2>
    <br>
    Zuerst wollen wir uns den vielen verschiedenen Arten von Kollektionen in Python widmen:
    <ul>
        <li><b>Listen</b></li>
        <li><b>Tupel</b></li>
        <li><b>Wörterbücher</b></li>
        <li><b>Mengen</b></li>
        <li><b>Vektoren / Matrizen</b></li>
    </ul>
</div>

## Listen

Listen sind in Python **sehr häufig** in Gebrauch. Sie sind **mutabel** und **Container**. Was das bedeutet werden wir gleich sehen.

Eine **leere Liste** kann man auf zwei Wegen erstellen: Mit ```[]``` oder mit ```list()```

In [0]:
unsere_liste = [] # Liste wird als eine leere Liste initiiert

Da eine Liste **mutabel** ist können wir ```unsere_liste``` nun **verändern**.

Listen bieten uns die **Methode** ```append``` welche ein Argument entgegennimmt und es in die Liste **einfügt**:

In [0]:
unsere_liste.append(20) # wir fügen den Ganzzahlen-Wert 20 an die Liste an

Da sie auch ein **Container** ist, können wir Objekte **verschiedener Typen** in ihr ablegen:

In [0]:
unsere_liste.append('30') # Wir fügen einen String mit den Zeichen 3 und 0 an
unsere_liste.append(40.0) # Wir fügen eine Gleitkommazahl mit dem Wert 40 an
unsere_liste.append(True) # Wir fügen eine Bool mit dem Wert True an

Wir wollen nun den Inhalt der Liste einmal betrachten:

In [0]:
unsere_liste

[20, '30', 40.0, True]

Mit der Methode ```pop``` können wir nun ein **Element** aus der Liste **herausnehmen**:

In [0]:
ein_element = unsere_liste.pop()

*Welches Element wird als erstes heraus-```pop```-pen?*

In [0]:
ein_element

True

Wie man in der vorherigen Zelle sieht, besteht eine Liste aus einer **leeren Liste**, an welche dann **Elemente angefügt** werden.
Diese Elemente haben **Indizes** *(Mehrzahl Index = lateinisch für „Zeigefinger, Kennzeichen Verzeichnis“)*.

Das **erste Element** bekommt Index ```0```. Diesen schreiben wir in **eckige Klammern** ```[]``` nach der Liste:

In [0]:
unsere_liste[0]

20

*Welchen Index hat das letzte Element?*

*(Tipp: Es gibt mehrere Antworten!)*

In [0]:
index = len(unsere_liste)-1
unsere_liste[index]

40.0

Vielleicht hilft folgende Zelle weiter. Die **Funktion** ```len``` nimmt eine Kollektion als Argument und gibt uns ihre **Länge** aus.

In [0]:
print(unsere_liste)
unsere_liste[len(unsere_liste)-2]
unsere_liste[-2]

Listen lassen sich auch zusammenfügen mit ```+```:

In [0]:
unsere_liste + [1,2,3]

[20, '30', 40.0, 1, 2, 3]

Mit ```*``` lassen sie sich **mehrmals an sich selbst** anfügen:

In [0]:
unsere_liste * 3

[20, '30', 40.0, 20, '30', 40.0, 20, '30', 40.0]

Diese **Operatoren** erstellen eine **neue Liste**. \
Die ursprüngliche Liste wird nicht verändert:

In [0]:
unsere_liste

[20, '30', 40.0]

Benötigt man also das **Ergebnis der Operation**, muss man der neuen Liste auch einen **Namen zuweisen**:

In [0]:
neue_liste = unsere_liste + [1,2,3]
neue_liste

[20, '30', 40.0, 1, 2, 3]

Alternativ kann man eine **Zuweisung zum ursprünglichen Namen** mit der Operation **zusammenfassen** mittels ```+=``` bzw. ```*=```

In [0]:
neue_liste *= 3
print(neue_liste)

[20, '30', 40.0, 1, 2, 3, 20, '30', 40.0, 1, 2, 3, 20, '30', 40.0, 1, 2, 3]


<div class="alert alert-block alert-info">
    <h3>Tipp: Operation + Zuweisung</h3>
    
Nicht nur ```+``` und ```*``` lassen sich mit einem ```=``` in einen **Zuweisungsoperator** verwandeln, sondern alle solchen Operatoren. Eine **Auflistung** der Möglichkeiten findet man im Modul [```operator```](https://docs.python.org/3.2/library/operator.html#operator.iadd)


</div>

**ACHTUNG!** Es werden dabei Referenzen angefügt, nicht Kopien!

Erstellen wir eine Liste mit **drei leeren Listen** als Elementen:

In [1]:
liste_mit_listen = [[]]*3
liste_mit_listen

[[], [], []]

Dann fügen wir an das **erste Element** (*Index* ```0```) der ```liste_mit_listen``` einen Wert an:

In [2]:
liste_mit_listen[0].append("Hallo")

*Wie sieht die* ```liste_mit_listen``` *nun aus?*

In [3]:
liste_mit_listen

[['Hallo'], ['Hallo'], ['Hallo']]

Dieses Problem lässt sich sowohl mit **Tupeln** als auch mit List-Comprehensions vermeiden. \
Zu beidem kommen wir **bald**!

Zurück zu unserer **Abfalldatenbank**! Wir wollen die Massen pro Einwohner in ihr zu einer Liste zusammenfassen:

In [0]:
masse_pro_ew = list(data_gefiltert["kg/EW"])

**Zusätzlich** wollen wir eine **Liste mit den Indizes** dieser Elemente haben, die Funktion ```range``` hilft uns dabei eine **Kollektion mit ganzzahligen Elementen** zu erstellen.

Sie übernimmt **drei ganzzahlige Argumente**: ```start```, ```stop``` & ```step``` \
Das Endwert in ```stop``` befindet sich allerdings **nicht** mehr in der Kollektion:

In [0]:
range(0, len(masse_pro_ew), 1) # beinhaltet also alle Indizes der Elemente in unserer Liste.

range(0, 4421)

**Verpflichtend** ist allerdings nur das Argument ```stop```. \
Wird ```step``` weggelassen ist es automatisch ```1```. Lässt man auch ```start``` weg, ist dieser Wert auf ```0``` gesetzt.

In [0]:
list(range(3,10,2)) # beinhaltet also ebenso alle unsere Indizes

[3, 5, 7, 9]

Mit der Funktion ```zip``` können wir nun, wie bei einem **Reißverschluss (*= Zipper*)** die Elemente der beiden Kollektionen in einer Kollektion zusammenfassen:

In [0]:
list(zip(indizes,masse_pro_ew)) # wir erstellen nach 'zip' wieder eine Liste

[(0, 181.72),
 (1, 31.51),
 (2, 78.49),
 (3, 22.15),
 (4, 2.24),
 (5, 2.5),
 (6, 4.59),
 (7, 24.98),
 (8, 1.42),
 (9, 1.87),
 (10, 0.01),
 (11, 0.08),
 (12, 0.19),
 (13, 0.02),
 (14, 0.02),
 (15, 0.0),
 (16, 0.15),
 (17, 0.6),
 (18, 0.6),
 (19, 20.96),
 (20, 73.29),
 (21, 0.56),
 (22, 1.64),
 (23, 0.2),
 (24, 109.51),
 (25, 15.64),
 (26, 76.95),
 (27, 226.96),
 (28, 3.18),
 (29, 6.23),
 (30, 11.05),
 (31, 0.37),
 (32, 0.57),
 (33, 0.12),
 (34, 0.8),
 (35, 4.35),
 (36, 7.72),
 (37, 5.29),
 (38, 0.26),
 (39, 79.36),
 (40, 28.57),
 (41, 113.55),
 (42, 68.74),
 (43, 3.18),
 (44, 4.0),
 (45, 17.13),
 (46, 0.29),
 (47, 0.17),
 (48, 0.54),
 (49, 0.28),
 (50, 0.83),
 (51, 4.02),
 (52, 13.08),
 (53, 1.62),
 (54, 0.24),
 (55, 122.53),
 (56, 18.98),
 (57, 132.53),
 (58, 3.4),
 (59, 3.43),
 (60, 9.34),
 (61, 14.99),
 (62, 0.35),
 (63, 1.28),
 (64, 0.32),
 (65, 0.28),
 (66, 0.04),
 (67, 1.03),
 (68, 3.17),
 (69, 7.62),
 (70, 0.12),
 (71, 0.34),
 (72, 83.59),
 (73, 25.65),
 (74, 74.02),
 (75, 5.78),

*Welchen Typen haben die Elemente dieser Liste?*

## Tupel

Tupel sind die **immutablen** Geschwister von Listen. Dem entsprechend bieten sie **keine** Methoden wie ```append``` oder ```pop```. Ist ein Tupel einmal **initiiert** kann es nicht verändert, sondern nur ein anderes **neues** Tupel geschaffen werden. Warum das wichtig ist, werden wir bald sehen!

Ein leeres Tupel erstellt man entweder mit ```tuple()``` oder mit ```()```.

In [0]:
# Der Typ der Elemente in der Liste 'masse_pro_ew':
type(list(zip(indizes,masse_pro_ew))[0])

tuple

Tupel **eignen** sich vor allem als **Rückgabewert** von Funktionen (*siehe unten*) oder um **zusammengehörige Werte** zusammenzufassen.

In [0]:
tuple(range(3)) + tuple(range(10,13))

(0, 1, 2, 10, 11, 12)

Man kann Tupel also wie Listen mit ```+``` **zusammenfügen**. Die **Wiederholung** mit ```*``` funktioniert ebenfalls nach dem gleichen Prinzip:

In [0]:
tup = tuple(range(3))
tup * 3 

(0, 1, 2, 0, 1, 2, 0, 1, 2)

*Wie helfen uns Tupel jetzt das Problem mit der* ```liste_mit_listen``` *zu lösen?*

Da Tupel **nicht mutabel** sind, sich also eigentlich nicht verändern lassen, wird **bei jeder Veränderung ein neues
Tupel** erschaffen und dem Namen zugewiesen. \
Deshalb muss man statt der ```append``` - Methode, den ```+=``` - **in-place Operator** verwenden:

In [4]:
liste_mit_tupeln = [()]*3
liste_mit_tupeln[0] += 1,
liste_mit_tupeln

[(1,), (), ()]

<div class="alert alert-block alert-info">
    <h3>Tipp: Ein-Element-Tupel</h3>
    
Will man **kein leeres** Tupel schaffen sondern eines mit Elementen, braucht man **keine Klammern** ```()```. Es ist **in Wirklichkeit** das Komma ```,``` welches das Tupel erstellt!

Deshalb funktioniert es in der vorhergehenden Zelle ```1,``` zu schreiben.
</div>

Dass ein neues Element erstellt wird, lässt sich leicht mit dem Operator **```is``` überprüfen**.

Verweisen zwei Namen auf **dieselbe ID** (*und damit dasselbe Element im Speicher*) ergibt er ```True```, ansonsten ```False```.

Wir überprüfen einmal die Elemente der ```liste_mit_tupeln``` und dann jene der ```liste_mit_listen```:

In [6]:
liste_mit_tupeln[0] is liste_mit_tupeln[2] , liste_mit_listen[0] is liste_mit_listen[2]

(False, True)

Weisen wir den anderen **Elemente**n in der Liste mit Tupeln den **gleichen Wert** zu, behalten sie ihre **unterschiedlichen ID**s (*d.h. sie referenzieren andere Stellen im Speicher*):

In [8]:
liste_mit_tupeln[1] += 1,
print(liste_mit_tupeln)

liste_mit_tupeln[0] is liste_mit_tupeln[1]

[(1,), (1,), ()]

*Wie lässt sich nun überprüfen, ob die Elemente den selben Wert unabhängig von der Speicherposition haben?*

Hier offenbart sich der Unterschied zwischen ```==``` und **```is```**. Es ist daher **Vorsicht geboten welche** Art von Vergleich man anwenden will:

In [0]:
liste_mit_tupeln[0] == liste_mit_tupeln[1]

True

Zurück zu den **Abfalldaten** der Steiermark. 

Die Einträge der **Massen** sollen jeweils eindeutig einem **Index zuweisbar** sein, es macht also Sinn sie **zu Tupeln zusammenzufassen**. \
Wir verfahren gleich wie schon im Kapitel 'Listen', geben dieser Liste nun aber auch einen Namen:

In [0]:
indizes_mit_massen = list(zip(indizes,masse_pro_ew))

<div class="alert alert-block alert-info">
    <h3>Tipp: Tupel-Entpackung</h3>
    
Mit Tuple-unpacking kann Elemente aus Kollektionen entpacken und mit ```*``` den Rest einfach auch aufheben:
</div>

In [7]:
a,b,*rest,c,d = range(10)
print(type(rest))
a,b,rest,c,d

<class 'list'>


(0, 1, [2, 3, 4, 5, 6, 7], 8, 9)

*Was aber, wenn wir in einer langen Liste von Werten, genau jenen einer gewissen Gemeinde finden wollen?*

Benutzen wir **Tupel in Listen**, müssten wir **alle** Tupel entpacken und mit unserer Suche **vergleichen**, bis wir unseren Wert finden!

## Wörterbücher

Wörterbücher lösen dieses Problem, indem sie uns einen **Namen direkt einem anderen Objekt zuweisen** lassen.
Dabei steht der **Schlüssel** links, dann ein **Doppelpunkt** und das **Objekt** auf welches der Schlüssel verweist rechts:

In [0]:
Wörterbuch = {'Graz':18924,'Kainbach':5893,'Feldkirchen':6790}

**Abrufen** lassen sich die Werte/Objekte dann einfach **mittels** Eingabe des **Schlüssel**s, anstatt eines Index':

In [0]:
Wörterbuch['Kainbach']

5893

Wir können ein Wörterbuch auch einfach **aus einer Liste mit 2er-Tupeln erstellen**:

In [0]:
dict(indizes_mit_massen)

NameError: name 'indizes_mit_massen' is not defined

Ein **Schlüssel** kann allerdings **nie doppelt** vorkommen!

*Was passiert wenn wir ein Wörterbuch aus folgender Liste machen? Warum?*

In [0]:
liste_mit_doppelten_werten = [(1,'a'),(1,'b')]

In [0]:
dict(liste_mit_doppelten_werten)

{1: 'b'}

Außerdem sind Wörterbücher **mutable Collections**.

Sie können also Werte verschiedener Typen speichern und verändert werden.

*Warum kann man aber Elemente in einem Wörterbuch **so viel schneller** finden als in einer Liste?*

Das liegt daran, dass um einen schnellen Zugriff zu garantieren, \
nicht der Schlüssel sondern sein **Hash -
Wert** abgespeichert wird.

In [0]:
hash("haus")

-877232727830553907

Wie wir bereits wissen: Listen sind **mutabel**, Tupel nicht. \
Deshalb können Listen **keinen Hash-Wert** haben, man kann sie **nicht als Schlüssel** in einem Wörterbuch verwenden:

In [0]:
{():1}

{(): 1}

Deshalb funktioniert auch der **```in```** - Operator **in Listen viel langsamer** als in Wörterbüchern:

In [0]:
test_liste = list(range(99999))
test_wobu  = dict(zip(range(99999),[()]*99999))

# mit dem magic-command %timeit lässt sich messen wie lange
# eine Operation braucht:

%timeit 630 in test_liste
%timeit 630 in test_wobu

6.01 µs ± 151 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
78.9 ns ± 22.3 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


In unserem Test-Wörterbuch interessiert uns **nur die Zugehörigkeit** eines Elements. \
Wir haben also den Schlüsseln als **Dummy-Werte leere Tupel** zugewiesen. \
Diese **brauchen wenig Speicher**.

Es gibt aber eine bessere Lösung:

## Mengen

Mengen **gab es in Python lange nicht**. 
Damals wurden Wörterbücher mit **Dummy-Werte**n verwendet
um schnelle Zugehörigkeitstest zu ermöglichen. \
Mit **Mengen** geht das nun **einfacher** und mit weniger 
Speicherbedarf.

Mit ```set``` kann man eine Menge **aus einer Kollektion** erstellen:

In [0]:
set([1,2,3])

{1, 2, 3}

Mengen sind außerdem **mutabel** und eine **Collection**. Werte in ihr müssen aber natürlich **hashable** sein, wie eben bei Wörterbüchern-

Mengen **sehen auch fast so aus wie Wörterbücher**.
Sie werden in **geschwungene Klammern** ```{}``` gefasst, ihre 'Schlüssel' haben aber natürlich **keinen Doppelpunkt und keine Werte**:

In [0]:
type({1,2,3})

set

Aber **Achtung**: ```{}``` ist ein **leeres Wörterbuch**, kein Set!

In [0]:
type({})  ,   type(set())

Eine **leere Menge** erstellt man also mit ```set```.

 Wiederholen wir unseren **Geschwindigkeitstest** von vorher! Diesmal ersetzen wir das Wörterbuch durch eine **Menge**:

In [0]:
test_liste = list(range(99999))
test_menge = set(range(99999))

%timeit 630 in test_liste
%timeit 630 in test_menge

5.72 µs ± 45.4 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
45.1 ns ± 0.17 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


Auch Mengen sind als **Hash-Tables** implementiert und können daher keine Elemente doppelt enthalten:

In [0]:
set([1,1,1,2])

{1, 2}

Da wir hier nur Schlüssel haben, entfällt der Einfluss der Reihenfolge.

Das sorgt allerdings auch dafür, das Mengen einen **signifikanten** (Speicher-)**Overhead gegenüber Listen** haben:

In [0]:
%timeit list(range(99999))
%timeit set(range(99999))

2.35 ms ± 18.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
5.81 ms ± 195 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


<div class="alert alert-block alert-info">
<h3>Tipp: 'range' als Objekt</h3>
    
In Python 3 gibt die 'range'-Funktion ein eigenes Objekt
zurück, welches den 'in' Operator unterstützt.

Range ist 'lazy'. Das bedeutet: Range erzeugt seine Ausgabewerte
erst wenn ihr sie wirklich abfragt, vorher speichert es nur den
Start-, den Stop- und den Step-Wert. 
Daher kann es einfach ausrechnen ob 630 erzeugt werden würde.
Das ist viel schneller als tatsächlich nachzusehen! (Siehe nächste Zelle)
</div>

In [0]:
%timeit 630 in range(99999)

Der Name 'Menge' hat auch **mathematische Relevanz**, Python-Mengen kann man auch als mathematische nutzen!

### Symbole der Mengenleere in Python
$\setminus \quad \to \quad$ ``` - ``` \
$\cap \quad \to \quad$ ``` & ``` \
$\cup \quad \to \quad$ ``` | ```

Seien a, b zwei Teilmengen von $\mathbb{N}$

In [0]:
a,b = {1,2,3}, {3,4,5}

a - b  ,  a & b  ,  a|b

({1, 2}, {3}, {1, 2, 3, 4, 5})

<div class="alert alert-block alert-info">
<h3>Tipp: Weitere Mengenleere-Äquivalente in Python</h3>

$\in \quad \to \quad$ ``` in ``` \
$\subset \quad \to \quad$ ``` < ``` \
$\subseteq \quad \to \quad$ ``` <= ``` \
$\supset \quad \to \quad$ ``` > ``` \
$\supseteq \quad \to \quad$ ``` >= ``` \
$= \quad \to \quad$ ``` == ``` \
$\ne \quad \to \quad$ ``` != ``` 

</div>

In [0]:
# Hier einfach ausprobieren, zB:
a = {3,4}
b = {3,4,1}
print(a < b)

Wenn wir zum Beispiel wissen wollen. **welche Gemeinden** in unserem Datensatz zu den Abfallwerten **vorkommen**, können wir einfach eine **Menge mit den Namen** erstellen:

In [0]:
gemeinden = set(data_gefiltert.Gemeindename)

In [0]:
gemeinden

{'Admont',
 'Aflenz',
 'Aich',
 'Aigen im Ennstal',
 'Albersdorf-Prebuch',
 'Allerheiligen bei Wildon',
 'Altaussee',
 'Altenmarkt bei St.Gallen',
 'Anger',
 'Ardning',
 'Arnfels',
 'Bad Aussee',
 'Bad Blumau',
 'Bad Gleichenberg',
 'Bad Mitterndorf',
 'Bad Radkersburg',
 'Bad Waltersdorf',
 'Birkfeld',
 'Breitenau am Hochlantsch',
 'Bruck an der Mur',
 'Buch-St.Magdalena',
 'Burgau',
 'Bärnbach',
 'Dechantskirchen',
 'Deutsch Goritz',
 'Deutschfeistritz',
 'Deutschlandsberg',
 'Dobl-Zwaring',
 'Ebersdorf',
 'Edelsbach bei Feldbach',
 'Edelschrott',
 'Eggersdorf bei Graz',
 'Ehrenhausen an der Weinstraße',
 'Eibiswald',
 'Eichkögl',
 'Eisenerz',
 'Empersdorf',
 'Fehring',
 'Feistritztal',
 'Feldbach',
 'Feldkirchen bei Graz',
 'Fernitz-Mellach',
 'Fischbach',
 'Fladnitz an der Teichalm',
 'Floing',
 'Fohnsdorf',
 'Frauental an der Laßnitz',
 'Friedberg',
 'Frohnleiten',
 'Fürstenfeld',
 'Gaal',
 'Gabersdorf',
 'Gaishorn am See',
 'Gamlitz',
 'Gasen',
 'Geistthal-Södingberg',
 'Gersdorf

### *Was aber, wenn wir eine Kollektion multiplizieren wollen?*
### *Was wenn wir zwei Kollektionen elementweise addieren wollen?*

Mit Listen oder Tupeln bekommen wir nur längere Kollektionen:

In [0]:
[1,2,3] * 3  ,  (1,2,3) * 3

Dicts und Sets können ein ELement nicht doppelt enthalten.

*Was passiert wenn wir sie multiplizieren?*

In [0]:
try:
    {1,2,3}*3
except TypeError as e:
    print(e)

<div class="alert alert-block alert-info">
<h3>Tipp: try - except - Blöcke</h3>
    
Mit try + except könnt ihr Fehlermeldungen abfangen.
Allerdings ist dabei vorsicht geboten! Fängt man einfach
jeden Fehler ab, wird der eigene Code nicht fehlerfrei
sondern die Fehler nur weniger sichtbar.

Try-Except-Blöcke eignen sich besonders dann, wenn man
nicht weiß, welche Eingaben Nutzer dem Programm geben.
</div>

## Vektoren und Matrizen

.. bieten die schnellste Variante mit Kollektionen **elementweise Operationen** zu ermöglichen.

Um mit **Vektoren und Matrizen** rechen zu können müssen wir die Bibliothek ```numpy``` importieren:

In [0]:
import numpy as np

In [0]:
# Führe diesen Befehl aus um Numpy zu installieren:
try: 
    import numpy as np
except ModuleNotFoundError:
    %pip install numpy 

Ein Vektor lässt sich dann einfach mit ```np.array``` **erstellen und** dann auch gleich **multiplizieren**:

In [0]:
vektor = np.array(range(10))
vektor * 2

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

Eine Matrix ist dann einfach ein **Vektor welcher Vektoren als Elemente** beinhält.

In [0]:
matrix = np.matrix([range(3)]*3)

matrix*3

matrix([[0, 3, 6],
        [0, 3, 6],
        [0, 3, 6]])

**Matrix-Multiplikation** benutzt dann den speziellen **Operator** ```@```!

In [0]:
matrix @ matrix

matrix([[0, 3, 6],
        [0, 3, 6],
        [0, 3, 6]])

**Achtung!** Vor Python Version ```3.5``` gibt es dieses ```@``` nicht! \
In dem Fall benutzt man besser ```np.matrix``` und ```*```. Diese Matrizen können aber **nur 2-dimensional** sein.

Als **Vergleich** zu den vorherigen Kollektions-Typen soll auch hier der **Geschwindigkeitstest zur Zugehörigkeitsprüfung** vollzogen werden:

In [0]:
test_vektor = np.array(range(99999))

%timeit 630 in test_vektor

62.2 µs ± 885 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


Die Masse des Abfalls in unserer Datenbank ist in \[kg\] gegeben.

*Wie wandeln wir sie in Tonnen um?*

In [0]:
UMRECHNUNGSFAKTOR = 0.001

np.array(data_gefiltert["Masse in kg"])*UMRECHNUNGSFAKTOR

array([5.0927769e+04, 8.8308700e+03, 2.1996780e+04, ..., 9.5300000e+00,
       8.4000000e-01, 2.1650000e+00])

<div class="alert alert-block alert-info">
<h3>Tipp: Groß-, Kleinschreibung und Unterstriche</h3>
    
In Python gibt es einige **Konventionen** was die Benennung von Variablen, Konstanten, Objekten, und Definitionen betrifft.

```KONSTANTE``` $\to$ Eine Konstante wird mit Großbuchstaben benannt. Sie soll konstant bleiben! \
```name_einer_variable``` $\to$ Variablen werden in Kleinbuchstaben geschrieben. \
```KlassenName``` $\to$ Erstellt man eine Klasse, wirname_einer_d nur jeder erste Buchstabe groß geschrieben. \
```name_einer_funktion``` $\to$ Funktionen und Variablen haben oft zur besseren Verständlichkeit längere Namen.

Wörter trennt man mit Unterstrich ```_``` 
</div>

## Slices (Scheibchen)
Elemente von **Kollektionen** in Python lassen sich nicht nur einzeln über ihren Index aufrufen. \
Man kann die Kollektionen auch **in Scheibchen schneiden**.

Slices funktionieren ganz **ähnlich** wie ```range```. Sie haben einen ```start``` - und einen ```stop``` - Wert und einen Wert
```step``` für die Schrittweite. \
Um eine Kollektion zu zerschneiden, setzen wir diese **Werte in dieser Reihenfolge**
in **eckige Klammern** ```[]``` nach der Kollektion.

In [0]:
null_bis_zehn = list(range(10))
null_bis_zehn[3:7:2]

[3, 5]

Setzt man **keinen Wert** ```step``` für die Schrittweite ist sie **automatisch 1**:

In [0]:
tuple(range(10))[3:6:]

(3, 4, 5)

Lässt man den ```start``` - Wert **weg**, wird er **als 0 interpretiert**:

In [0]:
list(range(10))[:6]

[0, 1, 2, 3, 4, 5]

Bei einer Slice **ohne Endwert**, ist dieser gleich der **Länge der Kollektion**:

In [0]:
tuple(range(10))[3::2]

(3, 5, 7, 9)

### Slices sind äußerst vielseitig:

Wir können **jedes zweite** Element wählen:

In [0]:
null_bis_zehn[::2]

[0, 2, 4, 6, 8]

Oder eine Liste **umkehren**:

In [0]:
null_bis_zehn[::-1]

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

Oder eine **Kopie** einer Kollektion erstellen: (*der Typ bleibt dabei gleich*)

In [0]:
null_bis_zehn[::] is null_bis_zehn

False

*Wie erhält man rückwärts jedes zweite Element?*

In [0]:
null_bis_zehn[-1::-2]

### Slices funktionieren auch als Objekte
Wie bei ```range``` kann man auch einer **Slice als Objekt** einen Namen geben. \
Man erzeugt eine solche mittels:
```slice( start, stop, step)```

Das ist dann praktisch, wenn man **mehrere Listen gleich zerschneiden** will.

Eine **Datenbank** wurde uns **in** mehreren **gleich geordneten Listen** übergeben. \
Wir wollen jeweils nur **jedes zweite Element** dieser Datenbank, ab dem
**50sten** jeweiligen Element **bis zum 100sten**.

*Welche Werte müssen wir setzen?*

In [0]:
startwert = 50
endwert = 101
schrittwert = 2

ausschnitt = slice(startwert, endwert, schrittwert)

In [0]:
type(ausschnitt)

slice

In [0]:
# Die Anwendung funktioniert wieder mittels eckiger Klammern:
list(range(200))[ausschnitt]

[50,
 52,
 54,
 56,
 58,
 60,
 62,
 64,
 66,
 68,
 70,
 72,
 74,
 76,
 78,
 80,
 82,
 84,
 86,
 88,
 90,
 92,
 94,
 96,
 98,
 100]

# Pause

<div class="alert alert-block alert-warning">
    <h2>Ausdrücke</h2>
    
Python kennt einige **Schlüsselwörter** welche sogenannte **Ausdrücke** einleiten. \
Ein Ausdruck wird mit einem **Doppelpunkt** ```:``` beendet. \
Ihm folgt ein sogenannter **Block** welcher mit **4 Leerzeichen** eingerückt ist. \
Dieser Block gehört zum Ausdruck und wird **abhängig von diesem ausgeführt**.
<br/><br/>

Alle Zeilen welche mit derselben **Anzahl an Leerzeichen** beginnen, \
werden einem **Block zugehörig** interpretiert.
<br/><br/>

Einer der wichtigsten Formen von Ausdrücken sind **Funktionen**.
</div>

## Funktionen
Das Schlüsselwort um eine Funktion zu erstellen lautet ```def```

Darauf folgt dann der **Name** der Funktion. 
In der folgenden **Klammer** weißt man allen **Argumenten** \
welche die Funktion übernehmen soll **ihre Namen** zu.

Ein weiteres wichtiges Schlüsselwort ist ```return``` nach welchem der **Rückgabewert** der Funktion folgt.

<div class="alert alert-block alert-info">
<h3>Tipp: Funktionsaufrufe in Python</h3>
    
Wie wir bereits wissen, ist eine **Variable** in Python nur ein Name welcher einer **ID** eines im Speicher liegenden **Objekt**s zugewiesen ist. \
Was erhält nun eine Funktion als **Argument** wenn wir sie aufrufen?
+ Eine Kopie des Objekts?
+ Den Namen?
+ Die ID?

Nichts von alledem! Sie erhält **einen neuen Namen** für die selbe **ID**, also auch **das selbe Objekt**. \
Dementsprechend kann sie ein mutables Objekt verändern, nicht aber dessen ID.
</div>

In [0]:
def funktionsname(argument1,argument2,):
    ergebnis = argument1 - argument2
    return ergebnis

type(funktionsname)

function

Mit dem **Schlüsselwort** ```lambda``` lässt sich eine Funktion auch **in nur einer Zeile** definieren. 

In [0]:
lambdafunktion = lambda argument1,argument2: argument1 - argument2

type(lambdafunktion)

function

Außerdem muss ihr dabei **kein Name** zugewiesen werden.

In [0]:
type(lambda argument1,argument2: argument1 - argument2)

function

Man bezeichnet ```lambda``` - Funktionen daher auch als **anonyme Funktionen**.

<div class="alert alert-block alert-info">
<h3>Tipp: Funktionen als Bürger erster Klasse</h3>
    
```lambda``` - Ausdrücke sind **nützlicher** als man auf den ersten Blick denkt. \
In Python stellen **Funktionen 'Bürger erster Klasse'** dar. Das heißt,
dass Funktionen andere **Funktionen als Argument** übernehmen **oder als Ergebnis** ausgeben können. \
Die Funktion ```map``` nimmt zB eine Funktion mit einem Argument, und wendet sie auf
alle Elemente einer Kollektion an:
</div>

In [0]:
list(map(lambda x: x*x,range(10)))

<div class="alert alert-block alert-info">

Wie man sieht, musste keine Funktion ```quadrat``` definiert werden.
Eine anonyme ```lambda``` - Funktion übernimmt stattdessn die Aufgabe \
ein Objekt der Klasse ```'function'``` zu erstellen.

In der Tipp - Box zu ```range``` weiter oben kann man eine weitere Anwendung
der Funktionen als Bürger erster Klasse erkennen. \
Wir werden **später** und vor allem im **Teil 6 (Functional Programming)** dieser Lehrveranstaltung noch mehr von Funktionen als First-Class-Citizens profitieren.
</div>

Wieder zur **Abfalldatenbank**.

Wir wollen die Angaben **einzelner Massen von Kilogramm in Tonnen** umwandeln!

Also definieren wir eine Funktion ```kg_in_t```:

In [0]:
def kg_in_t(masse):
    return masse * 10**-3

Wir können auch gleich **testen** ob diese Funktion das macht, was wir erwarten:

In [0]:
kg_in_t(1000)

1.0

## Konditionelle Ausdrücke
Es kommt sehr häufig vor, dass wir abhängig von einer **Kondition** \
einen gewissen **Teil** eines Programmes **ausführen** wollen oder einen anderen.

Mit den Schlüsselwörtern ```if```, ```else``` und ```elif``` kann man genau das erreichen!

+ ```if```  erwartet eine Variable, Operation oder Funktion, welche 
  als ```True``` oder ```False``` interpretiert werden kann. \
  Danach folgt ein **Doppelpunkt** und ein **Code - Block** welcher 
  im Fall von ```True``` ausgeführt wird.

+ ```else:``` **folgt** nach diesem Block und wird genausoweit eingerückt wie das vorherige ```if```. \
  Ihm folgt ein **Block** welcher ausgeführt wird falls zuvor ```False``` dem ```if``` folgte.

+ ```elif``` ist kurz für ```else``` + ```if```. 
  Es **folgt** also auf einen ```if``` - Block, leitet aber selbst einen **neuen** ein.

In [0]:
variable = 6
if variable > 5:
    print("Yes")
else:
    print("No")

Yes


<div class="alert alert-block alert-info">
<h3>Tipp: Kurzschlüsse von logischen Operatoren</h3>
    
Steht ein ```False``` vor einem ```and``` oder ein ```True``` vor einem ```or``` \
so ist das Ergebnis schon ohne den Operator berechnen zu müssen bekannt.

Python macht daher sogenannte **Kurzschlüsse** und sieht sich gar nicht mehr an, \
welches zweite Argument dem Operator übergeben wurde.

Wie man folgenden Beispiel sieht, ergibt dann die Division durch 0 keinen Fehler, \
sie muss schließlich nie berechnet werden.
</div>

In [0]:
print(True and ())
print("") # Leerzeile
# Short-Circuit Beispiele:
print(False and ())
print(True or (1/0))

Zum **Abfallsdatensatz**.

Wir wollen einen **Grenzwert** setzen ab welchem der Wert für 'kg Abfall pro Person' alarmierend wird:

In [0]:
def alarm(nr,kg_pro_pers):
    if kg_pro_pers > 100:
        print("Alarm! Nr: %.2f überschreitet Grenzwert!"%nr)
        
    # Das else kann hier ausgelassen werden, dient jedoch 
    # der Code-Qualität
    else:
        pass

In [0]:
alarm(1,120)

Alarm! Nr: 1.00 überschreitet Grenzwert!


Eine **Warnung bevor Grenzwerte überschritten werden** ist praktisch also bauen wir auch eine solche ein!

In [0]:
GRENZWERT = 100
WARNWERT  = GRENZWERT - GRENZWERT/10

def warnung_und_alarm(nr,kg_pro_person):
    if kg_pro_person > GRENZWERT:
        print("Alarm! Nr: {} überschreitet Grenzwert!".format(nr))
    elif kg_pro_person > WARNWERT:
        print("Achtung! Nr: {} ist nah am Grenzwert!".format(nr))
    else:
        print("Nr {} passt.".format(nr))

In [0]:
warnung_und_alarm(0,80)

Nr 0 passt.


<div class="alert alert-block alert-info">
<h3>Tipp: Leerzeichen in Formeln</h3>
    
Python weiß von selbst, dass Punkt - vor Strich - Rechnung erfolgt. \
Allerdings lässt sich eine Formel im Code schneller lesen und verstehen, \
wenn man die später erfolgenden Rechenoperationen mit Beistrichen versieht.

Aus ```a-b/2``` wird also ```a - b/2```. \
Und aus ```a*b**2``` dann ```a * b**2```.
</div>

## Rekursive Funktionen

Funktionen können sich auch **selbst aufrufen**. Solche Funktionen nennt man dann **rekursiv**.

Ein **Countdown** kann zum Beispiel als solche **implementiert** werden:

*Mit sleep können wir den Computer zwischendurch etwas warten lassen. Das brauchen wir dann gleich.*

In [0]:
from time import sleep

In [0]:
def countdown(startwert):
    if startwert < 0:
        return None
    else:
        print(startwert, end=' ')
        sleep(0.5)
        countdown(startwert-1)

In [0]:
countdown(10)

10 9 8 7 6 5 4 3 2 1 0 

<div class="alert alert-block alert-info">
    
<h3>Tipp: Strings formatieren mit '%'</h3>
    
Als Beispiel eine etwas schönere Countdown-Funktion. \
Mit ```'\r'``` lassen wir die Ausgabe immer wieder
von vorne starten. \
Mit ```'%i'``` sagen wir Python, dass wir eine Ganzzahl
in unseren String setzen wollen. \
Mit ```%startwert``` nach dem String geben wir Python
dann den passenden Wert dazu:
</div>

In [0]:
def countdown(startwert):
    if startwert < 0:
        return None
    else:
        print("\r%i"%startwert, end=' ')
        sleep(1)
        countdown(startwert-1)
        
countdown(10)

<div class="alert alert-block alert-info">
    <h3>Tipp: Strings formatieren mit '{}' und .format()</h3>
    
Das selbe lässt sich auch mit ```'{}'``` an der Einsetz - Stelle im String erledigen. \
Den passenden Wert der gibt man dem String dann mittels ```.format()``` :
</div>

In [0]:
"Fünf ist: {}".format(5)

Im **Abfallsdatensatz** wollen wir die **Werte für eine Stadt aufsummieren** können.

*Wie kann das unsere Funktion* ```summe``` *bewerkstelligen?*

In [0]:
def summe(werte):
    #
    #
    # 
    return summe(werte) + #

summe(list(range(11)))

Hier eine **Lösung**:

In [0]:
def summe(werte):
    a,*rest = werte
    if rest != []:
        return a + summe(rest)
    else:
        return a
    
summe([1,2,3])

6

**Achtung!** Rekursive Funktionen verursachen schnell Probleme in Python. \
Nämlich genau dann, wenn sie sich **zu oft selbst aufrufen** müssen:

In [0]:
try:
    summe(list(range(9999)))
except Exception as e:
    print(e)

maximum recursion depth exceeded while calling a Python object


<div class="alert alert-block alert-info">
<h3>Tipp: Der Python-Stack.</h3>
    
Der Stack stellt das Limit für die Aufrude dar. Jedes Mal wenn sich die
rekursive Funktion selbst aufruft merkt sich das Python und fügt
einen Eintrag zum Stack hinzu. Seine maximale Größe in Python liegt bei
circa 1000 Einträgen.

Einen Stack kann man sich vorstellen wie einen Stapel Papier, wo immer
wieder ein Blatt oben hinzugefügt wird. Man hat also immer nur
Zugriff auf das oberste Blatt Papier. 
Dieses Konzept nennt man "LIFO" - Last in, first out.

Ein verwandtes Konzept wird "FIFO" genannt - wofür steht diese Abkürzung?
</div>

+ #### Was ist die Lösung für dieses Problem?

## Die While-Schleife
```while``` - **Schleifen** führen einen Code-Block so lange aus, wie eine **Bedingung erfüllt** ist. \
Ist die Bedingung **nicht (mehr) erfüllt**, fährt Python mit dem **Code nach der Einrückung** fort.

Wir schreiben die Funktion ```summe``` so um, dass sie die **Summe über eine while-Schleife** bildet:

In [0]:
def while_summe(werte):
    summe = 0
    while(werte != []):
        a, *werte = werte
        summe += a
    return summe

Diese Funktion kann nun auch große Kollektionen übernehmen:

In [0]:
while_summe(range(6))

15

Mit einem ```else:``` Ausdruck nach einer ```while``` - Schleife lässt sich ein **Block einmalig** ausführen, \
wenn die Bedingung nicht (mehr) erfüllt ist.

In [0]:
i = 10 
while i >= 0:
    if i == 6:
        continue 
    print("\r%i"%i,end=' ')
    sleep(0.5)
    i-=1
    
else:
    print("\r%i :Success!"%i)

7  

Wenn wir **gewarnt** werden wollen sobald der **Grenzwert überschritten** ist, können wir dieses ```else``` nutzen:

In [0]:
# 
grenzwert_überschritten = lambda wert: wert > 100

wert = #
while not grenzwert_überschritten(wert):
    wert += 1
else:
#    print("Überschreitung!")


<div class="alert alert-block alert-info">
<h3>Tipp: Control - Flow und Else nach Schleifen</h3>
    
Wichtig für dem **Control - Flow** im engeren Sinne sind die Schlüsselwörter ```continue``` und ```break```. \
Beide können nur **innerhalb einer Schleife** verwendet werden.

Stößt der Python-Interpreter auf ein ```continue```, so **springt** er wieder **auf die erste Zeile** des Blocks innerhalb der Schleife.

Bei einem ```break``` **bricht die Schleife ab**. Das ```else:``` - Statement nach der Schleife wird dabei **nicht** ausgeführt.
</div>

## For-Schleife
Oftmals wollen wir mit einer Schleife **Element für Element einer Kollektion aufrufen** können. Hier eignet sich ```for``` besonders gut.

Diese Schleife **ruft alle Elemente hintereinander auf**. Sie weißt dem **aktuellen Element** immer auch einen **Namen** zu, sodass wir das Element nicht mehr in der Kollektion suchen müssen.

Nutzen wir die ```for``` **- Schleife** um die Funktion ```range``` genauer **kennenzulernen**.

Die Schleife **weißt jedem Element** welches von ```range``` erzeugt wird **nacheinander den Namen** ```it``` zu. \
Wir lassen uns dann den Wert von ```it``` mit ```print``` im **Körper** der Schleife (*also dem eingerückten Block*) ausgeben:

In [0]:
for it in range(0,10,2): 
    if it == 6:
        continue
    print(it, end=' | ')

0 | 2 | 4 | 8 | 

In einer ```for``` - Schleife können wir auch **Tupel in einer Kollektion entpacken**:

In [0]:
ränge = zip([1,2,3,4,5] , ['Gold','Silber','Bronze','Blech','Pech'])

for (nummer, medaille) in ränge:
    print("{}. - {}".format(nummer, medaille))

1. - Gold
2. - Silber
3. - Bronze
4. - Blech
5. - Pech


*Was passiert, wenn wir 'zip' zwei Kollektionen unterschiedlicher Länge geben?*

Oftmals wollen wir die **Werte eines Wörterbuches entpacken**. Das geht indem wir auf dem Wörterbuch-Objekt die **Methode** ```items``` aufrufen.

In [0]:
wb = {'Graz':564, 'Linz':498, 'Salzburg':431}
for _, wert in wb.items():
    print(wert)

564
498
431


<div class="alert alert-block alert-info">
<h3>Tipp: Nutzen von Unterstrichen zur Namensgebung</h3>
    
Oft kommt es **beim Entpacken von Tupeln** dazu, dass wir nur an einem Teil \
der im Tupel enthaltenen Werte interessiert sind. \
Dann weisen wir jedem Wert an dem wir nicht interessiert sind den Namen ```_``` zu. \

>_Verwendet man Python's [text.gettext](https://docs.python.org/3/library/gettext.html#gettext.install) empfiehlt es sich, zwei Unterstriche zu verwenden. \
```_``` wird dort als Funktion definiert._ 

Wollen wir eine **Funktion, Klasse oder Variable** definieren, \
auf welche nur innerhalb unseres Codes zugegriffen werden soll, \
so setzen wir einen Unterstrich vor dessen Namen: \
```_interne_variable```.
</div>

Nun wollen wir über die Reihen unserer **Abfallsdatenbank** gehen und die **Gesamtmenge an Müll je Standort** ermitteln.

Zuerst schauen wir nach **welche Werte in der Datenbank sind**, um sie in der richtigen Reihenfolge entpacken zu können:

In [0]:
data_gefiltert.keys()

Index(['Jahr', 'VKZ', 'Abfallwirtschaftsverband', 'GKZ_2015', 'Gemeindename',
       'EW_Gde', 'HFR', 'Abfallgruppen', 'FNr', 'Abfallfraktion',
       'Masse in kg', 'kg/EW'],
      dtype='object')

Um die Masse je Standort zu **summieren**, erstellen wir ein **leeres Wörterbuch**. Nach und nach wollen wir **Standorte hinzufügen**.

*Was sollte im Körper der Schleife stehen?*

In [0]:
ergebnis = {}

for _,_,_,name,*_,masse,_ in data_gefiltert.itertuples():
    #
    #
    #
else:
    print("Schleife erfolgreich abgeschlossen!")

In [0]:
ergebnis

Die **Lösung** für die vorhergehende Schleife:

In [0]:
ergebnis = {}

for _,_,_,name,*_,masse,_ in data_gefiltert.itertuples():
    a = ergebnis[name] 
    ergebnis[name] = a + masse
else:
    print("Schleife erfolgreich abgeschlossen!")

ergebnis

KeyError: 'Graz-Stadt'

## List - Comprehensions
Wir können aber auch die **Konstruktion** einer Liste **mit** der praktischen Darstellung einer ```for``` **- Schleife direkt verbinden**. \
Dies lässt sich einfach mit einer ```list``` - Comprehension bewerkstelligen.

Die **Semantik kehrt sich dabei um** und man benutzt zuerst das Element und **beschreibt dann woher** das Element mit diesem Namen kommen soll.\
Dies alles geschieht **in eckigen Klammern** ```[]```.

Eine **Liste mit Quadraten von Ganzzahlen bis 10** lässt sich so konstruieren:

In [0]:
[x*x for x in range(10)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

Wir erinnern uns an das Problem, der mehrfach-Referenzen in der ```liste_von_listen```:

In [0]:
liste_mit_listen = [[]]*3
liste_mit_listen[0].append(6)
liste_mit_listen

[[6], [6], [6]]

Dieses Problem/Diese Falle lässt sich **mit List-Comprehensions vermeiden**:

In [0]:
liste_mit_listen_comp = [[] for _ in range(3)]
liste_mit_listen_comp[0].append(6)
liste_mit_listen_comp

[[6], [], []]

## Weitere Comprehensions
Ganz ähnlich zu List Comprehensions funktionieren auch **Comprehensions für andere Kollektions-Typen**.

**Set-Comprehensions** verwenden geschwungene anstatt eckiger Klammern ```{}``` und **erstellen Mengen**:

In [0]:
{it for it in range(6)}

{0, 1, 2, 3, 4, 5}

**Dict-Comprehensions** kombinieren in geschwungenen Klammern Schlüssel und Wert ```{:}``` zu einem **Wörterbuch-Eintrag**:

In [0]:
{k:str(k) for k in range(6)}

{0: '0', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5'}

#### Generator-Expressions
Sie sehen aus wie List-Comprehensions **mit normalen Klammern.** \
Diese erzeugen **keine Tupel!** 
Stattdessen erzeugen sie ähnlich wie die ```range``` - Funktion ihre \
Elemente Stück für Stück erst wenn diese mit ```next``` abgerufen werden. \
Dies nennt man **'lazy - evaluation'**:

In [0]:
gen = (x*x for x in range(6))

In [0]:
next(gen)

4

## Zusammenfassung

+ Anaconda
+ Typen
+ Kollektionen
+ Funktionen
+ If-Abfragen
+ Rekursion
+ Schleifen
+ Comprehensions

<div class="alert alert-block alert-danger">
<h3>Übungsaufgabe: Das FizzBuzz - Beispiel</h3>
    
Ein beliebtes Beispiel in Bewerbungsgesprächen ist FizzBuzz. \
Damit soll überprüft werden, ob der_die Bewerber_In Programmier - \
Grundkonzepte verstanden hat und anwenden kann.

Dabei ist das Beispiel ganz einfach!

<br></br>

>Für die Zahlen ```1``` bis ```100```:
>+ Wenn die Zahl durch ```3``` teilbar ist, wird 'Fizz' ausgegeben.
>+ Wenn die Zahl durch ```5``` teilbar ist, wird 'Buzz' ausgegeben.
>+ Ist die Zahl durch beides teilbar, soll 'FizzBuzz' ausgegeben werden.
>+ In allen anderen Fällen soll einfach die Zahl ausgegeben werden.

Tipp: Der Modulo-Operator ```%``` könnte hilfreich sein ;)
</div>

In [8]:
for it in range(100): print(int(it%3/2)*"Fizz" + int(it%5/4)*"Buzz" or it+1)

1
2
Fizz
4
Buzz
Fizz
7
8
Fizz
Buzz
11
Fizz
13
14
FizzBuzz
16
17
Fizz
19
Buzz
Fizz
22
23
Fizz
Buzz
26
Fizz
28
29
FizzBuzz
31
32
Fizz
34
Buzz
Fizz
37
38
Fizz
Buzz
41
Fizz
43
44
FizzBuzz
46
47
Fizz
49
Buzz
Fizz
52
53
Fizz
Buzz
56
Fizz
58
59
FizzBuzz
61
62
Fizz
64
Buzz
Fizz
67
68
Fizz
Buzz
71
Fizz
73
74
FizzBuzz
76
77
Fizz
79
Buzz
Fizz
82
83
Fizz
Buzz
86
Fizz
88
89
FizzBuzz
91
92
Fizz
94
Buzz
Fizz
97
98
Fizz
Buzz
