# Datenjournalismus in Python - 
# Eine praktische Einführung in die Programmierung


### Natalie Widmann




Wintersemester 2022 / 2023


Universität Leipzig





# Vorlesung 3 - Funktionen, Listen & Schleifen


## Inhalte

Heute lernen wir:

- Code lesen, verstehen und vereinfachen mithilfe von Funktionen
- einfache Daten mit Listen darzustellen und deren Inhalte zu analysieren
- Listen mithilfe von Schleifen zu bearbeiten um mehr Informationen daraus abzuleiten





#  Teil 1: Code Lesen und Verstehen

## Recap: Automatisierte Wahlberichterstattung

Was macht der Code?

In [None]:
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 23.7

kandidat2 = 'Gundula Lobrecht'
prozent2 = 31.5


if prozent1 == prozent2:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
else:
    text = '{} gewinnt mit {} Prozent der Stimmen.'
    vorsprung = ' Dies ist ein {} Vorsprung von {} Prozentpunkten.'
    gewinner = kandidat1
    prozent = prozent1
    differenz = prozent1 - prozent2
    
    if prozent2 > prozent1:
        gewinner = kandidat2
        prozent = prozent2
        differenz = prozent2 - prozent1
        
    text = text.format(gewinner, prozent)
    differenz = round(differenz, 1)
    
    if differenz >= 0 and differenz <= 1:
        ausmass = 'minimaler'
    elif differenz > 1 and differenz < 3:
        ausmass = 'knapper'
    elif differenz >= 3 and differenz < 5:
        ausmass = ''
    elif differenz >= 5:
        ausmass = 'erheblicher'
    vorsprung = vorsprung.format(ausmass, differenz)
    
    amtsinhaber = ' {} wird neuer Bürgermeister von {}.'
    amtsinhaber = amtsinhaber.format(gewinner, stadt)
    if gewinner == kandidat2:
        amtsinhaber = amtsinhaber.replace('neuer Bürgermeister', 'neue Bürgermeisterin')
        
    text = text + vorsprung + amtsinhaber
      
print(titel.upper(), text, sep='\n\n')


# Funktionen

Selbstdefinierte Funktionen helfen eine wiederkehrende Aufgabe zu erfüllen und den Code übersichtlich zu halten.




## Syntax


`def` ist das Schlüsselwort für eine Funktionsdefinition. Darauf folgt der Funktionsname, runde Klammern und ein Doppelpunkt. Alle Anweisungen, die eingerückt stehen werden beim Funktionsaufruf ausgeführt.



![funktion](../imgs/funktion.png)


Aufgerufen wird die Funktion über `<funktions_name>()`.


### Beispiele

In [None]:
# Funktion die Hallo Welt auf der Konsole ausgibt
def say_hello_world():
    print('Hallo Welt')

In [None]:
say_hello_world()

## Parameter

Funktionen können flexibler gestaltet werden, in dem Eingabeparameter definiert werden.

Innerhalb dieser Funktion können diese Parameter wie ganz normale Variablen benutzt werden. 


In [None]:
# Funktion die Hallo XY! auf der Konsole ausgibt
def say_hello(name):
    print(f'Hallo {name}!')

In [None]:
say_hello('Anna')

In [None]:
say_hello('Arne')

Es können beliebig viele Parameter übergeben werden. 


In [None]:
# Funktion die drei Zahlen aufaddiert
def add_three_numbers(a, b, c):
    print(a + b + c)

In [None]:
add_three_numbers(3,9,1)

### Optionale Parameter

Ein Parameter ist optional wenn in der Funktionsdefinition ein default Wert definiert wird


In [None]:
# Funktion die bis zu drei Zahlen aufaddiert
def add_numbers(a, b=0, c=0):
    print(a + b + c )

In [None]:
add_numbers(7,2,1)
add_numbers(8,9)
add_numbers(3)

## Funktionen mit Rückgabewert

Die Beispielfunktionen haben bisher Werte auf der Konsole ausgegeben.

Die Anwendung von Funktionen ist jedoch meist, dass sie Werte entgegen nehmen, diese modifizieren oder auf deren Grundlage etwas neues berechnen. Das Ergebnis wird zurückgegeben, damit im Hauptprogramm damit weitergearbeitet werden kann.

Dafür wird `return` am Ende einer Funktion benutzt.

![funktion](../imgs/funktion_return.png)


### Beispiel


In [None]:
# Funktion die einen String bearbeitet
def clean_string(string):
    return string.lower().strip().title()

In [None]:
var = '   haLLO wELt!  '
clean_var = clean_string(var)
print(clean_var)

In [None]:
# Funktion die den größeren Wert zurück gibt
def get_maximum(wert1, wert2):
    if wert1 > wert2:
        return wert1
    return wert2

In [None]:
maximum = get_maximum(3, 8)
print(maximum)

In [None]:
maximum = get_maximum(13, 9)
print(maximum)

## Funktionen für die Automatisierte Wahlberichterstattung

In [None]:
# Gender a text
def gender(text):
    return text.replace('neuer Bürgermeister', 'neue Bürgermeisterin')

In [None]:
text = 'XY wird neuer Bürgermeister.'
gendered_text = gender(text)
print(gendered_text)

In [None]:
# Gender a text
def gender(text):
    text = text.replace('neuer Bürgermeister', 'neue Bürgermeisterin')
    text = text.replace('Er', 'Sie')
    return text

In [None]:
text = 'XY wird neuer Bürgermeister. Er holte 43 Prozent der Stimmen.'
gendered_text = gender(text)
print(gendered_text)

## Automatisierte Wahlberichterstattung mit Funktionen

In [None]:
# Erhalte Gewinner basierend auf den Prozent
def get_gewinner(kandidat1, prozent1, kandidat2, prozent2):
    if prozent1 > prozent2:
        return kandidat1, prozent1
    return kandidat2, prozent2

# Berechne die Differenz zweier Zahlen
def berechne_differenz(num1, num2):
    return round(abs(num1 - num2), 1)

# Bewerte den Vorsprung in Prozentpunkten
def get_ausmass(differenz):
    if differenz >= 0 and differenz <= 1:
        ausmass = 'minimaler'
    elif differenz > 1 and differenz < 3:
        ausmass = 'knapper'
    elif differenz >= 3 and differenz < 5:
        ausmass = ''
    elif differenz >= 5:
        ausmass = 'erheblicher'
    return ausmass
    
# Passe den Text dem Geschlecht an    
def gender(text):
    return text.replace('neuer Bürgermeister', 'neue Bürgermeisterin')

In [None]:
# Wahldaten
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 29.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 38.7

# SKript
if prozent1 == prozent2:
    # Gleichstand
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
else:
    # Gewinner Text
    text = '{} gewinnt mit {} Prozent der Stimmen.'
    gewinner, prozent = get_gewinner(kandidat1, prozent1, kandidat2, prozent2)        
    text = text.format(gewinner, prozent)
    
    # Vorsprung Text
    vorsprung = ' Dies ist ein {} Vorsprung von {} Prozentpunkten.'
    differenz = berechne_differenz(prozent1, prozent2)
    ausmass = get_ausmass(differenz)
    vorsprung = vorsprung.format(ausmass, differenz)
    
    # Amtsinhaber:in Text
    amtsinhaber = ' {} wird neuer Bürgermeister von {}.'
    amtsinhaber = amtsinhaber.format(gewinner, stadt)
    if gewinner == kandidat2:
        amtsinhaber = gender(amtsinhaber)


    text = text + vorsprung + amtsinhaber 
    
print(titel.upper(), text, sep='\n\n')


# Teil 2 - Darstellung und Auswertung von einfachen Daten

Luftqualität in Leipzig

![funktion](../imgs/luftqualitaet_leipzig.png)

https://geoportal.leipzig.de/arcgis/apps/experiencebuilder/experience/?id=9a13182739c74c228ff27a0ec8fb7202

### Hintergrund PM10

Atmosphärische Partikel (PM) sind mikroskopische feste oder flüssige Materie, die in der Luft suspendiert sind. Quellen von Feinstaub können natürlich oder vom Mensch verursacht sein. Von größter Bedeutung für die Bevölkerungsgesundheit sind die Partikel, die klein genug sind, um in die tiefsten Teile der Lunge eingeatmet zu werden. Diese **Partikel haben einen Durchmesser von weniger als 10 Mikrometer** (ungefähr 1/7 der Dicke eines menschlichen Haares) und sind als PM10 definiert. PM10 ist eine **Mischung aus Materialien wie Rauch, Ruß, Staub, Salz, Säuren und Metallen.** Partikel bilden sich auch, wenn die von Kraftfahrzeugen und der Industrie emittierten Gase in der Atmosphäre miteinander reagieren. PM10 wird häufig als Nebel wahrgenommen, den man auch als **Smog** bezeichnet. **PM10 gehört zu den schädlichsten aller Luftschadstoffe**, da

- PM10 kann die Anzahl und den Schweregrad von Asthmaanfällen erhöhen
- PM10 verursacht oder verschlimmert Bronchitis und andere Lungenerkrankungen
- PM10 reduziert die Fähigkeit des Körpers, Infektionen zu bekämpfen

Quelle: https://www.meteoblue.com/de/wetter/outdoorsports/airquality/leipzig_deutschland_2879139

In [None]:
# Feinstaub PM10
pm10 = [15, 15, 16, 19, 23, 23, 40, 37, 38, 29, 16]

# Listen

Ein Datentyp zur Darstellung von Sequenzen oder mehreren zusammengehörigen Objekten.

### Syntax

```
<list_name> = [<object1>, <object2>, <object3>, ...]

obst = ['Kiwi', 'Apfel', 'Brombeere', 'Mandarine']
```



In [None]:
primzahlen = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29]
print(primzahlen)

code = [True, False, False, True, True, True]
print(code)

planeten = ['Merkur', 'Vater', 'Erde', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptun']
print(planeten)

# Leere Liste
leere_liste = []
print(leere_liste)

Datentypen können auch gemischt werden

In [None]:
sonstiges = [7, 'Hello', -12, True, 62.9, False, 'Ende']

## Luftqualität Leipzig - Erste Analyse

- Wie viele Messungen sind vorhanden?

- Was ist der maximale Feinstaubwert? Welcher der minimale? Wie ist die Temperatur im Durchschnitt?



In [None]:
# Feinstaub PM10
pm10 = [15, 15, 16, 19, 23, 23, 40, 37, 38, 29, 16]

In [None]:
# Anzahl an Messungen entspricht der Länge der List
len(pm10)

Grundlegende Statistik

In [None]:
# Maximum
max(pm10)

In [None]:
# Minimum
min(pm10)

In [None]:
# Durchschnitt
sum(pm10) / len(pm10)

# List Methoden - Beispiele

| Methode  | Beschreibung  | 
|----------|:-------------  |
| sort() |  Sortiert die Liste (aufsteigend, absteigend) |
| index()  |  Gibt den Index eines Elements zurück |
| count()  |  Gibt die Anzal des vorhandenen Listeneintrages zurück |
| append() |  Fügt ein Element am Ende der Liste hinzu |
| extend() |  Hängt eine andere Liste am Ende an  |
| insert() |  Fügt ein Element in die Liste ein |
| remove() |  Löscht ein Element aus der Liste |


**Erinnerung**: Mit `dir(<object>)` werden alle Methoden eines Objektes angezeigt.



In [None]:
# Wie häufig sind die Min / Max Messwerte?
print('Häufigkeit Min Wert:')
print(pm10.count(15))

print('Häufigkeit Max Wert:')
print(pm10.count(40))


In [None]:
# An welchem Tag (nach Beginn der Messung) wurde der maximale Wert erreicht?
print(pm10.index(40))

In [None]:
pm10.sort()
print(pm10)

pm10.sort(reverse=True)
print(pm10)

# Index

Jedes Element in einer Liste ist einem Index zugeordnet. Über diesen Index kann man uaf das Element zugreifen.

Der Index startet immer bei 0.

![ListIndex](../imgs/ListIndex.png)

**Die Syntax**

```
    <listname>[<index>]
```


In [None]:
# Indexing
farben = ['gelb', 'rot', 'blau', 'grün', 'weiß']

# Element an Index X
print(farben[0])

print(farben[1])

print(farben[2])



In [None]:
# Wenn der Index gleich oder größer ist als die Länge der Liste, wird ein Fehler zurückgegeben
print(len(farben))
print(farben[5])
print(farben[10])

In [None]:
# Feinstaub PM10
pm10 = [15, 15, 16, 19, 23, 23, 40, 37, 38, 29, 16]
pm10[0]

# Negative Indizes

Indizes können auch negativ sein. Dies bedeutet das vom Ende der Liste her gezählt wird.

Der Index -1 ist dem letzten Element zugeordnet.




In [None]:
farben = ['gelb', 'rot', 'blau', 'grün', 'weiß']
print(farben[-1])

In [None]:
print(farben[-3])

Über den Index können die Elemente einer Liste verändert werden. 

In [None]:
rangliste = ['Eva', 'Ismail', 'Inga', 'Anna', 'Marc']

print(rangliste)
rangliste[2] = 'Evelin'
print(rangliste)
rangliste[3] = 'Ana'
print(rangliste)

# Slicing

Während mit Indexing auf einzelne Element in einer Liste zugegriffen wird, können mit **Slicing** Teilsequenzen einer Liste extrahiert werden. 

Dazu wird der Start- und der Endindex angegeben. 

Wobei zu beachten ist, dass die ausgegebene List den Endindex nicht beinhaltet.


## Die Syntax

```
    <listname>[<startindex>:<endindex>]
```
    
    




In [None]:
# Beispiel
abc = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']

print(abc[0:3])
print(abc[3:4])

In [None]:
print(abc[4:7])

In [None]:
# Ist der Endindex größer als die Länge der Liste, wird diese - ohne Fehler - bis zum Ende ausgegeben
print(abc[8:15])

In [None]:
print(abc[-3:-1])

In [None]:
# Entspricht der Startindex dem Anfang der Liste oder entspricht der Endindex dem Ende der Liste
# können diese weggelassen werden

print(abc[:3])

In [None]:
print(abc[5:])

In [None]:
# Dies funktioniert natürlich auch bei negativen Indizes
print(abc[-4:])

In [None]:
print(abc[:-4])

In [None]:
# Ohne Start- und Endindex wird die komplette Liste ausgegeben
print(abc[:])

# Slicing

Zusätzlich zum Start- und Endindex, kann die Schrittgröße (*step*) mitangegeben werden.

Die Schrittgröße bestimmt die Abstände zwischen den einzelnen Elementen.

Der Defaultwert ist 1.



## Die Syntax

```
    <listname>[<startindex>:<endindex>:<step>]
```
    
    




In [None]:
print(abc)
print(abc[1:8:2])

In [None]:
print(abc[2::3])

# Nested Lists

Listen können auch Listen beinhalten.



In [None]:
sonstiges = [1, 7, 23, ['a', 'b', 'c'], 18, True, []]

In [None]:
elem2 = sonstiges[2]
print(elem2)
print(type(elem2))

print('\n - - - \n')

elem3 = sonstiges[3]
print(elem3)
print(type(elem3))

In [None]:
# Die erlernten Regeln zu Indexing und Slicing lassen sich hier genauso anwenden

print(sonstiges[3][0])

In [None]:
print(sonstiges[3][1:])

## Zurück zur Luftqualität


Ziel: Ein Warnsystem falls die Luftqualität in den gelben Bereich abrutscht.

![funktion](../imgs/qualitaetsindex.png)




In [None]:
pm10 = [15, 15, 16, 19, 23, 23, 40, 37, 38, 29, 16]

In [None]:
# 1. Schritt: Gib jeden Messwert
for messwert in pm10:
    print(messwert)

In [None]:
# 2. Schritt: Falls die Schwelle von 36 Mikrogramm PM10 erreicht werden gib eine Warnung aus
for messwert in pm10:
    print(messwert)
    if messwert >= 36:
        print('Achtung: Die Luftqualität ist mäßig')

# Loops - Schleifen

Schleifen - auch **Loops** genannt, ermöglichen eine effiziente Automatisierung und Wiederholung einer Funktion.




# For Loop

**For Loop** - Für jedes Element in einem **Iterable** (alle Objekte die iterierbar sind wie beispielswiese Listen, Strings, Tuple, etc.) wird eine Funktion ausgeführt.

![ForLoop](../imgs/forloop.png)

In [None]:
# Für jede Zahl in der Liste, printe diese
for number in [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]:
    print(number)

In [None]:
namen = ['Urs', 'Gundula', 'Amer', 'Ina', 'Sasan']

# Für jeden Namen in der Liste, gib 'Hallo <name>' aus
for name in namen:
    print ('Hallo {}'.format(name))

In [None]:
namen = ['Urs', 'Gundula', 'Amer', 'Ina', 'Sasan']

print('Loop Start\n')

for name in namen:
    print ('Hallo {}'.format(name))
    
print('\nLoop Ende')

 # Motivation Loops
 
 Schleifen sind wichtige Werkzeuge Daten zu verarbeiten, zu filtern oder Modifikationen vorzunehmen.
 
 Wir erinnern uns an die Luftqualitätsdaten von Leipzig.
 
 Fiktive Szenarien:
 
 (1) Die Stadt Leipzig verkündet, dasss die Messstation falsch geeicht und alle Werte zum 1,3 µg/m³ zu niedrig sind 
 
 (2) Werte über 10 µg/m³ sind gesundheitsschädlich. Wie oft wurden diese Grenze überschritten?
 
 (3) Wie weit liegen diese Werte über der 10 µg/m³

In [None]:
# (1) Korrektur der Messwerte
werte = [7, 8, 13, 9, 14, 10, 11, 7, 7, 8]

neue_werte = []
for wert in werte:
    neuer_wert = wert + 1.3
    neue_werte.append(neuer_wert)
    
print(neue_werte)



In [None]:
# (2) Anzahl der Messwerte über der gesundheitsschädlichen Grenzen
limit_count = 0
for wert in werte:
    if wert > 10:
        limit_count = limit_count + 1
print(limit_count)

In [None]:
# (3) Differenz der Werte zur Grenze
limit_values = []
for wert in werte:
    if wert > 10:
        differenz = wert - 10
        limit_values.append(differenz)
        
print(limit_values)


# While Loop


Eine Funktion wird so lange ausgeführt, bis eine Bedingung erreicht wird.

![WhileLoop](../imgs/whileloop.png)


In [None]:
x = 1
while x < 10:
    print(x)
    x = x + 1

In [None]:
print('While Loop Start \n')
x = 1
while x < 10:
    print(x)
    x = x + 1
print('\nWhile Loop Ende')

# Endlosschleife

Eine Endlosschleife ist eine While Schleife ohne Abbruchbedingung.

Das heißt die Anwendung wird immer wieder ausgeführt - so lange bis die Ausführung manuell gestoppt wird (Strg + C) oder Python geschlossen wird.



In [None]:
# Endlosschleife
print('While Loop Start \n')

x = 1
while True:
    print(x)
    x = x + 1
    
print('\nWhile Loop Ende')

In [None]:
eingabe = input('Rate eine Zahl ')

# Flow Control

Für mehr Kontrolle in den Schleifen sorgen die folgenden Anweisungen:

**break** - bricht eine Schleife frühzeitig ab

**continue** - überspringt die aktuelle Iteration. Der Rest der Schleife wird jedoch weiter ausgeführt 

**pass** - Die Anweisung pass, die nach der bedingten if-Anweisung steht, teilt dem Programm mit, dass es die Schleife weiter ausführen und die Tatsache ignorieren soll, dass die Variable number während einer ihrer Iterationen als gleichwertig zu 5 ausgewertet wird.

In [None]:
print('Start Loop\n')

for number in range(20):
    if number == 5:
        pass    
    print('Number is ' + str(number))

print('\n End Loop')

# Zeit für Feedback



Link: https://ahaslides.com/L82AN

![Feedback QR Code](../imgs/qrcode_vl3.png)

