# Datenjournalismus in Python - 
# Eine praktische Einführung in die Programmierung


### Natalie Widmann




Wintersemester 2022 / 2023


Universität Leipzig





# Recap: Letzte Vorlesung...

## Wie oft kann Jeff sich X zum Preis von y € kaufen?
### Eine kleines Programm dafür...

In [None]:
# Wie oft kann Jeff sich X kaufen
vermoegen = 154500000000

dinge = input('Dinge: ')
kosten = input('Kosten:')

anzahl = vermoegen / float(kosten)

antwort = f'Bezos kann sich {anzahl} {dinge} zum Preis von {kosten} € kaufen.'
print(antwort)


# input() 

Die Input funktion nimmt die Eingabe eines:r Nutzer:in entgegen.
Die Eingabe ist immer eine Zeichenkette, auch wenn sie nur aus Zahlen besteht.


In [None]:
# Eingabe wird als Variable gespeichert und ausgegeben
eingabe = input()
print(eingabe)

In [None]:
# Datentyp der Eingabe ist immer string
print(type(eingabe))

In [None]:
# Mit Casting kann der Datentyp angepasst werden
var = input()
var = float(var)
type(var)

In [None]:
# Wie oft kann Jeff sich X kaufen
vermoegen = 154500000000

dinge = input('Dinge: ')
kosten = input('Kosten:')

anzahl = vermoegen / float(kosten)

antwort = f'Bezos kann sich {anzahl} {dinge} zum Preis von {kosten} € kaufen.'
print(antwort)


# f-Strings oder Literal String Interpolation

f-Strings ermöglichen es Werte von Variablen in einen String einzubetten.

### Syntax

Der f-String wird iniitiert, indem ein `f` vor den String gestellt wird.

Die Platzhalter für die Variablenwerte werden in geschweifte Klammern geschrieben.




In [None]:
name = 'Theo'
satz = f'Hallo, mein Name ist {name}.'
print(satz)

In [None]:
# Bisherige (umständlichere) Variante
name = 'Theo'
satzanfang = 'Hallo, mein Name ist '
satz = satzanfang + name + '.'
print(satz)

Mit f-Strings wird der Datentyp der Variablen automatisch erkannt und richtig formattiert.

In [None]:
name = 'Theo'
alter = 25
satz = f'Hallo, mein Name ist {name}. Ich bin {alter} Jahre alt.'
print(satz)

Und Werte können damit berechnet werden.

In [None]:
a = 32.91
b = 15.6211
ergebnis = f'Das Ergebnis ist {a + b}'
print(ergebnis)

In [None]:
# Das Ergebnis runden mit 2 Nachkommastellen
a = 32.91
b = 15.6211
ergebnis = f'Das Ergebnis ist {a + b:.2f}'
print(ergebnis)

In [None]:
# Kommas als Tausendermarkierung nutzen
wert = 1452775.1
satz = f'Die leserliche Zahl ist {wert:,}'
print(satz)

In [None]:
# Und die Kombination
wert = 1452775.112892311
satz = f'Die leserliche Zahl ist {wert:,.2f}'
print(satz)

In [None]:
# Wie oft kann Jeff sich X kaufen
vermoegen = 154500000000

dinge = input('Dinge: ')
kosten = input('Kosten:')

anzahl = vermoegen / float(kosten)

antwort = f'Bezos kann sich {anzahl:,.0f} {dinge} zum Preis von {kosten} € kaufen.'
print(antwort)


# Vorlesung 2: Strings, Methoden, Vergleichsoperatoren & Kontrollstrukturen

Wir automatisieren Texte und lernen dabei:

- mit strings und ihren Methoden umzugehen
- Vergleichsoperatoren und deren Verknüpfung
- neue Kontrollstrukturen, wie die if-else Bedingungen, kennen



# Automatisierte Wahlberichterstattung


- Ergebnisse der Landtagswahlen für jeden Wahlkreis und jede Gemeinde in NRW

- über 500 Artikel in unterschiedlichen Zuständen (Vorbericht, vorläufiges Ergebnis, amtliches Endergebnis)

- redaktionell ist dies am Wahlabend nicht umsetzbar




![Automatisierte Wahlberichterstattung - WDR](../imgs/wdr_autom_bericht.png)

# Los geht's...

In [None]:
titel = 'Wahlen in Leipzig'
print(titel)

In [None]:
# mit veränderbarem Stadtnamen
stadt = 'Görlitz'
titel = f'Wahlen in {stadt}'
print(titel)

In [None]:
stadt = 'Görlitz'
titel = f'Wahlen in {stadt}'
teaser = f'In {stadt} wurde heute gewählt. ...'
print(titel, teaser, sep='\n\n')


Wie können wir den Titel in Großbuchstaben ausgeben?

In [None]:
stadt = 'Görlitz'
titel = f'WAHLEN IN {stadt}'
teaser = f'In {stadt} wurde heute gewählt. ...'
print(titel, teaser, sep='\n\n')


In [None]:
stadt = 'Görlitz'
titel = f'Wahlen in {stadt}'
teaser = f'In {stadt} wurde heute gewählt. ...'
print(titel.upper(), teaser, sep='\n\n')


# Methoden


Methoden sind Funktionen, die aufgrund des Datentyps verfügbar sind.

Sie verändern ein Objekt oder berechnen neue Werte anhand der Objektdaten.



## Syntax:


Dem Objekt folgt ein Punkt, ein valider Methodenname, sowie runde Klammern.

Parameter Methoden können kein, ein oder mehrerer Argumente entgegen nehmen.


```
    objekt.methode()
    
    objekt.methode(arg1, arg2, arg3)
   
```



# String Methoden - Beispiele

| Methods  | Beschreibung  | 
|----------|:-------------  |
| lower() |  Converts a string into lower case |
| upper() |  Converts a string into upper case |
| strip() | Returns a trimmed version of the string |
| split() |	Splits the string at the specified separator, and returns a list |
| replace()	| Returns a string where a specified value is replaced with a specified value |
| format() |	Formats specified values in a string |


Mit `dir(<object>)` werden alle Methoden eines Objektes angezeigt.


In [None]:
# upper() - verwandelt einen string in Großbuchstaben
titel = 'Hello World'
print(titel.upper())

In [None]:
# strip() - löscht voranstehende oder nachfolgende Leerzeichen eines Textes
stadt = '   Landeshauptstadt Leipzig  '
print(stadt)
print(stadt.strip())

In [None]:
# split() - trennt einen String an einem Zeichen
kandidatin = 'Hahnenbach, Angelika'
nachname, vorname = kandidatin.split(',')
print(vorname, nachname)

In [None]:
# format() - ersetzt Platzhalter im String mit Werten
# alternative zu f-strings
text = 'Hallo ich bin {} und {} Jahre alt'.format('Kathrin', 27)
print(text)

In [None]:
# dir() zeigt alle verfügbaren Properties und Methoden eines Objektes an
dir('Beispiel String')

# Aufgabe für Zuhause:

Probiert die unterschiedlichen string Methoden aus und schaut was genau passiert und ob Argumente benötigt werden.

## Zurück zu den automatisierten Wahltexten..

...diesmal mit .format() anstatt f-strings

In [None]:
# Titel und Teaser
stadt = 'Görlitz'

titel = 'Wahlen in {}'.format(stadt)
teaser = 'In {} wurde heute gewählt.'.format(stadt)

print(titel, teaser, sep='\n\n')

In [None]:
# Text
kandidatin = 'Marianne Klingenstein'
prozent = 37.4

text = '{} gewinnt mit {} Prozent der Stimmen.'.format(kandidatin, prozent)

print(text)

In [None]:
artikel = teaser + text

print(titel.upper(), artikel, sep='\n\n')

In [None]:
artikel = teaser + ' ' + text

print(titel.upper(), artikel, sep='\n\n')

## Was wenn mehrere Kandidat:innen antreten?

In [None]:
kandidatin1 = 'Helmut Wiese'
prozent1 = 36.7

kandidatin2 = 'Gundula Lobrecht'
prozent2 = 17.4

text = '{} gewinnt mit {} Prozent der Stimmen.'

if prozent1 > prozent2:
    text = text.format(kandidatin1, prozent1)
else:
    text = text.format(kandidatin2, prozent2)
    
print(text)


# Kontrollstrukturen: if - else Fallunterscheidung


Bei der *if-Bedingung* wird ein Teil des Codes nur dann ausgefüllt falls eine Bedingung erfüllt ist.

Anders gesagt: "Wenn dies, dann mach das". 

### Syntax

`if` ist das Schlüsselwort für die Fallunterscheidung. Dahinter folgt die eigentlich Bedingung, die ein Wahrheitswert (Boolean: entweder `True` oder `False` sein muss.
Eingerückt befindet sich der Code der ausgeführt wird, falls die Bedingung zu `True` evaluiert.





![if](../imgs/if.png)

In [None]:
# Wenn die Person älter als 18, gebe "Person ist volljährig" aus
alter = 18
if alter >= 18:
    print('Person ist volljährig')

In [None]:
# Wenn eine Zahl durch 2 teilbar ist, gib "Zahl ist gerade" aus
zahl = 31
if (zahl % 2) == 0:
    print('Zahl ist gerade')


## if-else - Bedingung 


Bei der *if-else* Bedingung wird zusätzlich zur *if* Bedingung, eine andere Anweisung ausgeführt falls die Bedingung nicht `True` ist.


Anders gesagt: "Wenn dies, dann führe Option 1 aus, wenn nicht Option 2".  



### Syntax


```

if <bedingung>:
    # Code falls Bedingung True
else:
    # Code falls Bedingung False

```


### Beispiele

In [None]:
# Gib an ob eine Person volljährig ist oder nicht
alter = 14
if alter >= 18:
    print('Person ist volljährig.')
else:
    print('Person ist minderjährig.')

In [None]:
# Teile zwei Zahlen durcheinander. Gib eine Fehlermeldung falls der Zähler = 0 ist
a = 20
b = 0
if b != 0:
    print(a/b)
else:
    print('Achtung: durch 0 kann man nicht teilen!')

## Zurück zur Wahlberichterstattung:

In [None]:
kandidatin1 = 'Helmut Wiese'
prozent1 = 36.7

kandidatin2 = 'Gundula Lobrecht'
prozent2 = 17.4

text = '{} gewinnt mit {} Prozent der Stimmen.'

if prozent1 > prozent2:
    text = text.format(kandidatin1, prozent1)
else:
    text = text.format(kandidatin2, prozent2)
    
print(text)


## Was passiert bei Gleichstand?

In [None]:
kandidat1 = 'Helmut Wiese'
prozent1 = 29.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 29.5

text = '{} gewinnt mit {} Prozent der Stimmen.'

if prozent1 > prozent2:
    text = text.format(kandidat1, prozent1)
else:
    text = text.format(kandidat2, prozent2)
    
print(text)


In [None]:
kandidat1 = 'Helmut Wiese'
prozent1 = 29.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 29.5

text = '{} gewinnt mit {} Prozent der Stimmen.'

if prozent1 > prozent2:
    text = text.format(kandidat1, prozent1)
elif prozent1 < prozent2:
    text = text.format(kandidat2, prozent2)
else:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
    
print(text)



## Fallunterscheidung mit mehreren Bedingungen: elif 

Mit *elif* können mehr als zwei Bedingungen überprüft und zur Ausführung von unterschiedlichen Anweisungen führen. 

Das Schlüsselwort ist zusammengesetzt aus *else* und *if*. Das heißt, die Anweisung wird nur ausgeführt wenn die vorherige Bedingung `False`wahr und die jetzige Bedingung `True` ist.
  


### Syntax


```

if <bedingung1>:
    # Code falls Bedingung True
elif <bedingung2>:
    # Code falls Bedingung1 = False und Bedingung2 = True
else:
    # Code falls Bedingung1 = False und Bedingung2 = False

```


Es können beliebig viele *elif*-Bedingungen eingebaut werden.


- **if** ist notwendig
- **elif** optional, auch mehrere möglich
- **else** optional, nur eine else Bedingung möglich







![elif](../imgs/elif.png)

### Ausführung

Jede Bedingung wird nacheinander abgearbeitet. Das Schema ist wie folgt:

Die Bedingung wird evaluiert falls diese

- **wahr** (`True`) ist: führe die Anweisung aus und überspringe alle anderen Bedingungen

- **falsch** (`False`) ist: springe zur nächsten Bedingung


### Beispiele

In [None]:
# Beispiele if - else Bedingung

x = 10

if x == 0:
    print('x ist Null.')
elif x > 0:
    print('x ist postiv.')
else:
    print('x ist negativ.')

In [None]:
# Temperatureinordnung
grad = 12
if grad > 30:
    print('Vieeel zu heiß!')
elif grad >= 25:
    print('Angenehm warm: Pack die Badehose ein.')
elif grad >= 12:
    print('Bestes Wanderwetter.')
elif grad > 0:
    print("Kalt... Aber wozu gibt's warme Klamotten?")
else:
    print('Brrrrrrrrrr')


## Vergleichsoperatoren

Vergleichsoperatoren helfen Werte miteinander zu vergleichen. Vergleiche evaluieren immer zu Wahrheitswerten (`Boolean`).

| Operator  | Beschreibung  | 
|----------|:-------------  |
| == |  ist gleich |
| != |  ist ungleich |
| > | ist größer |
| < | ist kleiner |
| >=	| ist größer oder gleich |
| <= |	ist kleiner oder gleich|





# Vergleichsoperatoren - Beispiele

In [None]:
# Gleichheit
print(3 == 5)

In [None]:
# Ungleichheit
a = 4
b = 7
var = a != b
print(var)
print(type(var))

In [None]:
str1 = 'wuasfieamasnfee'
str2 = 'wuasfieamosnfee'
print(str1 == str2)


## Boolean (logische) Operatoren

Mit logische Operatoren können mehrere Vergleiche miteinander verknüpft werden.
Dafür gibt es die Operatorn `and` (und) und `or` (oder).
 

`not` ist ein Operator der den Wert umkehrt.
Also aus `True` wird `False` und umgekehrt.

In [None]:
# Verknüfung mit and
a = 3
b = -1
if a > 0 and b > 0:
    print('Beide Werte sind positiv.')

In [None]:
# Verknüpfung mit or
if a > 0 or b > 0:
    print('Mindestens ein Wert ist positiv.')

In [None]:
# not
var = True
print(var)
print(not var)

# Zurück zu den automatisierten Wahltexten

In [None]:
kandidat1 = 'Helmut Wiese'
prozent1 = 29.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 29.5

text = '{} gewinnt mit {} Prozent der Stimmen.'

if prozent1 > prozent2:
    text = text.format(kandidat1, prozent1)
elif prozent1 < prozent2:
    text = text.format(kandidat2, prozent2)
else:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
    
print(text)


In [None]:
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 9.25

kandidat2 = 'Gundula Lobrecht'
prozent2 = 41.5

text = '{} gewinnt mit {} Prozent der Stimmen.'

if prozent1 > prozent2:
    text = text.format(kandidat1, prozent1)
elif prozent1 < prozent2:
    text = text.format(kandidat2, prozent2)
else:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
    

print(titel.upper(), text, sep='\n\n')


## Ein bisschen mehr Kontext...

Wie groß ist der Vorsprung der führenden Kandidatin oder des führenden Kandidaten?

In [None]:
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 59.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 49.5

text_gewinner = '{} gewinnt mit {} Prozent der Stimmen.'
text_vorsprung = 'Dies entspricht einem Vorsprung von {} Prozentpunkten zu {}.'

if prozent1 > prozent2:
    vorsprung = prozent1 - prozent2
    text_vorsprung = text_vorsprung.format(vorsprung, kandidat2)
    text_gewinner = text_gewinner.format(kandidat1, prozent1)   
elif prozent1 < prozent2:
    vorsprung = prozent2 - prozent1
    text_vorsprung = text_vorsprung.format(vorsprung, kandidat1)
    text_gewinner = text.format(kandidat2, prozent2)   
else:
    text_vorsprung = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text_gewinner = text.format(kandidat1, kandidat2, prozent1)
    
print(titel.upper(), text_gewinner + ' ' + text_vorsprung, sep='\n\n')


# Neu strukturiert...

In [None]:
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 29.8
kandidat2 = 'Gundula Lobrecht'
prozent2 = 32.7

if prozent1 == prozent2:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
else:
    text_gewinner = '{} gewinnt mit {} Prozent der Stimmen.'
    text_vorsprung = ' Dies entspricht einem Vorsprung von {} Prozentpunkten.' 
    gewinner = kandidat1
    gewinner_prozent = prozent1
    vorsprung = round(prozent1 - prozent2, 1)
    
    if prozent2 > prozent1:
        gewinner = kandidat2
        gewinner_prozent = prozent2
        vorsprung = round(prozent2 - prozent1, 1)

    text_gewinner = text_gewinner.format(gewinner, gewinner_prozent)
    text_vorsprung = text_vorsprung.format(vorsprung)
    text = text_gewinner + text_vorsprung
        
print(titel.upper(), text, sep='\n\n')

# Ein bisschen mehr Kontext
Wie kann der Vorsprung von dem:der Erstplatzierten zu dem:der Zweitplatzierten bewertet werden?

Ist er minimal, knapp oder erheblich?

In [None]:
# Und noch ein bisschen Kontext
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 29.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 28.7


if prozent1 == prozent2:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
else:
    text = '{} gewinnt mit {} Prozent der Stimmen.'
    vorsprung = ' Dies ist ein {} Vorsprung von {} Prozentpunkten.'
    gewinner = kandidat1
    prozent = prozent1
    differenz = prozent1 - prozent2
    
    if prozent2 > prozent1:
        gewinner = kandidat2
        prozent = prozent2
        differenz = prozent2 - prozent1
        
    text = text.format(gewinner, prozent)
    
    # bestimme das Ausmaß des Abstands zwischen Gewinner:in und Zweitplatzierter:m
    differenz = round(differenz, 1)
    
    if differenz >= 0 and differenz <= 1:
        ausmass = 'minimaler'
    elif differenz > 1 and differenz < 3:
        ausmass = 'knapper'
    elif differenz >= 3 and differenz < 5:
        ausmass = ''
    elif differenz >= 5:
        ausmass = 'erheblicher'
    vorsprung = vorsprung.format(ausmass, differenz)
    
article = text + vorsprung + amtsinhaber    
print(titel, article, sep='\n\n')


# Ein bisschen mehr Kontext..

Ein Satz zum:zur neuen Amtsinhaber:in der Stadt

In [None]:
# Und noch ein bisschen Kontext
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 29.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 28.7


if prozent1 == prozent2:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
else:
    text = '{} gewinnt mit {} Prozent der Stimmen.'
    vorsprung = ' Dies ist ein {} Vorsprung von {} Prozentpunkten.'
    gewinner = kandidat1
    prozent = prozent1
    differenz = prozent1 - prozent2
    
    if prozent2 > prozent1:
        gewinner = kandidat2
        prozent = prozent2
        differenz = prozent2 - prozent1
        
    text = text.format(gewinner, prozent)
    
    # bestimme das Ausmaß des Abstands zwischen Gewinner:in und Zweitplatzierter:m
    differenz = round(differenz, 1)
    
    if differenz >= 0 and differenz <= 1:
        ausmass = 'minimaler'
    elif differenz > 1 and differenz < 3:
        ausmass = 'knapper'
    elif differenz >= 3 and differenz < 5:
        ausmass = ''
    elif differenz >= 5:
        ausmass = 'erheblicher'
    vorsprung = vorsprung.format(ausmass, differenz)
    
    amtsinhaber = ' {} wird neuer Bürgermeister von {}.'
    amtsinhaber = amtsinhaber.format(gewinner, stadt)
    
article = text + vorsprung + amtsinhaber    
print(titel, article, sep='\n\n')


Und jetzt noch korrekt gegendert...

In [None]:
# Und noch ein bisschen Kontext
stadt = 'Görlitz'
titel = 'Wahlen in {}'.format(stadt)

kandidat1 = 'Helmut Wiese'
prozent1 = 29.5

kandidat2 = 'Gundula Lobrecht'
prozent2 = 38.7


if prozent1 == prozent2:
    text = 'Die Wahl ist unentschieden. {} und {} erhalten beide {} Prozent der Stimmen.'
    text = text.format(kandidat1, kandidat2, prozent1)
else:
    text = '{} gewinnt mit {} Prozent der Stimmen.'
    vorsprung = ' Dies ist ein {} Vorsprung von {} Prozentpunkten.'
    gewinner = kandidat1
    prozent = prozent1
    differenz = prozent1 - prozent2
    
    if prozent2 > prozent1:
        gewinner = kandidat2
        prozent = prozent2
        differenz = prozent2 - prozent1
        
    text = text.format(gewinner, prozent)
    
    # bestimme das Ausmaß des Abstands zwischen Gewinner:in und Zweitplatzierter:m
    differenz = round(differenz, 1)
    
    if differenz >= 0 and differenz <= 1:
        ausmass = 'minimaler'
    elif differenz > 1 and differenz < 3:
        ausmass = 'knapper'
    elif differenz >= 3 and differenz < 5:
        ausmass = ''
    elif differenz >= 5:
        ausmass = 'erheblicher'
    vorsprung = vorsprung.format(ausmass, differenz)
    
    amtsinhaber = ' {} wird neuer Bürgermeister von {}.'
    amtsinhaber = amtsinhaber.format(gewinner, stadt)
    if gewinner == kandidat2:
        amtsinhaber = amtsinhaber.replace('neuer Bürgermeister', 'neue Bürgermeisterin')
    
article = text + vorsprung + amtsinhaber    
print(titel, article, sep='\n\n')


# Zeit für Feedback



Link: https://ahaslides.com/76EMY

![Feedback QR Code](../imgs/qrcode_vl2.png)

