# Block 1: Python-Grundlagen

In diesem ersten Dossier wirst Du lernen, erste kurze Skripte in der Python-Programmiersprache zu schreiben. Dazu werden die grundlegenden Konzepte der Programmiersprache vermittelt.
Folgende Lernziele sind zu erreichen:
- Du bist mit dem Nutzen von Python vertraut.
- Du bist mit den grundlegenden Datentypen vertraut.
- Du kannst die `if/else`-Klausel verwenden.
- Du kannst mit `for` und `while` √ºber Listen iterieren.
- Du bist mit dem Konzept von Klassen und Funktionen bekannt.

# Was ist Python?
Python ist eine von vielen Programmiersprachen, die verwendet werden k√∂nnen, um Programme zu schreiben. Heute ist Python die am weitesten gebr√§uchliche Programmiersprache weltweit. Gerade f√ºr komplette Neuanf√§nger ist sie beliebt, da der Code sehr intuitiv zu verstehen ist und Python viele Dinge implizit erledigt, die Benutzer bei anderen Sprachen selbst umsetzen m√ºssen. Auch unter erfahrenen Benutzern hat Python den Vorteil, dass es schnell zu schreiben ist und eine grosse Zahl von externen Bibliotheken anbietet, wodurch man komplexe Prozesse nicht selbst programmieren muss. Insbesondere mit der Verbreitung von Machine-Learning-Applikationen hat Python an Beliebtheit gewonnen, da es einen einfachen Zugang zu diesen Technologien bietet. Die gr√∂sste Schw√§che von Python, zumindest in gewissen Anwendungsbereichen, ist die Geschwindigkeit. Sprachen wie C sind erheblich schneller bei komplexen Berechnungen. Dieses Problem wird aber meist dadurch gel√∂st, dass z.B. eine Bibliothek f√ºr Machine Learning in C geschrieben ist, aber per Python verwendet werden kann.

Python kann f√ºr verschiedenste Applikationen verwendet werden, zum Beispiel: Backend f√ºr Webapplikationen, Datenanalyse, Machine Learning, einfach mathematische Operationen, Textanalysen, Umgang und Umwandlung von Daten im Format von XML, JSON, etc. und viele mehr.

# Python als Taschenrechner
Eine sehr intuitive Funktion von Python ist zum Beispiel, Dinge zu berechnen. F√ºhre den folgenden Codeblock aus, indem du auf das Play-Symbol oben rechts am Block dr√ºckst.

In [None]:
print(5 + 8)

print(7 - 6)

print(12 * 3)

Durch print() k√∂nnen wir jeweils sehen, was ein *Ausdruck* (Expression), z.B. eine mathematische Operation, zur√ºck gibt. Wie du ausserdem beobachten kannst, wird der Code von oben nach unten ausgef√ºhrt und der Output ist entsprechend sortiert. Um Python aber wirklich zu verwenden, m√ºssen wir auf *Variabeln* zur√ºckgreifen. Im n√§chsten Beispiel siehst du *Anweisungen* (Statements) in denen, Zahlen Variabeln zugewiesen werden. Wir k√∂nnen diese Variabeln dann sp√§ter im Code abrufen, z.B. um mit ihnen zu rechnen.

Tipp: In Jupyter Notebooks und VSCode kannst du die existierenden Variabeln und die ihnen zugewiesenen Werte jederzeit ansehen indem du in der Kopfzeile auf "Jupyter Variables" dr√ºckst. Wichtig: Variabeln sind im ganzen Notebook abrufbar, nicht nur in der jeweiligen Zelle!

In [None]:
# Probier es aus! (alles hinter einem # ist ein Kommentar und wird bei der Ausf√ºhrung ignoriert)
a = 4
b = 5

print(a + b)  # print() gibt jeweils aus, was in den Klammern steht

Wir k√∂nnen sogar Variabelzuweisung und rechnen kombinieren, zum Beispiel so:

In [None]:
a = 4
a += 5  # dasselbe als h√§tten wir a = a + 5 eingegeben

print(a)

Probiere gleich mal, den Codeblock anzupassen und verschiedene Dinge zu rechnen! Eine √úbersicht an arithmetischen Operatoren findest du [hier](https://www.geeksforgeeks.org/python/python-arithmetic-operators/). 

## Funktionen verwenden
Vielleicht kennst Du aus Excel auch schon Funktionen. Funktionen sind vorbereitete Prozesse: Man gibt etwas in sie hinein (sogenannte *Parameter*) und bekommt etwas heraus (den *return*-Wert). Das Modul *[math](https://docs.python.org/3/library/math.html)* beinhaltet eine grosse Zahl von vorbereiteten Funktionen, die man zum Rechnen verwenden kann. 

Bei *math* handelt es sich um ein *built-in* Modul, das bedeutet, dass es immer zusammen mit Python auf eurem Ger√§t installiert wird. Es wird aber nicht automatisch *importiert*.
Wollen wir zum Beispiel eine Wurzel ziehen, k√∂nnen wir das folgendermassen tun:

In [None]:
import math  # wir laden das Modul

zahl = 54

wurzel = math.sqrt(zahl)  # wir geben zahl als Parameter in die Wurzelfunktion von Math

print(wurzel)

Du hast nun auch bereits zwei Datentypen kennengelernt! Ganzzahlige Werte heissen **integer** und alles mit Dezimalzahlen sind **float**-Typen. 

## √úbung: Der Satz des Pythagoras
Versuche nun das Gelernte zu Kombinieren, um im folgenden Codeblock die L√§nge der Hypotenuse zu berechnen. Zur Erinnerung:

*Sind a, b  und c die Seitenl√§ngen eines rechtwinkligen Dreiecks, wobei a und b die L√§ngen der Katheten sind und c die L√§nge der Hypotenuse ist, so gilt $a^{2}$ + $b^{2}$ = $c^{2}$*

In [None]:
kathete_a = 23
kathete_b = 15

hypothenuse = # dein Code hier

In [None]:
# Kontrolliere dein Resultat
print(hypothenuse == 27.459060435491963)

Falls hier ein True als Output erscheint, hast du es geschafft, bravo!

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/pythagoras.py

## Mehrere Zahlen aufs Mal: Listen
Oft reicht es aber nicht, eine einzelne Zahl in einer einzelnen Variable abzuspeichern. Sehen wir uns einen neuen Datentypen an, die *Liste* (list). Listen erm√∂glichen uns, andere Objekte, zum Beispiel Zahlen, in einer Sequenz zu erfassen und bei Bedarf abzurufen.

In [None]:
# Eine Liste wird durch eckige Klammern markiert
noten = [4, 5, 5, 4.5, 3.5, 5.5, 4]

Listen sind genau so Objekte wie es auch integer und floats sind. Wir k√∂nnen sie also zum Beispiel als Parameter verwenden:

In [None]:
noten_summe = sum(noten)

print(noten_summe)

Einzelne Elemente k√∂nnen wir uns folgendermassen ansehen:

In [None]:
print(noten[3])

Sortierte sequentielle Objekte (nicht nur Listen) speichern ihren Inhalt unter sogenannten *Indizes*. Wir k√∂nnen also einen integer als Index eingeben, um ein Element an einer bestimmten Position in der Liste abzurufen. Umgekehrt k√∂nnen wir auch den Index abrufen von einem Element in der Liste.

In [None]:
print(noten.index(3.5))

Beachte, dass der Index immer bei 0 beginnt! Wenn eine Liste also zum Beispiel 8 Elemente enth√§lt, dann hat das letzte Element den Index 7. Wir k√∂nnen den Index √ºbrigens auch r√ºckw√§rts abrufen, so:

In [None]:
print(noten[-2])

Es gibt einen Haufen [Funktionen, mit denen wir Listen manipulieren k√∂nnen](https://www.w3schools.com/python/python_ref_list.asp):

In [None]:
# Zum Beispiel k√∂nnen wir Objekte hinzuf√ºgen
noten.append(6)

# oder Objekte entfernen
noten.remove(3.5)

# alle Elemente umdrehen
noten.reverse()

# oder die Elemente sortieren
noten.sort()

print(noten)  # Verschiebe das Print-Statement oder kommentiere Zeilen aus um die Ver√§nderungen der Liste zu beobachten

Ausserdem gibt es eine Reihe von [*built-in* Funktionen](https://docs.python.org/3/library/functions.html), welche Informationen aus Listen abrufen oder sie anderweitig als Parameter nutzen. Meistens k√∂nnen diese Funktionen auch andere sequentielle Objekte als Parameter annehmen (wir werden weitere bald kennenlernen). Hier ein paar Beispiele:

In [None]:
noten = [4, 5, 5, 4.5, 3.5, 5.5, 4]  # wir setzen die Notenliste nochmal zur√ºck, indem wir die Variable √ºberschreiben

summe = sum(noten)
print("Summe", summe)

anzahl = len(noten)
print("Anzahl", anzahl)

sortierte_noten = sorted(noten)
print("Sortiert:", sortierte_noten)

Built-in Funktionen m√ºssen im Gegensatz zu den oben genannten *math*-Funktionen nicht erst importiert werden. Sie sind so √ºblich und wichtig, dass sie immer verf√ºgbar sind.

Beachte, dass es sich bei Listen **nicht** um Vektoren handelt und sie sich nicht f√ºr Vektormathematik handelt. Siehe z.B. was passiert, wenn wir zwei Listen zusammenrechnen:

In [None]:
klasse_a = [4, 5, 5, 4.5, 3.5, 5.5, 4]
klasse_b = [3, 6, 4.5, 4, 4, 4.5, 5.5]

gesamt = klasse_a + klasse_b

print(gesamt)

F√ºr Vektoroperationen empfiehlt sich das externe Modul [numpy](https://numpy.org/). Damit k√∂nnen Listen zu Arrays umgewandelt werden, welche dann als mathematische Vektoren funktionieren.

## Ver√§nderliche und Unver√§nderliche Objekte
Dir ist vielleicht schon aufgefallen, dass wir nun zwei Funktionen gesehen haben, die eine Liste sortieren. Ist dir schon aufgefallen, wie sie sich unterscheiden? Bevor du weiterliest, √ºberlege dir, was die Unterschiede sind. Probiere dazu den Code anzupassen.



<details>
<summary>Wenn du bereit bist, klicke hier um die Antwort zu lesen</summary>

Bei *noten.sort()* handelt es sich um eine **in-place Manipulation**. Das bedeutet, die Funktion besitzt keinen *return-Wert*, sondern ver√§ndert direkt die Liste, von der aus die Funktion ausgef√ºhrt wird (in diesem Fall also die Liste, auf welche die Variable *noten* verweist). 

Bei *sorted(noten)* hingegen handelt es sich um eine **out-of-place Manipulation**. Diese erstellt eine neue Liste, bzw. kopiert die alte Liste, und wendet die Sortierung nur auf die neue Liste an, die alte wird gelassen, wie sie ist.
</details>


Um dieses Ph√§nomen weiter zu verstehen, ist es wichtig etwas genauer dar√ºber zu sprechen, was Variabeln eigentlich sind. Variabeln sind eigentlich Verweise (Pointer) auf Objekte. In manchen F√§llen sind diese Objekte sogenannte *primitive* Datentypen, z.B. integer und floats. In dem Fall hat eine Variable wirklich einfach einen *Wert*. Dieser Wert kann eigentlich auch nicht ver√§ndert werden im Sinne davon wie sich eine Liste ver√§ndert, wenn man sie in-place sortiert, die Variable kann nur mit einem neuen Wert √ºberschrieben werden. Wir nennen solche Datentypen dann *unver√§nderlich* (non-mutable). Dazu geh√∂ren neben primitiven Datentypen auch noch ein paar andere, die wir noch kennenlernen werden.

Die allermeisten Python-Objekte, darunter auch Listen, sind jedoch *ver√§nderlich* (mutable). 

Am beste veranschaulichen l√§sst sich das an einem Beispiel:

In [None]:
# Unver√§nderlich
a = 5
b = a

b = b + 1

print(a)
print(b)

In [None]:
# Ver√§nderlich
a = [1, 2]
b = a

b.append(3)

print(a)
print(b)

Obwohl wir nur die Variable *b* ver√§ndern in unserem zweiten Beispiel ist pl√∂tzlich auch *a* ver√§ndert worden. Das liegt daran, dass a und b schlussendlich auf das selbe Objekt verweisen, und jede Ver√§nderung betrifft dementsprechend beide Variabeln. Also was machen, wenn wir unsere Liste zwar kopieren, aber zwei unabh√§ngige Kopien wollen? Dazu gibt es die copy()-Funktion:

In [None]:
a = [1, 2]
b = a.copy()

b.append(3)

print(a)
print(b)

## √úbung: Durchschnitt berechnen
- Schreibe eine Liste mit mindestens drei Werten
- Berechne den Durchschnitt der Werte in deiner Liste

In [None]:
# Deine Liste mit Werten
werte = 

# Berechne hier den Durchschnitt
durchschnitt = 

# Gib das Ergebnis aus
print(durchschnitt)

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/durchschnitt.py

## √úbung: Distanz berechnen
In dieser √úbung nehmen wir an, Du m√∂chtest die Distanz zwischen zwei Punkten in einem Koordinatensystem berechnen.

Zur Erinnerung:
Die Formel zum Errechnung der Distanz zwischen zwei Punkten lautet:
$\sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}$

In [None]:
punkt_a = [2, 5]
punkt_b = [7, 1]

# Berechne hier die Entfernung
abstand = 

print(abstand)

In [None]:
# kontrolliere dein Resultat
print(abstand == 6.4031242374328485)

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/distanz.py

# Kurze Pause vom Programmieren
Nun hast du eigentlich schon eine Menge der Grundlagen gelernt. Damit ist es Zeit, uns kurz vom Code zu entfernen und ein paar Dinge um das Programmieren herum zu besprechen.

## Styleguide
Es empfiehlt sich, aus Gr√ºnden der Lesbarkeit, insbesondere falls andere Personen mit eurem Code arbeiten sollen, den offiziellen Styleguide zu beachten: https://peps.python.org/pep-0008/

Dieser erteilt Empfehlungen, wie z.B. Variablen benannt werden sollten oder ob Leerschl√§ge zwischen Operatoren und Variablen gemacht werden sollten.
Ihr m√ºsst euch diesen Styleguide jetzt nicht durchlesen, kommt aber dazu zur√ºck nachdem ihr dieses Dossier durchgearbeitet habt, und schaut ihn euch mal grob durch.

## Hilfe, ich habe ein Problem!

![ein Meme](./Materialien/meme.jpg)

Man k√∂nnte argumentieren, dass Googeln die wichtigste F√§higkeit einer jeden Programmier:in ist. Nat√ºrlich stimmt das nicht ganz, aber keine Programmierer:in weiss alles √ºber Python und selbst grundlegende Codebl√∂cke wird man oft nachschlagen. Die wichtigsten Ressourcen, die euch begleiten werden, sind die folgenden:

[Python Documentation](https://docs.python.org/3/)

Die Python-Dokumentation ist absolut essentiell, gerade f√ºr Anf√§nger. Zu Beginn mag die Dokumentation √ºberw√§ltigend erscheinen, aber mehr Konzepte man versteht, desto einfach wird sie zu lesen sein. Ich m√∂chte euch ermutigen, wann immer m√∂glich bei Fragen erstmal mit der Dokumentation zu arbeiten und versuchen, die Antwort darin zu finden. Die Dokumentation enth√§lt zahlreiche Code-Beispiele zur Anwendung aller Elemente der Standardbibliothek (der Teil von Python, der immer installiert ist mit Python zusammen). Ich werde Referenzen zur Dokumentation in den entsprechenden Abschnitten hinterlegen, so dass ihr die relevanten Teile schnell finden k√∂nnt.

[Stackoverflow](https://stackoverflow.com/)

Stackoverflow ist der Grund, wieso Programmierer:innen sich spasseshalber manchmal nur als Experten im copy&pasten von Code bezeichnen. √úber Google findet man in diesem Frage-Antwort-Forum fast auf jede Frage zum Programmieren eine Antwort, egal ob es eine breite Frage zu den Grundlagen ist, oder eine extrem spezifische zu irgendwelchen externen Bibliotheken. Und wenn die Frage noch nie beantwortet wurde, kann man sie einfach stellen! Falls ihr Stackoverflow-Code verwendet, stellt immer sicher, dass ihr versteht, was der Code, den ihr kopiert habt, tut.

[KI-Assistenz](https://github.com/features/copilot)

In den Zeiten von ChatGPT kann man die KI-Assistenten nicht mehr weglassen in einer solchen Aufz√§hlung. Das hier verlinkte Github-Copilot ist spezialisiert darauf, beim Programmieren zu helfen, w√§hrend auch allgemeine Chatbots wie ChatGPT gut einfache Codebl√∂cke oder einfache Skripte schreiben k√∂nnen. Hier gilt aber nat√ºrlich, wie immer bei LLMs, dass sie gerne mal Fehler machen.

F√ºr Programmieranf√§nger w√ºrde ich auf keinen Fall empfehlen, euch Skripte einfach schreiben zu lassen. Am besten nutzt ihr LLMs f√ºr drei Funktionen:
- Debugging: Ihr gebt dem LLM euren Code, wenn ihr einen Fehler drin habt und ihn nicht beheben k√∂nnt.
- Verbesserung: Ihr gebt dem LLM euren Code, auch wenn er funktioniert, und fragt nach, wie ihr ihn optimieren k√∂nntet.
- Erkl√§rung: Ihr seht Code in einer Musterl√∂sung, findet Code auf Stackoverflow, oder vielleicht auch eine Funktion aus der Dokumentation, aber ihr versteht einfach nicht, wie es genau funktioniert. LLMs sind grossartig, um es euch dann genauer zu erkl√§ren.

Bedankt einfach immer, diese LLMs sind nicht perfekt - seht euch immer zuerst die Dokumentation an und/fragt bei Bedarf den Dozierenden oder Tutor:innen.

[Externe Dokumentation](https://lxml.de/)

Hier als Beispiel die Dokumentation der Bibliothek `lxml`, welche die M√∂glichkeiten im Umgang mit XML-Dateien erweitert. Bei externen Bibliotheken handelt es sich um Code-Pakete, die nicht zusammen mit Python auf eurem Ger√§t installiert werden. Wie solche Pakete installiert werden, zeige ich im n√§chsten Kapitel.

## Externe Packages
Bei externen Bibliotheken handelt es sich um Code-Pakete, die nicht zusammen mit Python auf eurem Ger√§t installiert werden. `lxml`, das grossartig ist, wenn man mit XML-Dateien arbeitet, oder `numpy`, f√ºr wissenschaftlich-mathematische Funktionalit√§ten, wurden bereits genannt. Python Module werden √ºber den Package Manager `pip` verwaltet. Wenn ihr die Packages wie hier gezeigt installiert, werden sie jeweils nur in eurem Virtual Environment installiert. Es ist gute Praxis ein Virtual Environment pro Projekt zu verwenden, denn manchmal h√§ngen Module wiederum von anderen Modulen mit bestimmten Versionen ab und es kann zu Konflikten zwischen diesen Abh√§ngigkeiten kommen. Ihr k√∂nnt installierte Module in eurem Python-Tab bei VSCode auch einsehen.

In [None]:
# Downloaden von lxml auf den PC √ºber pip
%pip install lxml

# Diese Form von Installation funktioniert nur in Notebooks.
# Ansonsten m√ºsst ihr Module √ºber das Terminal installieren (dasselbe Kommando nur ohne %)

In [None]:
# Importieren der Bibliothek f√ºr das entsprechende Skript
import lxml

print(lxml.__version__)

# Python und Text
Python ist eine √§usserst gut geeignete Programmiersprache f√ºr die Manipulation von Text. Text wird in Python durch den primitiven Datentypen **string** (kurz: str) repr√§sentiert. Wie Listen, sind Strings sequentielle Datentypen und teilen einige Eigenschaften. Bedenke, dass Strings als primitive Datentypen unver√§nderlich sind. Erg√§nze die folgende Zelle mit dem entsprechenden Code:

In [None]:
text = "Es ist so toll an der Zentralbibliothek Z√ºrich programmieren zu lernen!"

# Wie lang ist der Text?
textlaenge = 
print(textlaenge)

# Welches ist das 16. Zeichen im Text?
zeichen_16 = 
print(zeichen_16)

# An welchem Index kommt zum ersten Mal ein √º vor?
erstes_ue = 
print(erstes_ue)

# Wer muss den Text schon versteht? Sortiert mal lieber die Buchstaben!
sortierte_zeichen = 
print(sortierte_zeichen)

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/strings.py

<details>
<summary>Klicke hier f√ºr eine Erl√§uterung zur L√∂sung</summary>

Verwundert dich das Ergebnis zur Sortierung? Sorted() nimmt zwar quasi jedes sequentielle Objekt als Parameter an (bisher kennt ihr Strings und Listen, es gibt noch einige mehr), aber gibt *immer* eine Liste zur√ºck.
</details>

Strings verf√ºgen nat√ºrlich auch √ºber [ein eigenes Arsenal an Funktionen, mit denen wir Text manipulieren k√∂nnen](https://www.w3schools.com/python/python_ref_string.asp). In der n√§chsten Zelle sind einige der am meisten verwendeten gezeigt:

In [None]:
text = "Es ist so toll an der Zentralbibliothek Z√ºrich programmieren zu lernen!"

# Gross- / Kleinschreibung
uppercase = text.upper()
print("Alles gross:", uppercase)
lowercase = text.lower()
print("Alles klein:", lowercase)

# Entfernen von Zeichen, z.b. Satzendungen
clean = text.rstrip("!")
clean = text.replace("e", "")
print("Gefilterter Text:", clean)

Oft ist es notwendig oder praktisch, aus Texten Listen von Strings zu machen. Zum Beispiel um W√∂rter in einzelne Elemente zu trennen:

In [None]:
words = text.split()
print("W√∂rter:", words)

Beachte, dass *split()* eine sehr primitive Methode f√ºr diese spezifische Aufgabe ist. Wie Du sehen kannst, wird zum Beispiel das "!" nicht getrennt, denn *split()* trennt per default die Zeichen einfach an Whitespaces, also Leerschl√§gen, Zeilenumbr√ºchen, etc. F√ºr echte Tokenisierung werden oft externe Bibliotheken wie [spacy](https://spacy.io/), [nltk](https://www.nltk.org/) oder komplexe Regex-Ausdr√ºcke verwendet. F√ºr den Moment reicht uns diese Methode aber mal. 

Wie k√∂nnen wir strings wieder in Listen zusammensetzen? Mit der *join()*-Methode:

In [None]:
text = " ".join(words)
print("Text:", text)

## Slicing
Im Listen-Kapitel wurde bereits √ºber Indices gesprochen. Python besitzt eine sehr tolles Feature, welches noch einen Schritt weiter geht: Slicing. Damit k√∂nnen wir aus einer Liste oder einem String eine neue Liste oder einen String herausschneiden.

In [None]:
# Einen Substring auslesen
erster_teil = text[0:41]
print(erster_teil)

# Wir k√∂nnen die 0 auch weglassen:
erster_teil = text[:41]
print(erster_teil)

# Wenn wir von einem Index bis zum Ende der Sequenz auslesen wollen:
zweiter_teil = text[41:]
print(zweiter_teil)

## String-Formattierung
Oft m√ºssen wir einen String auf Basis von irgendwelchen anderen Variablen anpassen. Dazu gibt es verschiedene M√∂glichkeiten. Die offensichtliche ist erstmal, den String einfach mit einem + mit der neuen Variable zu verbinden:

In [None]:
text = "Es ist so toll an der Zentralbibliothek Z√ºrich programmieren zu lernen!"
zusaetzlicher_text = "Ich liebe Python!"

gesamter_text = text + zusaetzlicher_text

print(gesamter_text)

Das ist aber oft nicht allzu praktisch. Wollen wir zum Beispiel etwas mittendrin einf√ºgen, m√ºssten wir den String jedes Mal extra slicen und wieder zusammensetzen. Praktischer sind String-Formatting-Techniken. Die erste ist die [f-string Methode](https://docs.python.org/3/reference/lexical_analysis.html#f-strings) und funktioniert folgendermassen:

In [None]:
age = 42

# String-Concatenation
text1 = "Ich werde bald " + str(age) + " Jahre alt!"
# F-String-Formatting
text2 = f"Ich werde bald {age} Jahre alt!"

print(text2)

Eine andere M√∂glichkeit ist es, die format()-Funktion zu verwenden. Gerade wenn es sich bei dem, was Du formattieren m√∂chtest um einen komplexen Ausdruck handelt, ist diese sauberer:

In [None]:
age = 42

# String-Concatenation
text1 = "Ich werde bald " + str(age) + " Jahre alt!"
# Format-Methode
text3 = "Ich werde bald {0} Jahre alt!".format(age)

print(text3)

Toll ist an beiden Methoden, dass sie auch noch erlauben, die eingef√ºgten Objekte leicht zu manipulieren. Zum Beispiel durch Padding:

In [None]:
age = 42

text2 = f"Ich werde bald {age:04d} Jahre alt!"

text3 = "Ich werde bald {0:04d} Jahre alt!".format(age)

print(text2)
print(text3)

## Regex
Wir k√∂nnen Strings in Python mit Regex-Ausdr√ºcken manipulieren mittels des [re-Moduls](https://docs.python.org/3/library/re.html). Hier gibt es nur ein kurzes Beispiel, aber im Vertiefungsmodul "NLP_Named_Entity_Recognition" wird das Modul n√§her erkl√§rt.

In [None]:
import re

# einen Text an verschiedenen Zeichen splitten
text = "Datum | Vorname - Nachname | Geburtsdatum $ Note"
split_text = re.split(r"\||-|\$", text)
print(split_text)

# einen gewissen Substring suchen
text = "Datum | Vorname - Nachname | Geburtsdatum $ Note"
matches = re.findall("((\w*?)name)", text)
print(matches)

## √úbung: Strings manipulieren
Festige in dieser Mehrschritt-√úbung deine Kenntnisse √ºber Strings!

In [None]:
satz = "Programmieren mit Python ist wirklich spannend."

In [None]:
# Ermittle das f√ºnfte Wort im Satz
fuenftes_wort = 
print(fuenftes_wort)

In [None]:
# Z√§hle die Buchstaben im Satz - ohne Leerzeichen
anzahl_buchstaben = 
print(anzahl_buchstaben)

In [None]:
# Pr√ºfe, ob das Wort "Python" im Satz enthalten ist. Falls kein Python enthalten ist, gib "-1" aus, sonst den Index, wo "Python" steht.
# Tipp: find()
python_im_satz =
print(python_im_satz)

In [None]:
# Erzeuge einen neuen String, der aus den ersten 3 Zeichen des ersten Wortes und den letzten 3 Zeichen des letzten Wortes besteht.
neues_wort = 
print(neues_wort)

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/string_uebung.py

# Umwandlung von Datentypen
Da wir nun schon einige Datentypen kennengelernt haben, sollten wir uns kurz ansehen, wie wir Datentypen ineinander umwandeln k√∂nnen. Wir haben bereits einige Funktionen gesehen, die Typen ver√§ndern, z.B. indem *sorted()* aus einem String eine Liste macht. Oder wenn wir durch eine Division aus zwei Integern einen Float erhalten.

Durch die [built-in-Funktionen](https://docs.python.org/3/library/functions.html) k√∂nnen wir ebenfalls schnell Datentypen zueinander umwandeln. Nat√ºrlich sind nicht alle Datentypen kompatibel, oder sie h√§ngen vom Wert des Datentyps ab.

In [None]:
# zu integer
zahl = int(8.3)
zahl = int("63")

# zu float
dezimalzahl = float(13)
dezimalzahl = float("92.3")

# zu string
text = str(38)

# zu liste
woerter = list(text)

Setze print()-Statements um die Ausgabewerte zu untersuchen.

Notiere dir, was dir auff√§llt, wenn du dir die Ausgaben ansiehst. Hier sind nicht alle Kombinationen von Umwandlungen gelistet. Teste, was bei den anderen passiert!

# Falls-dann-oder-sonst: Kontrolle √ºber den Flow
Nun k√∂nnen wir schon mal ein paar nette lineare Programme schreiben. Je nach dem haben wir aber nicht die volle Kontrolle dar√ºber, was in unseren Variabeln steht, z.B. wenn wir eine Datei auslesen. Wir wollen also je nach dem, was wir haben, verschiedene Abl√§ufe festlegen. In Python nennt sich das *Flow-Control*. Unser wichtigstes Werkzeug ist dazu *if* und *else*.

In [None]:
number = 42
divider = 4
rest = number % divider  # der Modulo-Operator gibt die Restmenge zur√ºck

if rest:
    print(f"The number {number} cannot cleanly be divided by {divider}!")
else:
    print(f"The number {number} can cleanly be divided by {divider}!")

*if* und *else* sollte recht intuitiv verst√§ndlich sein: Wir eine genannte Bedingung erf√ºllt, dann wird der eingeschobene Codeblock ausgef√ºhrt. Wird die Bedingung nicht erf√ºllt, wird der Block nach dem *else* ausgef√ºhrt. Die Einsch√ºbe macht man mit der *Tabulator*-Taste, aber sie bestehen meistens aus 4 Leerschl√§gen (Python akzeptiert auch 2 Leerschl√§ge, oder Tabulator-Zeichen, aber 4 Leerschl√§ge ist empfohlen).

Aber was ist eine Bedingung? Die Bedingung muss ein Wert sein, der sich in *True* oder *False* aufl√∂sen l√§sst. Damit f√ºhren wir einen neuen Datentyp ein, den Wahrheitswert (boolean). Im Codeblock oben geschieht eine implizite Umwandlung: Wenn rest gleich 0 ist, dann wird die Zahl automatisch zu False umgewandelt, falls es ein anderer Wert als 0 ist, zu True.

Wahrheitswerte werden nur selten direkt in Variablen gespeichert. Meistens entstehen sie als Folge von einer Vergleichsoperation oder einer expliziten oder impliziten Umwandlung eines anderen Datentyps. Dazu gibt es weitere Funktionen, die einen Wahrheitswert zur√ºckgeben.

In [None]:
# Beispiel f√ºr eine Vergleichsoperation
zahl = 5
wahrheitswert = zahl > 3
if wahrheitswert:
    print("Sie ist gr√∂sser!")

# Beispiel f√ºr eine explizite Umwandlung
text = "Hallo Welt"
wahrheitswert = bool(text)
if wahrheitswert:
    print("Der Text ist nicht leer!")

# Beispiel f√ºr eine spezielle Sorte von True/False-Return
text = "Hallo Welt"
wahrheitswert = "Welt" in text
if wahrheitswert:
    print("Welt ist Teil vom Input!")

# Beispiel f√ºr eine klassenspezifische Funktion, die einen Wahrheitswert ausgibt
text = "Hallo Welt"
wahrheitswert = text.islower()
if wahrheitswert:
    print("Der Text ist kleingeschrieben")

Wie hier auch zu sehen ist, ist das *else* optional.

Jedes Objekt definiert √ºber seine `__bool__`-Methode selbst, wann es True und False zur√ºckgibt, wenn es implizit oder explizit als Wahrheitswert verwendet wird. Zahlenwerte zum Beispiel geben `False` zur√ºck, wenn der Zahlenwert 0 betr√§gt, ansonsten `True`. Strings geben nur dann `False` zur√ºck, wenn keine Zeichen im String enthalten sind. Listen, wenn keine Elemente in der Liste enthalten sind. Diese Zust√§nde sind nicht zu verwechseln mit `None`, denn die Objekte existieren, sie sind nur leer (Wobei ein `None`-Wert auch implizit einen Wahrheitswert von `False` zur√ºckgibt).

## Vergleichsoperatoren
Wir k√∂nnen Objekte mittels verschiedener [Vergleichsoperatoren](https://docs.python.org/3/library/stdtypes.html#comparisons) miteinander vergleichen. Unter dem Deckel funktionieren diese als Funktionen der jeweiligen Objekte, denen das oder die anderen Objekte als Argumente gegeben werden. Folgende Methoden haben wir, um Objekte zu vergleichen:

- Ist-gleich: `==`
- Gr√∂sser-als: `>`
- Kleiner-als: `<`
- Gr√∂sser-gleich-als: `>=`
- Kleiner-gleich-als: `=<`
- Nicht-gleich: `!=`

Etwas speziell ist noch `is` und `is not`, die vergleichen, ob es sich um dasselbe Objekt handelt. Der Unterschied wird in der folgenden Zelle dargestellt:

In [None]:
list1 = ["A", "B", "C"]
list2 = ["A", "B", "C"]

print(list1 == list2)
print(list1 is list2)

# Aber:
list3 = list1
print(list1 is list3)

## Mehr als zwei Pfade: *elif*
Wir k√∂nnen if-else beliebig oft verschachteln, falls wir mehr als zwei m√∂gliche Abl√§ufe haben:

In [None]:
temperatur = 18

if temperatur >= 25:
    print("Es ist hei√ü drau√üen!")
else:
    if temperatur >= 15:
        print("Es ist angenehm warm.")
    else:
        if temperatur >= 5:
            print("Es ist k√ºhl, zieh dich warm an.")
        else:
            print("Es ist sehr kalt drau√üen!")

Aber das kann schnell un√ºbersichtlich werden. *elif* ist ein weiteres Keyword, das zusammen mit einer Bedingung gesetzt werden kann um mehr als zwei m√∂gliche Abl√§ufe zu erlauben:

In [None]:
temperatur = 18

if temperatur >= 25:
    print("Es ist hei√ü drau√üen!")
elif temperatur >= 15:
    print("Es ist angenehm warm.")
elif temperatur >= 5:
    print("Es ist k√ºhl, zieh dich warm an.")
else:
    print("Es ist sehr kalt drau√üen!")


## √úbung: Control-Flow Basics
Festige deine Kenntnisse zu if-elif-else mit der folgenden √úbung:

Unser Kino verkauft Tickets in 4 Preisklassen:
- Kinder (bis 12 Jahre)
- Jugendliche (bis 17 Jahre)
- Erwachsene (bis 64 Jahre)
- Senioren (ab 65)

Ausserdem gibt es an einem bestimmten Wochentag jeweils Rabatt.

Berechne den Ticketpreis f√ºr die gegebenen Parameter durch einen if-else-Algorithmus.
Alle Variablen in den ersten zwei Zellen sollten ersetzt werden k√∂nnen und die Outputs trotzdem stimmen.

In [None]:
# Preise und Rabatt
kinderpreis = 5
jugendlichenpreis = 7
erwachsenenpreis = 12
seniorenpreis = 6

rabbattag = "montag"
rabbathoehe = 2

In [None]:
# K√§ufer-Informationen
alter = 46

tag_des_kaufs = "montag"

In [None]:
###
# Dein Code hier
###

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/kinoticket.py

## Logikoperatoren
Komplexere Bedingungen k√∂nnen wir mittels sogenannter [Boolean-Operationen](https://docs.python.org/3/library/stdtypes.html#boolean-operations-and-or-not) formulieren: `and`, `or` und `not`.

`and` evaluiert `True` wenn beide Werte `True` sind, `or` wenn mindestens einer `True` ist und `not` kehrt den Wahrheitswert um, evaluiert also `False` bei `True` und `True` bei `False`. Um zu zeigen, welche Bedingungen zuerst evaluiert werden sollen, m√ºssen wir Klammern verwenden. Probiere beim folgenden Codebeispiel aus, wie sich der Output je nachdem ver√§ndert, was in Zeilen 6-8 den Variablen zugewiesen wird. Die Funktionsweise wird im folgenden Beispiel illustriert:

In [None]:
# Boolean-Variablen
a = True
b = False
c = True

ergebnis1 = a and b
ergebnis2 = a or b
ergebnis3 = not c
ergebnis4 = (a or b) and c

print("a and b =", ergebnis1)
print("a or b =", ergebnis2)
print("not c =", ergebnis3)
print("(a or b) and c =", ergebnis4)

Es wird √ºbrigens immer erst die Bedingung links von einem `and` oder `or` gepr√ºft, dann rechts. Bei einem `and` wird auf die Pr√ºfung der rechten Bedingung verzichtet, wenn die Linke schon `False` evaluiert. Dies kann relevant sein in zum Beispiel einem solchen Fall (Du darfst den Satz hier selbst schreiben, beachte die Dialogbox, die sich √∂ffnet, sobald Du die Zelle ausf√ºhrst):

In [None]:
sentence = input().split()

if len(sentence) > 8 and sentence[8].isupper():
    print("Ja, das neunte Wort ist gross geschrieben!")
elif len(sentence) > 8:
    print("Nein, das neunte Wort ist nicht gross geschrieben!")
else:
    print("Der Satz ist zu kurz :-(")

W√ºrden wir nicht zuerst pr√ºfen, dass `sentence` mindestens 8 Elemente enth√§lt, wir aber dann versuchen auf das Objekt bei Index 3 zuzugreifen, dieser aber nicht existiert, weil die Liste k√ºrzer ist als 4, werden wir eine Fehlermeldung erhalten (Probiert es ruhig aus, indem ihr die erste Bedingung l√∂scht).

## √úbung: Logikoperatoren
Wir verkaufen noch immer Kinotickets. Aber weil es echt gut l√§uft, machen wir noch mehr Tage, an denen es Rabatt gibt!

In [None]:
# Preise und Rabatt
kinderpreis = 5
jugendlichenpreis = 7
erwachsenenpreis = 12
seniorenpreis = 6

rabbattag = "montag"
rabatttag2 = "donnerstag"
rabbathoehe = 2

In [None]:
# K√§ufer-Informationen
alter = 46

tag_des_kaufs = "donnerstag"

Du darfst gerne deinen Code von oben weiter ausbauen. Denk daran, dass es Rabatt gibt, wenn es Montag oder Donnerstag ist.

In [None]:
###
# Dein Code hier
###

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/kinoticket_2.py

# Eins nach dem Anderen: Schleifen
Nun folgt das letzte absolut essentielle Element, damit du deine ersten Skripte schreiben kannst! Wir haben bereits sequentielle Objekte wie Listen und Strings kennengelernt. Manchmal m√∂chten wir uns die einzelnen Elemente in diesen Objekten genauer ansehen, mit ihnen arbeiten oder sie ver√§ndern. In dem Fall ben√∂tigen wir Schleifen (loops).

## for-Schleifen
Die √ºblichste Form der Schleife ist die for-Schleife. Dabei gehen wir eine Sequenz durch und definieren einen Ablauf, der f√ºr jedes Element durchgef√ºhrt wird. Dabei wird dem jeweiligen Element, an dem wir gerade sind, ein bestimmter Variablenname gegeben. Wir nennen diesen Prozess "eine Iteration". Das sieht dann ungef√§hr so aus:

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

for word in sentence:
    print(word)

Nochmal Schritt f√ºr Schritt. Unser Input ist also eine Liste von W√∂rtern. Wir *iterieren* diese Liste. Das bedeutet, f√ºr jedes Element, das in der Liste enthalten ist, wird der Ablauf, der durch die Einsch√ºbe definiert ist, durchgef√ºhrt. W√§hrend der Iteration verweist die Variable *word* auf das jeweilige Element bzw. Objekt. In der ersten Iteration also auf "Hier", in der zweiten auf "in", etc.

Wir k√∂nnen Schleifen nat√ºrlich auch wieder verschachteln:

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

for word in sentence:
    for character in word:
        print(word, character)

Da sowohl Listen als auch Strings Sequenzen sind, k√∂nnen wir beide in einer for-Loop iterieren.

## while-Schleifen
Eine weitere Art von Schleife ist die *while*-Schleife. Diese hat eine Abbruchbedingung und l√§uft so lange, bis diese Abbruchbedingung *True* zur√ºckgibt. Fast immer, wenn es darum geht Sequenzen zu iterieren, ist man mit einer for-Schleife besser bedient, aber nicht alle Schleifen iterieren Sequenzen!

In [None]:
# das Beispiel von oben, als while-Schleife
sentence = "Hier in Z√ºrich lernen wir Python !".split()

idx = 0
while idx < len(sentence):
    word = sentence[idx]
    print(word)
    
    idx += 1

Sehr viel m√ºhsamer als mit einer for-Schleife, nicht wahr? Aber in manchen Situationen kann ist die *while*-Schleife praktischer:

In [None]:
# der User soll eine Sequenz von Zahlen eingeben, die Loop stoppt erst, wenn der User "stop" eingibt.
zahlen = []

zahl = input("Schreibe eine Zahl (or 'stop'): ")
while zahl != "stop":
    zahlen.append(zahl)
    print("You entered:", zahl)
    zahl = input("Enter a number (or 'stop'): ")

print(zahlen)

In [None]:
import random

zufallszahl = random.random()
while zufallszahl < 0.9:
    print(zufallszahl)
    zufallszahl = random.random()

Beide Beispiele k√∂nnen *theoretisch* mit einer for-Schleife in Kombination mit einem Unendlichen-Generator-Objekt geschrieben werden, aber mit while lassen sich die Abl√§ufe sehr viel nat√ºrlicher implementieren.

Vorsicht: Wenn Du while-Schleifen schreibst, achte sorgf√§ltig darauf, dass Du Deine Abbruchbedingung irgendwann erf√ºllt wird. Endlosschleifen k√∂nnen im schlimmsten Fall Dein System abst√ºrzen lassen, wobei Python sie eigentlich vorher stoppen sollte.

## Faule, aber praktische, Iteratoren
Ein fauler (lazy) Iterator ist ein iterierbares Objekt, das einen Wert erst generiert, wenn er gebraucht wird. Das kann zum Beispiel praktisch sein, damit man einen grossen Datensatz nicht auf einmal in den Speicher l√§dt, sondern immer nur die Zeile, die man gerade ben√∂tigt:

In [None]:
# Dateien bearbeiten wird sp√§ter noch erkl√§rt
with open("./Materialien/moby_dick.txt", mode="r", encoding="utf8") as datei:
    for zeile in datei:
        print(zeile.strip())

Im Kontext von Schleifen, existieren zwei sehr praktische Iteratoren dieser Art, die beide durch built-in Funktionen erzeugt werden. Sieh dir die Beispiele an und versuche nachzuvollziehen, was die beiden Funktionen tun:

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

for index in range(0, len(sentence), 2):
    word = sentence[index]
    print(word)

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

for index, word in enumerate(sentence):
    print(index, word)

<details>
<summary>Wenn du bereit bist, klicke hier um die Erkl√§rung zu lesen</summary>

range() erzeugt einen iterator mit den Parametern *start*, *stop* und (optional) *step*. Der Iterator generiert eine Sequenz von Zahlen, die bei *start* beginnt und bei *end* endet. Falls *step* definiert wurde, werden Zahlen entsprechend √ºbersprungen.

enumerate() nimmt eine Sequenz als Parameter, und generiert dann f√ºr jede Iteration die Zahl der Iteration. Wenn das optionale *start*-Parameter definiert wird, werden die Zahlen entsprechend modifiziert (Probier es aus!). enumerate gibt f√ºr jede Iteration eine Sequenz aus, das am ersten Index die Zahl hat, und an der zweiten Stelle das urspr√ºngliche Element der Liste. Was in der Zelle zu sehen ist, nennt sich *unpacking* und wird gleich noch erkl√§rt.
</details>

## Unpacking
Unpacking ist ein sehr praktisches Feature, wenn wir mit Sequenzen von Sequenzen arbeiten. Ohne Unpacking zum Beispiel m√ºssten wir folgendes machen:

In [None]:
personen = [
    ["Max", 26],
    ["Lena", 13],
    ["Anna", 45],
    ["Theo", 9]
]

for person in personen:
    name = person[0]
    alter = person[1]
    print(f"{name} ist {alter} Jahre alt!")

Dank Unpackings geht das aber einfacher:

In [None]:
personen = [
    ["Max", 26],
    ["Lena", 13],
    ["Anna", 45],
    ["Theo", 9]
]

for name, alter in personen:
    print(f"{name} ist {alter} Jahre alt!")

Was passiert aber, wenn unsere Daten unordentlich sind?

In [None]:
personen = [
    ["Max", 26],
    ["Lena", 13],
    ["Anna", 45],
    ["Theo"]
]

for name, alter in personen:
    print(f"{name} ist {alter} Jahre alt!")

Im Kapitel zu Errorhandling werden wir uns ansehen, wie wir so etwas umgehen k√∂nnen, wenn wir z.B. einen sehr unordentlichen, grossen Datensatz haben.

## Praktische Keywords: break, continue, pass

Mit *break* k√∂nnen wir eine Schleife vorzeitig stoppen. In einer for-Loop funktioniert also ein *break* in einer *if*-Bedingung wie die Abbruchbedingung einer *while*-Loop.

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

for word in sentence:
    print(word)
    if word == "Z√ºrich":
        print("Beende Schleife, wir haben Z√ºrich gefunden!")
        break
    

Wir k√∂nnen ausserdem ein *else* an die for-Schleife h√§ngen, die nur dann ausgef√ºhrt wird, wenn die Schleife nicht durch ein *break* abgebrochen wurde.

In [None]:
sentence = "Hier in Bern lernen wir Python !".split()

for word in sentence:
    print(word)
    if word == "Z√ºrich":
        print("Beende Schleife, wir haben Z√ºrich gefunden!")
        break
else:
    print("Wir sind wohl nicht in Z√ºrich ü§î")

Ein *continue* l√§sst uns den Rest der derzeitigen Iteration √ºberspringen, l√§sst die Schleife aber weiter laufen.

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

for word in sentence:
    if word == "Z√ºrich":
        print("WO SIND WIR?")
        continue
    print(word)

*pass* ist lediglich ein Platzhalter, meistens wird er verwendet, wenn sp√§ter dort noch Code hinkommt.

In [None]:
sentence = "Hier in Bern lernen wir Python !".split()

for word in sentence:
    print(word)
    if word == "Z√ºrich":
        pass

Das Ganze l√§sst sich nat√ºrlich auch kombinieren:

In [None]:
data = [
    ["Max", 26],
    ["Lena", 13],
    ["Anna", 45],
    ["Theo", 9]
]

for name, age in data:
    if name == "Max":
        continue  # √ºberspringen

    if name == "Lena":
        pass  # TODO

    if name == "STOP":
        break  # Beenden der Schleife!

    print(name)
else:
    print("Loop executed successfully!")

## Listenkomprehension

Wir k√∂nnen Schleifen auch sehr kompakt schreiben, und diese Schreibweise ist sogar effizienter in der Berechnung. 

Hier ein Beispiel, wie Listenkomprehension einfach benutzt werden kann, um eine neue Liste mit ver√§nderten Elementen zu generieren:

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

lower_words = [word.lower() for word in sentence]

print(lower_words)

Die Struktur der Komprehension ist also immer [**y** for **x** in **z**]

Dabei ist **z** die Sequenz die iteriert wird, **x** ist die Variable, welche das jeweilige Element beschreibt und **y** ist ein Ausdruck, der mit diesem Element etwas tut und der neuen Liste hinzugef√ºgt wird.

Gerne wird Listenkomprehension auch verwendet um Listen zu filtern:

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

upper_words = [word for word in sentence if word[0].isupper()]

print(upper_words)

Alternativ k√∂nnen wir auch ein *else* einbauen, um einen alternativen Wert oder Ausdruck in die neue Liste zu speichern.

In [None]:
sentence = "Hier in Z√ºrich lernen wir Python !".split()

upper_words = [word if word[0].isupper() else "_" for word in sentence]

print(upper_words)

## √úbung: Schleifen
Eine kleine √úbung um den Umgang mit Schleifen zu festigen.

In [None]:
# lade den datensatz
schlagwoerter = [
    ["Arch√§ologie", "Grabung", "Funde"],
    ["Mittelalter", "Stadtgeschichte"],
    ["Archivwesen", "Bestandserhaltung", "Digitalisierung"],
    ["Literatur", "Interpretation"]
]

1. Gib alle Schlagw√∂rter der Reihe nach - einzeln - aus
2. Ver√§ndere deinen Code so, dass Schlagw√∂rter, die auf "ung" enden, √ºbersprungen werden
3. Ver√§ndere den Code so, dass er abbricht, sobald er auf "Digitalisierung" st√∂sst.

In [None]:
###
# Dein Code
###

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/schleifen.py

# Ein Blick unter die Haube: Funktionen
Sehen wir uns, bevor wir weitermachen mit Textmanipulation, erstmal an, was eigentlich Funktionen genauer sind. Wie schon oben beschrieben, bieten sie vorgefertigte Algorithmen, nehmen Parameter entgegen und haben manchmal einen *return*-Wert. Funktionen kann man auch selbst schreiben, wenn man vermeiden m√∂chte gewisse Codebl√∂cke st√§ndig wiederholen zu m√ºssen. Auch f√ºr ein ordentliches Skript ist das Schreiben von Funktionen empfohlen, aber als Anf√§nger braucht ihr das noch nicht dringend. Hier die Grundstruktur einer (recht unn√∂tigen) Funktion:

In [None]:
def im_quadrat(basis):
    resultat = basis*basis
    return resultat

Du bemerkst, wenn die Zelle ausgef√ºhrt wird, passiert erstmal gar nichts. Wir haben sie nun definiert, aber noch nicht ausgef√ºhrt. Ausf√ºhren k√∂nnen wir die Funktion dann so:

In [None]:
resultat = im_quadrat(5)
print(resultat)

Alle Parameter, die Du bisher gesehen hast, waren *positionale* Parameter. Das bedeutet, Python guckt einfach nach der Reihenfolge, welcher Inputs in welche Parameter der Funktion geh√∂ren. Es gibt dazu optionale, positionale Parameter, die nicht unbedingt n√∂tig sind, aber f√ºr zus√§tzliches Verhalten definiert werden k√∂nnen. Werden sie nicht definiert, erhalten sie einem *default*-Wert. *enumerate()* nimmt zum Beispiel ein solches optionales, positionales Parameter entgegen. Schliesslich k√∂nnen wir Parameter auch noch per keywords zuweisen. Sehen wir uns zum Beispiel sorted() an, k√∂nnten wir bestimmen, dass wir die Sortierung lieber verkehrt m√∂chten:

In [None]:
text = "Es ist so toll an der Zentralbibliothek Z√ºrich programmieren zu lernen!".split()

verkehrt_sortiert = sorted(text, reverse=True)

print(verkehrt_sortiert)

# √úbung: Grundlagen
Mit den Kenntnissen aus diesem Notebook kannst du nun schon ganz sch√∂n viel anstellen. Die folgende √úbung verlangt dir Kenntnisse aus den verschiedenen Kapiteln ab, viel Erfolg!

F√ºhre die n√§chste Zelle aus, um das Datenset vorzubereiten

In [None]:
# Datenset
books = [
    ["Pride and Prejudice", "Jane Austen", "1813", "English",
        ["Liebesroman", "Britische Literatur", "Gesellschaft"]],
    
    ["Faust", "Johann Wolfgang von Goethe", "1808", "German",
        ["Drama", "Deutsche Literatur", "Philosophie"]],
    
    ["Moby-Dick", "Herman Melville", "1851", "English",
        ["Seefahrt", "Amerikanische Literatur", "Abenteuer"]],
    
    ["Der Zauberberg", "Thomas Mann", "1924", "German",
        ["Moderne Literatur", "Gesellschaft", "Philosophischer Roman"]],
    
    ["Geschichte des Altertums", "Theodor Mommsen", "1854", "German",
        ["Alte Geschichte", "Klassische Philologie", "R√∂misches Reich"]],
    
    ["Geschichte der Neuzeit", "Joachim Whaley", "2012", "German",
        ["Neue Geschichte", "Europ√§ische Geschichte", "Fr√ºhe Neuzeit"]],
    
    ["The Histories", "Herodotus", "440 v.u.Z.", "Greek",
        ["Antike Geschichte", "Ethnographie", "Krieg"]],
    
    ["Meditations", "Marcus Aurelius", "180", "Greek",
        ["Philosophie", "Stoizismus", "Antike Welt"]],
    
    ["Die Buddenbrooks", "Thomas Mann", "1901", "German",
        ["Familiensaga", "Deutsche Literatur", "Gesellschaft"]],
    
    ["To Kill a Mockingbird", "Harper Lee", "1960", "English",
        ["Amerikanischer S√ºden", "B√ºrgerrechte", "Entwicklungsroman"]],
    
    ["Geschichte Europas im Mittelalter", "Heinz Thomas", "2002", "German",
        ["Geschichte Europas", "Mittelalter", "Kirchengeschichte"]],
    
    ["Jane Eyre", "Charlotte Bront√´", "1847", "English",
        ["Gothic Novel", "Liebesroman", "Entwicklungsroman"]],
    
    ["Die Entdeckung der Langsamkeit", "Sten Nadolny", "1983", "German",
        ["Roman", "Polarforschung", "Biographischer Roman"]],
    
    ["The Republic", "Plato", "375 v.u.Z.", "Greek",
        ["Philosophie", "Politische Theorie", "Antike Welt"]],
    
    ["Geschichte der Kunst", "Horst Woldemar Janson", "1962", "German",
        ["Kunstgeschichte", "Visuelle Kultur", "Neue Geschichte"]],
    
    ["War and Peace", "Leo Tolstoy", "1869", "Russian",
        ["Historischer Roman", "Napoleonische Zeit", "Gesellschaft"]],
    
    ["Die Verwandlung", "Franz Kafka", "1915", "German",
        ["Novelle", "Moderne Literatur", "Existentialismus"]],
    
    ["Il Principe", "Niccol√≤ Machiavelli", "1532", "Italian",
        ["Politische Theorie", "Renaissance", "Staatskunst"]],
    
    ["Geschichte der franz√∂sischen Revolution", "Jules Michelet", "1847", "German",
        ["Franz√∂sische Revolution", "Neue Geschichte", "Europ√§ische Geschichte"]],
    
    ["The Odyssey", "Homer", "725 v.u.Z.", "Greek",
        ["Epos", "Mythologie", "Antike Welt"]]
]


## Dein Datenset

Die Variable `books` enth√§lt 20 Werke mit je:
1. Titel
2. Autorenname
3. Publikationsjahr
4. Sprache
5. Schlagw√∂rter

Mache dich mit den Datentypen und der Struktur vertraut, bevor du mit der Umsetzung der √úbungsaufgaben beginnst

## Aufgaben

Versuche, all die folgenden Informationen zu ermitteln:
1. Z√§hle, wie viele Werke vor dem Jahr 2000 erschienen sind.
2. Gib die Titel aller Werke aus, die etwas mit "Geschichte" zu tun haben. (Durchsuche jeweils den Titel und die Schlagw√∂rter)
3. Gib das √§lteste und neueste Werk aus.
4. Suche ein Werk mit "Familiensaga" als Schlagwort und brich die Suche sofort ab, wenn du es gefunden hast.

Viel Erfolg!

In [None]:
###
# Dein Code hier f√ºr Aufgabe 1
###

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/final_1.py

In [None]:
###
# Dein Code hier f√ºr Aufgabe 2
###

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/final_2.py

In [None]:
###
# Dein Code hier f√ºr Aufgabe 3
###

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/final_3.py

In [None]:
###
# Dein Code hier f√ºr Aufgabe 4
###

In [None]:
# Entferne das # in der n√§chsten Zeile und f√ºhre diese Zelle aus, um dir die L√∂sung anzusehen
# %load ./L√∂sungen/final_4.py