# Datentypen

Im Notebook "Einführung" haben wir gelernt, dass sämtliche Datenpunkte in Python *Objekte* sind. Wie bereits erwähnt, hat jedes Objekt einen *Datentyp*. Zwei Datentypen sind uns schon begegnet:

- Zeichenketten, in Python ```string``` genannt (Kurzform: ```str```) 
- Ganzzahlen, in Python ```integer``` genannt (Kurzform: ```int```) 

Diese beiden und weitere wichtige Datentypen sowie ihre Eigenschaften lernen wir in diesem Notebook kennen. Die meisten Datentypen in Python haben eine Entsprechung in unserem alltäglichen (nicht-computationellen) Leben, sie werden Dir also vermutlich nicht besonders abwegig vorkommen. Was wir jedoch lernen müssen, ist, welche Konventionen für die einzelnen Datentypen bei Python gelten – also etwa, wie sie syntaktisch eingeführt werden müssen oder was man mit ihnen (nicht) machen kann. 

In diesem Notebook kommt noch einmal einiges an Theorie auf Dich zu, danach wird es jedoch angewandter. Dieses Notebook ist auch als Nachschlageort gedacht, wo Du alles Relevante zu Datentypen findest. Viele Fehler beim Programmieren fußen auf einem fehlenden Verständnis von Datentypen. Dem möchten wir hiermit vorbeugen, und wenn es doch zu Fehlern kommt (und das wird es sehr oft 😅), kannst Du hier nachschlagen.

## Zeichenketten / strings

Zeichenketten sind, wie es der Name sagt, grundlegend Ketten von Zeichen, also etwa Wörter, Sätze oder ganze Texte. Sie werden stets umrahmt von Anführungszeichen, also ```"..."```oder ```'...'``` (beide Varianten sind in Ordnung, solange sie konsistent genutzt werden):

In [None]:
string1 = "Dies ist ein Satz bestehend aus acht 'Wörtern'." #Die jeweils anderen Anführungszeichen können im string vorkommen.
string2 = "Dies"
string3 = "D"
string4 =  "" #Strings können auch leer sein, was bei der Ausgabe nicht sichtbar wird, aber es kommt auch keine Fehlermeldung.
string5 = "Dieser string \
wiederum verteilt sich auf \
drei Zeilen." #Mittels backslash ("\") können wir einen string auch auf mehrere Zeilen verteilen.

print(string1, string2, string3, string4, string5)

## Ganzzahlen / integer

Ganzzahlen sind schlicht ganze Zahlen, also Zahlen ohne Nachkommastellen. Wie wir bereits gesehen haben, bedarf es **keiner** Anführungs- oder sonstiger Zeichen bei der Verwendung von Ganzzahlen. Im Gegenteil: Eine Ganzzahl umrahmt von Anführungszeichen interpretiert Python als string (vgl. die letzte Übung im Notebook "Einführung"). 

## Dezimalzahlen / float

Neben Ganzzahlen gibt es auch Dezimalzahlen, die in Python ```float``` heißen. Wichtig: Das Dezimalzeichen ist ein **Punkt** ```.```

In [None]:
int_number = 20
float_number = 20.1
print(int_number, "ist ein Objekt vom Datentyp 'integer' und", float_number, "ein Objekt vom Datentyp 'float'.")

## Listen / list

Ein weiterer äußerst nützlicher Datentyp in Python sind Listen, genannnt ```list```, die wir im Alltag z. B. in Form von To-Do-Listen oder Einkaufslisten kennen. Nachfolgend ein Beispiel für eine Liste mit allen Wochentagen:

In [None]:
days = ["Montag", "Dienstag", "Mittwoch", "Donnerstag", "Freitag", "Samstag", "Sonntag"]

Listen sind ganz einfach eine Ansammlung an einzelnen Objekten in einer bestimmten Reihenfolge. Abgegrenzt werden Listen durch **eckige Klammern**. Die einzelnen *Elemente* einer Listen werden durch **Kommata** voneinander separiert und können Objekte jeglichen Datentyps sein:

In [None]:
wild_mix = ["Montag", 1, 20.0, {"Friday": "Freitag", "Saturday": ["Samstag", "Sonnabend"]}]

Hier ist das erste Element ein ```string```, das zweite ein ```integer```, das dritte ein ```float``` und das vierte (abgegrenzt durch die geschweiften Klammern) ein sog. ```dictionary```, dazu gleich mehr.

***
✏️ **Übung 1:** Erstell eine Liste mit allen Monaten des Jahres, allerdings gruppiert nach meteorologischen Jahreszeiten, also *März, April, Mai* zusammen in einer Liste für Frühlingsmonate, etc. Am Ende solltest Du also vier Listen für die vier Jahreszeiten haben, die wiederum Elemente einer einzigen Liste sind. Eine Variable namens ```seasons``` soll auf diese Liste zeigen.

In [None]:
#In diese Zelle kannst Du den Code zur Übung schreiben.




***

Angenommen Du hast mit den Frühlingsmonaten angefangen, sollte Dir der nächste ```print```-Befehl die Sommermonate zurückgeben. Die hier verwendete Technik nennt sich *Indexing*. Kurz formuliert erlaubt sie es uns, auf einzelne Element einer Liste über ihren *Index* zuzugreifen, wobei wir bei **null** zu zählen beginnen. Der Index ```0``` gibt uns also das erste Element zurück, der Index ```1``` das zweite, etc. Um sicherzustellen, dass sich der Befehl ausführen lässt, definieren wir erst noch einmal die Liste `seasons`:

In [None]:
seasons = [['März', 'April', 'Mai'], ['Juni', 'Juli', 'August'], ['September', 'Oktober', 'November'], ['Dezember', 'Januar', 'Februar']]
print(seasons[1])

Indexing schauen wir uns weiter unten im Detail an. Weitere sog. *Methoden* zum Bearbeiten von Listen lernen wir im Notebook "Funktionen und Methoden" kennen.

## Dictionaries

Das vierte Element in ```wild_mix``` oben ist also ein Objekt des Datentyps ```dictionary```, kurz ```dict```. Dictionaries funktionieren wie Wörterbücher im alltäglichen Leben. Sie bestehen aus Schlüsseln, in Python *key* genannt, und zugehörigen Werten, in Python *value* genannt. Zusammen ergeben Schlüssel und Wert sog. *Schlüssel-Werte-Paare* (engl. *key-value pairs*). Ein Schlüssel entspricht dem Suchbegriff, den wir in einem Sprachwörterbuch nachschlagen. Der zugehörige Wert entspricht dem Eintrag, den wir beim betreffenden Suchbegriff vorfinden. 

Ein dictionary wird von **geschweiften Klammern** umrahmt. Zwischen Schlüssel und Wert befindet sich ein **Doppelpunkt** und zwischen den einzelnen Schlüssel-Werte-Paaren jeweils ein **Komma**:

In [None]:
dictionary = {"key1": "value1", "key2": "value2", "key3": "value3"}

Jeder Schlüssel darf nur ein einziges Mal vorkommen. Typischerweise sind Schlüssel Zeichenketten (aber Objekte anderer sog. *unveränderlicher Datentypen* funktionieren auch; zur (Un)veränderlichkeit von Objekten bald mehr). Werte können theoretisch jeden Datentyp annehmen (bei ```wild_mix``` etwa eine Liste zum Schlüssel "Saturday") und dürfen auch mehrfach im selben dictionary vorkommen.

***

✏️ **Übung 2:** Bau auf der Jahreszeitenliste der vorherigen Übung auf und erstell ein dictionary mit den Jahreszeiten als Schlüssel und einer Liste mit den jeweiligen drei Monaten als Werte. Verwend wieder (d. h. *überschreib*) die Variable ```seasons```, um das dictionary zu referenzieren. Pass auf, dass Du jeweils die richtigen Klammern verwendest.

In [None]:
#In diese Zelle kannst Du den Code zur Übung schreiben.




***

Wenn Du alles richtig gemacht hast, kannst Du anschließend "key" durch einen beliebigen Schlüssel (z. B. "Sommer") in folgender Syntax einsetzen:

`season["key"]`

Probier es in der Code-Zelle oben aus.

Dadurch greifst Du nicht auf das *n*-te Element eines dictionaries zu, wie beim Indexing für Listen (das ginge auch nicht, da dictionaries im Gegensatz zu Listen keine Reihenfolge "abspeichern"; dazu mehr unter "Sequentialität" unten). Stattdessen "sprichst" Du einen bestimmten Wert über den zugehörigen Schlüssel "an". Weitere Methoden, um mit dictionaries zu arbeiten, lernen wir ebenfalls im Notebook "Funktionen und Methoden".

## Mengen / set

Um den nächsten Datentyp, die Menge, in Python ```set``` genannt, einzuführen, stellen wir uns vor, wir hätten einen Satz *tokenisiert*, also in einzelne Wörter zerlegt und dabei eine Liste mit Wörtern zurückbekommen. Führ die Zelle unten aus, um ```tokens``` zu initialisieren:

In [None]:
tokens = ["Vor", "dem", "Eingang", "zur", "Bank", "stand", "eine", "Bank", "aus", "Holz."]

Diese Liste besteht aus zehn Tokens, was wir auch über die ```len```-Funktion herausfinden können:

In [None]:
print(len(tokens))

Die ```len```-Funktion gibt uns bei einer Liste die Anzahl der Elemente in ihr zurück.

Doch wie viele sog. *Types*, also nicht einzelne Wortvorkommnisse (Tokens), sondern einzigartige Worttypen, kommen in der Liste vor? Hier kommt ```set``` ins Spiel. Sets sind wie in der Mathematik Mengen, in denen einzelne Elemente nur **einmal** vorkommen dürfen. Wie folgt können wir in Python eine Liste mit Tokens zu einem ```set``` mit Types konvertieren (und damit die wiederholten Elemente [hier das sog. *Homonym* "Bank"] loswerden):

In [None]:
types = set(tokens)
print(types)

Die Ausgabe zeigt, dass ```set```-Objekte wie dictionaries von **geschweiften Klammern** umrahmt werden. Die einzelnen Elemente sind ebenfalls **kommasepariert**. Der **fehlende Doppelpunkt** zwischen Schlüssel-Werte-Paaren unterscheidet ```set```- von ```dict```-Objekten syntaktisch.

Die ```len```-Funktion lässt sich auch auf Objekte des Datentyps ```set``` anwenden:

In [None]:
print(len(types))

Unser Satz beinhält also zehn Tokens und neun Types. Der Datentyp ```set``` bietet sich immer dann an, wenn wir nicht an der Häufigkeit von Elementen interessiert sind, sondern nur an deren bloßem Vorkommen. 

***

✏️ **Übung 3:** Stell Dir vor, Du und Dein:e Partner:in haben, ohne Euch zu verständigen, jeweils eine Einkaufsliste angefertigt. Zwischen den Einkaufslisten gibt es viele Übereinstimmungen, z. B. habt ihr beide "Hafermilch" aufgeschrieben. Andere Lebensmittel finden sich nur auf jeweils einer der beiden Listen. Definier zwei Listen mit teils gleichen, teils unterschiedlichen Lebensmitteln und versuch anschließend, eine Einkaufsliste daraus zu machen, die keine Lebensmittel doppelt enthält. Euch fehlt zwar Hafermilch, aber ihr braucht nicht die doppelte Menge, nur weil beide "Hafermilch" aufgeschrieben haben. Lass Dir dann die fertige Einkaufsliste ausgeben.

💡 Tipp: Ein Operator, den wir bereits im Notebook "Einführung" verwendet haben, lässt sich auch hier einsetzen.

In [None]:
#In diese Zelle kannst Du den Code zur Übung schreiben.




*** 

## Tupel / tuple

Neben ```list```, ```dict``` und ```set``` gibt es noch einen vierten Datentyp bei Python, der in sich mehrere Objekte enthält: ```tuple```. Tupel sind wie Listen, mit einem einzigen Unterschied: Sie sind unveränderlich, was kurz formuliert bedeutet, dass sie einmal initialisiert ihren Wert, also die Elemente in ihnen, nicht mehr ändern können (wie gesagt, später mehr zur (Un-)veränderlichkeit von Objekten). Tupel werden durch **runde Klammern** definiert und die einzelnen Elemente in ihnen sind **kommasepariert**:

In [None]:
tuple1 = ("Dieser", "Objektbehälter", "soll", "nicht", "verändert", "werden.") #"tuple" ist sog. Schlüsselwort in Python, daher die "1" im Variablennamen (vgl. Notebook "Einführung")
print(tuple1)

Tupel sind im Gegensatz zu Listen praktisch, wenn man mehrere Objekte als Schlüssel in einem dictionary verwenden will. Wie erwähnt können nur unveränderliche Objekte dictionary-Schlüssel sein. Ein Beispiel wäre folgendes dictionary bestehend aus Koordinaten und natürlichsprachlichen Labels:

In [None]:
points_of_interest = {(51.040826668678115, 13.73129036811354): "Dresden Hauptbahnhof", 
                      (51.34433624581525, 12.381138184500644): "Leipzig Hauptbahnhof",
                      (50.83919457580515, 12.93033045450444): "Chemnitz Hauptbahnhof"}

Angenommen wir würden eine kryptische Nachricht mit Koordinaten für einen geheimen Treffpunkt erhalten, könnten wir in diesem dictionary nachschauen, ob die Koordinaten mit einem Label assoziiert sind, das uns mehr sagt:

In [None]:
meeting_location = (51.040826668678115, 13.73129036811354)
print("Der geheime Treffpunkt ist:", points_of_interest[meeting_location])

Wie Listen können Tupel Objekte jeglichen Datentyps enthalten.

## Boolsche Werte / Boolean values

Als letzten wichtigen Datentyp lernen wir Boolsche Werte kennen. Sie werden in Python mit ```bool``` abgekürzt. Um genau zu sein, hatten Boolsche Werte bereits einen kleinen Gastauftritt im Notebook "Einführung". Es gibt genau zwei Boolsche Werte: ```True``` und ```False``` (beachte die Großschreibung!), also "wahr" und "falsch". 

Wie erwähnt gibt es in Python keine Mehrdeutigkeit und genau das können wir uns zunutze machen, wenn wir den Ablauf unseres Codes steuern wollen. Zum Beispiel bei Ausdrücken mit Vergleichoperatoren (vgl. Notebook "Einführung"), die immer nur entweder ```True``` oder ```False``` ergeben können. Gepaart mit den Kontrollstrukturen *bedingte Anweisungen* ("wenn dieser Ausdruck ```True``` ergibt, dann mache x, sonst y") und *Schleifen* ("solange diese Bedingung ```True``` ergibt, mache x"), die wir bereits gestreift haben und bald im Notebook "Kontrollstrukturen" eingehend kennenlernen, können wir unseren Code kontrollieren. 

Bei der Übung zu den Einrückungen im Notebook "Einführung" haben wir das schon angewendet. Hier ein leicht erweiterter Code, bei dem Du die Details noch nicht verstehen musst.

In [None]:
alphabet = "abcabcabc"

"""Hier geht Python Buchstabe für Buchstabe durch 'alphabet' und solange es Buchstaben in 'alphabet' gibt, 
wird der darunter eingerückte Codeblock ausgeführt."""
for character in alphabet:
    
    """Bei jedem Buchstaben wird überprüft, ob diese Bedingung 'True' ergibt, 
    wenn ja, wird der darunter eingerückte Codeblock ausgeführt...""" 
    if character == "a":
        print(character, "is 'a'")
        
    #...wenn nein, wird der hierunter eingerückte Codeblock ausgeführt.
    else:
        print(character, "is not 'a'")

Damit haben wir die wichtigsten Datentypen in Python kennengelernt 😄. <br>

## Datentyp überprüfen

Um herauszufinden, welchen Datentyp ein Objekt hat, können wir die ```type```-Funktion benutzen:

In [None]:
#Auch "string", "float" etc. sind Schlüsselwörter in Python, daher das vorangestellte "a_" im Variablennamen.
a_string = "Dies ist eine Zeichenkette."
an_integer= 20
a_float = 20.3
a_list = [a_string, an_integer, a_float]
a_dict = {a_string: a_list, an_integer: a_float}
a_set = {"Äpfel", "Birnen", "Hafermilch", "Schokokekse"}
a_tuple = (a_set, a_dict, a_list)
a_bool = True

#Bei print können wir auch einen "sep"-Parameter angeben, der definiert, wie die einzelnen Objekte in der Ausgabe konkateniert werden sollen.
print(type(a_string), type(an_integer), type(a_float), type(a_list),
      type(a_dict), type(a_set), type(a_tuple), type(a_bool), sep="\n")

Streng genommen sind Datentypen sog. *Klassen* in Python, daher die Bezeichnung `class` in der Ausgabe. Klassen können wir selbst auch definieren, d. h. wir könnten auch unsere eigenen Datentypen entwerfen. Das ist aber fortgeschritten und wir werden Klassen in den folgenden Notebooks höchstens am Rande begegnen. 

Den Datentyp zu überprüfen macht dann Sinn, wenn wir uns bei einer Variable nicht (mehr) sicher sind, was für ein Objekt durch sie referenziert wird. Viele Funktionen und Methoden (dazu mehr im Notebook "Funktionen und Methoden") lassen sich nur auf bestimmte Datentypen anwenden, wie Du selbst sehen kannst, indem Du die bereits eingeführte ```len```-Funktion auf Objekte verschiedener Datentypen anwendest. Entfern die Hashtags im untenstehenden Codeblock, um die einzelnen ```print```-Befehle auszuführen. <br>

💡 Tipp: Die Fehlermeldung ```TypeError``` kriegen wir zurück, wenn wir eine Operation auf einen Datentyp anwenden wollen, der nicht dafür vorgesehen ist. Sobald Python die Fehlermeldung ausgibt, stoppt die Ausführung des Programmcodes. Um die nachfolgenden `print`-Befehle ausführen zu können, solltest du die problematischen Zeilen durch einen Hashtag *auskommentieren* (dies macht man sich z. B. auch beim *Debugging* zunutze, also wenn sich ein Fehler (*Bug*) eingeschlichen hat und der dafür verantwortliche Codeteil gesucht wird).

In [None]:
print(len(a_string))
print(len(an_integer))
#print(len(a_float))
#print(len(a_list))
#print(len(a_dict))
#print(len(a_set))
#print(len(a_tuple))
#print(len(a_bool))

## Datentyp ändern / Casting

Selbstverständlich ist es auch möglich, Objekte von einem Datentyp in einen anderen zu konvertieren, dies nennt sich *Casting*. Oben haben wir bereits eine Liste in ein ```set``` gecastet. Für jeden eingebauten Datentyp gibt es eine entsprechende Casting-Funktion mit folgender Syntax am Beispiel von ```set```: 
<br>
<br> 
```set(object)```
<br>
<br> 
Ersetz ```set``` durch den jeweiligen Kurznamen des gewünschten Datentyps und ```object``` durch das zu konvertierende Objekt. Hier einige Beispiele anhand der oben initialisierten Objekte:

In [None]:
integer_from_float = int(a_float) #Die Dezimalzahl wird ganz einfach gerundet.
print(integer_from_float, "ist vom Typ", type(integer_from_float), "\n")

string_from_integer = str(integer_from_float)
print(string_from_integer, "ist vom Typ", type(string_from_integer), "\n") #Beachte: JupyterLab umrahmt strings in der Ausgabe nicht mit Anführungszeichen.

tuple_from_list = tuple(a_list)
print(tuple_from_list, "ist vom Typ", type(tuple_from_list), "\n")

#Interessantes Verhalten beim Casten eines strings in eine Liste (das hat mit der Sequentialität von strings zu tun, siehe unten)
list_from_string = list(a_string) 
print(list_from_string, "ist vom Typ", type(list_from_string), "\n")

Abschließend lernen wir drei grundlegende Eigenschaften von Datentypen kennen: *Sequentialität*, *Iterierbarkeit* und *Veränderlichkeit*. Die letzte Eigenschaft ist schon fortgeschritteneres Wissen, es schadet aber nicht, schon einmal davon gehört zu haben.

## 1. Sequentialität

Datentypen unterscheiden sich erstens hinsichtlich ihrer *Sequentialität* (engl. *sequentiality*). Sequentielle Objekte "speichern" die in ihnen enthaltenen Elemente in einer bestimmten Reihenfolge "ab". Als Metapher kann man sich eine einseitig bebaute Straße vorstellen, entlang welcher einzelne Häuser mit einer jeweils eigenen Hausnummer (1, 2, 3, 4 usw.) stehen. Das Haus mit der Hausnummer 3 steht immer am gleichen Ort in der Straße zwischen den Häusern 2 und 4. 

Zu den sequentiellen Datentypen gehören: 

```list```, ```tuple```, ```str```

Bei ```str```-Objekten sind mit den einzelnen Elementen die einzelnen Zeichen, die den string konstituieren, gemeint.

Man könnte annehmen, dass ```dict```- und ```set```-Objekte ebenfalls sequentielle Objekte sind. Sie "speichern" die in ihnen enthaltenen Schlüssel-Werte-Paare bzw. Elemente aber **nicht** in einer bestimmten Reihenfolge (Sequenz) "ab" und zählen von daher nicht zu den sequentiellen Datentypen. 

Auf alle sequentiellen Objekte können zwei sehr hilfreiche Techniken angewandt werden: *Indexing* und *Slicing*.

### Indexing

Bei Indexing "sprechen" wir ein bestimmtes Element innerhalb der Sequenz "an". Das ist praktisch, wenn wir nur an einem bestimmten Element und nicht an der ganzen Sequenz interessiert sind. Bei der Liste ```seasons``` von oben etwa haben wir uns nur die Sommermonate ausgeben lassen – vielleicht um uns zu vergewissern, welche Monate nach meteorologischen Kriterien zum Sommer gehören? 

Oft verwenden wir Indexing auch, um *nach und nach* ein einzelnes Element in der Sequenz "anzusprechen", zum Beispiel *jedes* einzelne (das entspräche dann einer vollständigen Iteration, vgl. "Iterierbarkeit" unten), oder aber nur jedes *x*-te. Auf unsere Straßenmetapher umgemünzt wäre das ein Szenario, wo wir von Haus zu Haus gehen und etwa einen Flyer in *jeden* Briefkasten werfen (vollständige Iteration) oder aber nur in *jeden zweiten* im Abschnitt der Hausnummern 26-37, vielleicht, weil wir bereits wissen, dass die anderen Häuser keine Werbung wünschen. Im ersten Fall gehen wir erst zum Haus Nummer 1, dann zur Nummer 2 etc.; im zweiten Fall erst zum Haus Nummer 26, dann zur Nummer 28, etc., bis wir mit Haus Nummer 36 abschließen. 

Für dieses "Nacheinander-Ansprechen" von bestimmten Elementen (in bestimmten Abschnitten) verwendet man Schleifen, die wir uns bald im Notebook "Kontrollstrukturen" anschauen. Für den Moment lernen wir, wie man mit Indexing ein einzelnes Element "ansprechen" kann und behalten im Hinterkopf, dass Indexing eingebaut in Schleifen eine mächtige Technik darstellt. 

Bei Listen haben wir wie gesagt schon kurz gesehen, wie Indexing funktioniert. Hier kommt das gleiche Beispiel noch einmal, ergänzt um Beispiele für strings und Tupel:

In [None]:
seasons = [["März", "April", "Mai"], 
           ["Juni", "Juli", "August"], 
           ["September", "Oktober", "November"], 
           ["Dezember"], "Januar", "Februar"]

print(seasons[0])

string = "Zeichenkette"

print(string[1])

a_tuple = (0, 1, 2)

print(a_tuple[2])

Um auf ein Element auf der Liste/im Tupel bzw. ein Zeichen in einem string zuzugreifen, setzt man den entsprechenden Index (sozusagen die Hausnummer) in **eckige Klammern** direkt nach dem Objekt bzw. der auf das Objekt zeigenden Variable. Die Indizes beginnen bei **null** (was unsere Straßenmetapher zugegebenermaßen leicht strapaziert). Neben den positiven Indizes gibt es auch negative, die hilfreich sind, um Elemente vom Ende des Objekts her zu indizieren. Hier ein Überblick über die positiven und negativen Indizes für die Elemente auf ```my_list```:

- ```my_list  = [  1, 2, 3, 4, 5, 6, 7, 8, 9,10]```
- ```index_p  =    0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ``` (positive Indizes)
- ```index_n  =  -10,-9,-8,-7,-6,-5,-4,-3,-2,-1 ``` (negative Indizes)

Das erste Element in ```my_list```, also `1`, hat den positiven Index ```0``` sowie den negativen Index ```-10``` und so weiter. Es spielt keine Rolle, ob wir positive oder negative Indizes verwenden. Folgender Code gibt also das gleiche Element zurück:

In [None]:
my_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(my_list[-1], my_list[9])

Sinnvoller ist es in diesem Fall jedoch, den negativen Index zu verwenden, da wir andernfalls wissen müssen, wie lang die Liste ist (nämlich zehn Elemente lang) und anschließend noch eins davon abziehen müssen (da die Indizes ja bei null beginnen), um den höchsten positiven Index `9` für das letzte Listenelement zu kennen.

Wenn ein sequentielles Objekt ein zweites sequentielles Objekt beinhält, können wir mit **doppeltem** Indexing auf das gewünschte Element im zweiten sequentiellen Objekt zugreifen:

In [None]:
my_list = ["Wort", ["Liste", "mit", "Wörtern"]]
print(my_list[1][1])

Befindet sich innerhalb des zweiten sequentiellen Objekts ein drittes, kann man ein bestimmtes Element innerhalb des dritten Objekts mit einer dritten eckigen Klammer "ansprechen", etc. (tatsächlich ist dies hier der Fall, denn "mit" ist als string ja auch ein sequentielles Objekt; versuch gerne, Dir nur das "m" mittels Indexing ausgeben zu lassen).

***

✏️ **Übung 4:** Kombinier Indexing mit einer weiteren bereits erlernten Technik, um aus den einzelnen Elementen in ```list_of_words1``` und  ```list_of_words2``` sowie aus ```conjunction``` einen string zu generieren, der natürlichsprachlich Sinn macht. Denk dabei auch an Leerschläge zwischen den einzelnen Wörtern. Definier für den fertigen string eine neue Variable und lass sie Dir am Ende ausgeben.

In [None]:
#In diese Zelle kannst Du den Code zur Übung schreiben.

list_of_words1 = ["Satz", "daraus", "Mach", "bitte", "sinnvollen", "einen"]
conjunction = "und"
list_of_words2 = ["Ende", "ausgeben.", "lass", "am", "Dir", "ihn"]


***
### Slicing 

Mit **Slicing** (übersetzt so viel wie *Herausschneiden*) können wir nicht nur ein einzelnes Element in einem sequentiellen Objekt "ansprechen", sondern **mehrere aufeinanderfolgende**. Dabei können wir definieren, bei welchem Index in der Sequenz wir anfangen wollen (```start``` in der Syntax unten), wo wir aufhören wollen (```end```) sowie einen Schrittparameter festlegen, falls wir jeweils *n* Elemente überspringen wollen (```step```). Die Syntax sieht wie folgt aus: 

```my_list[start:end:step]```

Beachte den **Doppelpunkt** zwischen den einzelnen Parametern.

Folgendes gilt es zu beachten: 

- Der ```end```-Index ist nicht-inklusive, d. h. das betreffende Element wird nicht mehr mit "herausgeschnitten".
- Wird für ```start``` oder ```end``` kein Index angegeben, so wird standardmäßig vom ersten bzw. bis (und, in diesem Falle, mit) dem letzten Element gesclict (siehe Beispiele unten).
- Der ```step```-Parameter ist optional, Standard ist ein Schritt von `1`, also *ein* Element nach dem anderen wird angesprochen und keines übersprungen.

Weiter illustrieren folgende Beispiele, wie Slicing funktioniert:

In [None]:
my_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

print(my_list[:]) #Gibt alle Elemente zurück (so macht Slicing wenig Sinn)
print(my_list[0:4]) #Gibt [1, 2, 3, 4] zurück
print(my_list[1:]) #Gibt [2, 3, 4, 5, 6, 7, 8, 9, 10] zurück, also vom Element mit Index 1 bis und mit letztem Element
print(my_list[:-1]) #Gibt [1, 2, 3, 4, 5, 6, 7, 8, 9] zurück, also alle Element außer dasjenige mit letztem Index
print(my_list[2:-1:2]) #Gibt [3, 5, 7, 9] zurück, der step (2) überspringt jeweils ein Element, step kann auch negativ sein, aber dann müssen start und end auch umgekehrt werden
print(my_list[::-1]) #Kehrt Liste mittels Slicing um

Um nochmals kurz die Straßenmetapher von oben aufzugreifen: Sind wir innerhalb unserer Straße mit den Hausnummern 1-50 (Indizes 0-49) nur an den Häusern 26, 28, 30, 32, 34 und 36 interessiert, da nur dort Werbung akzeptiert wird, können wir die Straße mittels Slicing auf unsere Zwecke "zuschneiden":

In [None]:
street = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50]
#street = list(range(1,51)) #Dieser viel kürzere Befehl mit der range-Funktion weist 'street' eine identische Liste zu (vgl. Notebook "Kontrollstrukturen").
accepts_advertising = street[25:36:2]
print(accepts_advertising)

***

✏️ **Übung 5:** Die Wörter in ```words_for_sentence``` ergeben in der abgespeicherten Reihenfolge keinen sinnvollen Satz. Überleg Dir erst, in welcher Reihenfolge die Wörter einen Sinn machen, und dann, wie Du mithilfe von Slicing (und nicht Indexing! 😉) die Wörter in die richtige Reihenfolge bringen kannst. 

Um von einer Liste zu einem string zu kommen, funktioniert der ```str```-Castingoperator leider nicht. Verwend stattdessen die bereits etwas fortgeschrittenere Technik ```join```, die folgende Syntax aufweist: 

```" ".join(list)``` 

```join``` konkateniert hier jedes Element in ```list``` mit einem Leerschlag dazwischen (also mit dem, was innerhalb der Anführungszeichen vor dem Punkt angegeben ist).

Zur Veranschaulichung von ```join``` folgt ein Beispiel: 

```sentence = " ".join(["Mach", "einen", "Satz", "aus", "mir."])```

In die runden Klammern von ```join``` setzen wir eine Liste. ```join``` verbindet nun alle Elemente dieser Liste durch einen Leerschlag zu insgesamt einer Zeichenkette. Diese wird ```sentence``` zugewiesen. ```sentence``` referenziert also den string "Mach einen Satz aus mir."

💡 Tipp: Erstell erst eine neue Liste mit den Wörtern des ersten Satzteils, dann eine Liste mit den Wörtern des zweiten Satzteils und verbind dann die beiden Listen zu einer Liste, in der alle Wörter in der richtigen Reihenfolge stehen. Wend nun ```join``` wie oben gezeigt an, um daraus einen string zu schaffen.

In [None]:
#In diese Zelle kannst Du den Code zur Übung schreiben.
words_for_sentence = ["Füge", "Satz", "bitte", "zusammen", "diesen", "."]




Mit ```join``` haben wir unsere erste sog. *Methode* kennengelernt. Zusammen mit *Funktionen* (von denen wir u. a. schon ```print```, ```len```, ```type``` und die Castingfunktionen kennen) machen sie Programmieren sehr effizient, denn sie sind im Grunde nichts anderes als vordefinierter Code, den wir mithilfe simpler Syntax benutzen können, anstatt ihn selbst schreiben zu müssen. Das Notebook "Funktionen und Methoden" widmet sich ihnen im Detail.

***

## 2. Iterierbarkeit

Datentypen unterscheiden sich zweitens hinsichtlich ihrer *Iterierbarkeit* (engl. *iterability*). Iterierbare Objekte sind Objekte, die die in ihnen enthaltenen Elemente einzeln ausgeben können. Dazu zählen folgende Datentypen:

```str```, ```list```, ```tuple```, ```dict```, ```set```

Bei ```list```, ```tuple```, ```set``` und ```dict``` sind mit den einzelnen Elementen natürlich die Elemente auf der Liste, im Tupel, im Set bzw. Schlüssel-Werte-Paare im dictionary gemeint (wobei bei dictionaries auch nur auf die Schlüssel oder nur auf die Werte einzeln zugegriffen werden kann, wie wir im Notebook "Funktionen und Methoden" lernen werden). Bei ```str```-Objekten sind wie schon beim Thema "Sequentialität" die einzelnen Zeichen gemeint.

Um die einzelnen Elemente eines iterierbaren Objekts nacheinander auszugeben, wird eine ```for```-Schleife benutzt, der wir schon verschiedentlich begegnet sind und die im Notebook "Kontrollstrukturen" im Detail besprochen wird. Hier noch einmal ein Ausblick auf eine ```for```-Schleife zum Iterieren über eine Liste:

In [None]:
days = ["Montag", "Dienstag", "Mittwoch", "Donnerstag", "Freitag", "Samstag", "Sonntag"]

for day in days:
    print(day)

Die Iteration hört dann auf, wenn das Objekt aufgebraucht (engl. *exhausted*) ist.

***

✏️ **Übung 6:** Orientier Dich an dem Beispiel oben und benutz eine ```for```-Schleife, um über die Liste ```wild_mix``` von oben zu iterieren (stell zuvor sicher, dass die Variable noch initialisiert ist, indem Du die entsprechende Zelle noch einmal ausführst). Lass Dir für jedes Element den Datentyp ausgeben. 

💡 Tipp: Zwischen ```for``` und ```in``` kannst Du irgendeinen Variablennamen verwenden. Im obigen Beispiel ist ```day``` intuitiv verständlich, Du könntest aber theoretisch irgendeine andere Variable wählen (*theoretisch*, denn auch diese Variable soll nach Möglichkeit sprechend sein, vgl. Notebook "Einführung"). Wichtig ist in jedem Fall, dass Du im Anweisungskörper die entsprechende Variable wiederverwendest (siehe "day" im ```print```-Befehl oben).

In [None]:
#In diese Zelle kannst Du den Code zur Übung schreiben.




***

## 3. Veränderlichkeit (fortgeschritten)

Drittens unterscheiden sich Datentypen hinsichtlich ihrer *Veränderlichtkeit* (engl. *mutability*). Das haben wir bereits im Zusammenhang mit den dictionaries angeschnitten. 

### Unveränderliche Datentypen

Zu den *unveränderlichen Datentypen* (engl. *immutable data types*) gehören:

```str```, ```int```, ```float```, ```tuple```, ```bool```

Unveränderliche Objekte können ihren Wert nicht ändern. Bei einem string oder Tupel etwa ist es also nicht möglich, weitere Zeichen bzw. Elemente anzuhängen, Zeichen/Elemente auszutauschen oder zu entfernen. Das ist nicht wirklich offensichtlich, denn wenn man versucht, einen string zu verlängern (mittels ```string += "verlängerung"```), erhält man keine Fehlermeldung. Das liegt daran, dass Python im Hintergrund einfach ein **neues** Objekt schafft. Das alte Objekt verliert seine Referenz und *verwaist*. 

### Veränderliche Datentypen

Zu den *veränderlichen Datentypen* (engl. *mutable data types*) gehören: 

```list```, ```dict```, ```set```

Veränderliche Objekte können ihren Wert ändern. Es ist also möglich, weitere Elemente anzuhängen, auszutauschen oder zu entfernen. Wendet man also den ```+=```-Operator auf eine Liste an, so handelt es sich nachher immer noch um das **gleiche** Objekt.

### Exkurs zur Identität von Objekten

Die ```id```-Funktion, die die einzigartige "Adresse" eines Objekts im Arbeitsspeicher zurückgibt, macht dieses unterschiedliche Verhalten bei unveränderlichen vs. veränderlichen Objekten sichtbar:

In [None]:
#Unveränderlich Datentyp
string = "Hallo"
id_before_change_str = id(string)
string += " Welt"
id_after_change_str = id(string)

print("Das string-Objekt ist immer noch das gleiche:", id_before_change_str == id_after_change_str, "\n→", 
     "denn", id_before_change_str, "ist ungleich", id_after_change_str)

#Veränderlicher Datentyp
a_list = ["Hallo"]
id_before_change_list = id(a_list)
a_list += ["Welt"]
id_after_change_list = id(a_list)

print("Das list-Objekt ist immer noch das gleiche:", id_before_change_list == id_after_change_list, "\n→",
     "denn", id_before_change_list, "ist gleich", id_after_change_list)

Führt man eine zweite Variable ein, um auf ein bereits referenziertes veränderliches Objekt zu zeigen, so zeigen beide Variablen auf dasselbe Objekt. Wird das Objekt verändert, egal über welche Variable, so zeigt sich die Veränderung auch beim Aufruf über die andere Variable. Konkret:

In [None]:
list1 = [0,1,2]
list2 = list1
list2.append(3) #Die Listenmethode 'append' hängt das Element in Klammern der Liste vor dem Punkt an (vgl. Notebook "Funktionen und Methoden").
print(list1) #Gibt [0,1,2,3] zurück

Auch die ```id```-Funktion bestätigt hier natürlich, dass es sich um dasselbe Objekt handelt (anders wäre auch nicht zu erklären, warum die Ausgabe von ```list1``` die Veränderung am durch ```list2``` referenzierten Objekt wiedergibt):

In [None]:
print(id(list1) == id(list2))

#Das is-Statement erfüllt die gleiche Aufgabe:
print(list1 is list2)

Die ```id```-Funktion (bzw. das ```is```-Statement) ist übrigens nicht dasselbe wie der ```==```-Vergleichsoperator. Dieser vergleicht lediglich die Werte zweier Objekte, nicht aber, ob es sich im Kern um dasselbe Objekt mit derselben ID handelt. 

Folgendes Beispiel illustriert dies:

In [None]:
new_list1 = [1,2,3]
new_list2 = [1,2,3]

print("Dieselben Werte:", new_list1 == new_list2)
print("Dieselbe ID:", id(new_list1) == id(new_list2))

Im ersten Fall vergleichen wir die Werte der beiden Listen und das ergibt ```True```. Im zweiten Fall schauen wir, ob es sich auch um dasselbe Objekt handelt und dies ergibt ```False```. Der Grund dafür: Python erstellt beim Initialisieren einer Variable i. d. R. jeweils ein neues Objekt (selbst wenn ein Objekt mit denselben Werten bereits im Arbeitsspeicher existiert) und so wurden auch hier zwei Objekte erstellt (es gibt wenige Ausnahmen bei kleinen Ganzzahlen und strings ohne Sonderzeichen, die trotz getrennt initialisierter Variablen auf das gleiche Objekt zeigen). 

Den Unterschied zwischen ```id(object1) == id(object2)```/```object1 is object2``` und ```object1 == object2``` gibt es auch im Deutschen: Im ersten Fall handelt es sich um dasselbe Objekt, im zweiten Fall nur um das gleiche Objekt. Du hast vielleicht die gleichen Schuhe wie Dein:e Freund:in, aber wohl nicht dieselben. Im Deutschen ist das aber kaum so eineindeutig wie bei Python. 😅

Wenn ```a is b``` gilt, dann gilt natürlich immer auch ```a == b```, aber nicht unbedingt umgekehrt.

Das war's zum Thema Datentypen. Im Ordner "2_Cheat_Sheets" gibt es übrigens eine Übersicht über alle Datentypen, die wir hier kennengelernt haben – inklusive ihrer Kurzform, Syntax und ihren Eigenschaften.