# Listen, Tupel und `List Comprehensions`

## Listen
In Python ist die **Liste** eine der ***wichtigsten*** und meistverwendeten Datenstrukturen. Wegen der Verwendung eckiger Klammern erinnert sie an Java-Arrays, entspricht in der Implementierung aber eher Javas *ArrayList*. Listen können beliebig wachsen und schrumpfen, sind aber so implementiert, dass sie trotzdem die **hervorragenden** Laufzeiteigenschaften von Arrays haben (promised!).

In [None]:
# Liste von Integern
zahlenliste = [2, 3, 5, 7, 11, 13]
# Liste von Strings
#String[] namensliste = new String[20000];
namensliste = ["Anna", "Berta", "Carla", "Doris", "Emilia", "Franziska", "Gabi", "Hannah", "Iris"]
# Liste mit Einträgen unterschiedlicher Datentypen, wäre das möglich in Java?
gemischte_liste = ["Harry", 12, "Albus", 115, "Nicolas", 665]
# verschachtelte Liste
verschachtelte_liste = [["Dudley", 13, ["Privet Drive", 4]], ["Albus", 115, ["Hogwarts"]]]
# Bsp. für einen Baumstruktur mit Listen: 
# oft ist es allerdings noch geschickter, für solche Strukturen ein *dictionary* zu verwenden (s. dort).
stammbaum = ["Oma", ["Tochter 1", ["Enkelin 1", "Enkelin 2"], "Tochter 2", ["Enkelin 3", ["Urenkelin 1"]]]]

In [None]:
zahlenliste[0]

In [None]:
zahlenliste[0] = 42
zahlenliste

In [None]:
namensliste[3]

In [None]:
len(namensliste)

In [None]:
print(namensliste)
namensliste.append("Johanna")   # ein neues Element anfügen
#namensliste.extend(zahlenliste)   # eine andere Liste anhängen
namensliste

In [None]:
namensliste.append("Gina")   # Oh, jetzt haben wir ja zwei Namen mit "G" - also entfernen wir einen wieder!
namensliste.remove("Gabi")   # aber die alphabetische Reihenfolge ist dahin... Was tun?
print(namensliste)
namensliste[4] = "killswitch"
#namensliste
namensliste.remove("killswitch")        # idx not found?
namensliste.sort()           # ...und fertig sortiert!
namensliste

### List Slicing
#### siehe auch
* https://stackoverflow.com/questions/509211/understanding-slice-notation

Ich hoffe, Sie werden nun so gaaanz langsam anfangen zu staunen und vielleicht auch etwas Feuer zu fangen. Der Umgang mit Listen, Teillisten sowie der Zugriff auf solche `slices` ist sehr elegant. 

In [None]:
# Wie kommt man an das letzte Element? In den meisten anderen Sprachen müsste man schreiben:
# etwas schreiben wie: namensliste[len(namensliste)-1] 
# In Python geht das viel einfacher:
print(namensliste)
namensliste[-3]  

In [None]:
# Slicing: liefert einen "Ausschnitt" (Teilliste).
# Liste[Start(inkl):Ende(exkl):Schrittweite(default=1)]  
#namensliste[1:4]
namensliste[1:3] + namensliste[3:5] # Konkatenation zweier Teillisten/slices
#namensliste[1:3].extend(namensliste[3:5]) # reference vs value vs copy


In [None]:
namensliste[0:7:2]  # Schrittweite 2, d.h. nur Element 0, 2, 4, 6

In [None]:
# Start- und Endindex fehlen => ganze Liste, Schrittweite 2
#namensliste[::1]
namensliste

In [None]:
# Start beim drittletzten Element, Endindex nicht angegeben, rückwärts (Schrittweite -1)
namensliste[-3::-1]

Listen können u.a. selbst auch Listen enthalten:

In [None]:
verschachtelt = [[0, 1], [2, 3], [4, 5], [6, 7]]
# CAVE: index innerhalb der Liste, wie "gewohnt", zero-based
verschachtelt[2][1]

### Über Listen iterieren (i.e. die einzelnen Elemente, z.B. mit einer Schleife, verarbeiten)

#### Die for-Schleife

Über alle Elemente einer Liste zu iterieren ist in Python denkbar einfach:

In [None]:
for name in namensliste: # erweiterte for-Schleife, sozusagen eine foreach
    print("Hallo", name)

#### enumerate()

Manchmal benötigt man nicht nur die Elemente selbst, sondern auch ihren Index, d.h. ihre Position bzw. ihren Index innerhalb der Liste. Man könnte eine klassische "Zählschleife" verwenden... Aber Python hat auch hierfür eine elegante Lösung in Petto.

In [None]:
# kann man so machen... funktioniert
for i in range(len(namensliste)): 
    print(namensliste[i], end=" ")


**Viel** eleganter ist es, die Funktion `enumerate()` zu nutzen. Diese erzeugt aus einer Liste von Werten *Paare* der Form (Index, Wert):

In [None]:
# Let the games begin...
# enumerate "nummeriert" die Werte durch und gibt zwei Rückgaben, die in i und name verarbeitet werden können
for (i, name) in enumerate(namensliste):
    print(f"{name} steht an Position {i} der Liste, d.h. sie ist das {i+1}. Element.")

#### zip()

Und weiter im Zweikampf... :)

Wie geht man vor, wenn man "parallel" über zwei Listen iterieren will?

Im folgenden Beispiel soll der vollständige Name jeder Person ausgegeben werden. Allerdings sind die Vor- und Nachnamen in zwei *separaten* Listen gespeichert. Auch hier könnte man mit einer Zählschleife bzw. Hilfsvariablen einen Index mitführen und damit auf die beiden Listen zugreifen. Man könnte natürlich auch mit enumerate() über eine Liste iterieren und den Index daraus für den Zugriff auf die zweite Liste nutzen. 

*Oder*, man nimmt Python... :) Die Funktion `zip()`, die - wie ein Reißverschluss (engl. zipper) - "verhakt" die Elemente beider Listen paarweise ineinander:

In [None]:
vornamen = ["Anna", "Berta", "Carla"]
nachnamen = ["Adler", "Bär", "Chamäleon"]

#for vn, nn in zip(vornamen, nachnamen):   # erzeugt ("Anna", "Adler"), ("Berta", "Bär") usw.
#    print(vn, nn)

In [None]:
for i in range(len(vornamen)):
    print(vornamen[i], nachnamen[i])
    
for (i, vorname) in enumerate(vornamen):
    print(vorname, nachnamen[i])

print(list(zip(vornamen, nachnamen)))
    
for (vn, nn) in zip(vornamen, nachnamen):   # erzeugt ("Anna", "Adler"), ("Berta", "Bär") usw.
    print(vn, nn)

In [None]:
# Die Elemente der beiden Listen sollen paarweise addiert werden zu [11, 22, 33, 44, 55] (ebenfalls einer Liste)
zahlen1 = [1, 2, 3, 4, 5]
zahlen2 = [10, 20, 30, 40, 50]

# möglich:
"""
for i in range(len(zahlen1)):
    z1 = zahlen1[i]
    z2 = zahlen2[i]
    print(z1+z2)
"""

# Python:
for (z1, z2) in zip(zahlen1, zahlen2):
    print(z1+z2)
    
# wenn als Ergebnis eine Liste gefordert ist:
resList = []
for z1, z2 in zip(zahlen1, zahlen2):
    resList.append(z1+z2)

resList

## Tupel
Auch **Tupel** werden in Python häufig verwendet. Ein Tupel repräsentiert meist einem  **Datensatz** mit *fester* Länge und mit Werten potentiell unterschiedlicher Datentypen.

Bsp. `produkt = ("Tesla", "Model X", 100000)`

Tupel ähneln Listen; die meisten üblichen Listenoperationen sind auch mit Tupeln möglich. Tupel werden aber mit *runden* statt mit eckigen Klammern ausgezeichnet.

Wichtige Eigenschaften von Tupeln:
* unveränderlich (immutable)
* insb. kann auch kein Wert hinzugefügt oder gelöscht werden
* unterschiedliche Datentypen möglich (geht bei Listen natürlich auch)

In [None]:
person1 = ("Harry", "Potter", 11)
person2 = ("Hermione", "Granger", 11)
person3 = ("Nicolas", "Flamel", 690)

In [None]:
# Zugriff auf Einzelwerte wie bei Liste/Array über Index.  
person1[0]    
# Alternativ: namedtuple oder dataclass (ab 3.7)
# person1[0] = "James"   # das ist verboten! immutable!
test = []
test.append(person1)
for ding in person1:
    test.append(ding)
test # convert tuple to list ??? commodity / built in
test[1] = "James"
test

In [None]:
tup = 1, 2, 3   # Klammern können auch weggelassen werden
type(tup)

In [None]:
# Destrukturierung: Tupel wird in Einzelteile zerlegt und verschiedenen Variablen zugewiesen
#(z1, z2, z3) = (32, 17, -4) 
z1, z2, z3 = (32, 17, -4) 
print(z1, z2, z3)
vorname, nachname, alter = person1   
print(vorname, alter)

In [None]:
a = 1
b = 2

#a, b = b, a        # Hilfsvariablen werden überbewertet. Naja, der Trick ist, es wird ein neues Tupel erzeugt
(a, b) = (b, a)   # "man" sieht es nur nicht, da die runden Klammern weggelassen sind :)
print(a, b)

In [None]:
for wert in person1:   # Schleife über die Elemente des Tupels, analog zu den Einträgen einer Liste
    print(wert)

In [None]:
personen = [person1, person2, person3]     # Kong-Foo ante portas => Liste von Tupeln
for person in personen:
    for wert in person:
        print(wert)

## PAUSE!! 
### Wirklich... Was jetzt kommt braucht einen entspannten Kopf! Es wird noch einen Takken "magischer" :)

### List comprehension (etwa: Listenabstraktion)
Eine der wesentlichen Aufgaben des Computers ist die Daten**v**erarbeitung: Datenmengen werden untersucht, Teile ausgewählt, vearbeitet und wieder zurückgeliefert oder angepasst. In den meisten Programmiersprachen wird dazu meist in  einer Schleife über eine Liste/Array iteriert, entlang Bedingungen (if) eine Auswahl getroffen und (evtl. veränderte) Daten in einer neuen Datenstruktur gespeichert. Oft ist der Zweck dieses mehrstufigen Verfahrens, z.B. im Vergleich zu einer SQL-Abfrage, nur schwer zu erkennen.

#### Siehe auch
* https://towardsdatascience.com/python-basics-list-comprehensions-631278f22c40

Python bietet mit *list comprehensions* eine sehr kompakte Darstellung solcher Auswahl- und Transformationsprozesse. CAVE: Zuerst scheint diese Darstellung *schwer lesbar* - das legt sich aber, promised! Sehr bald werden Sie die Kompaktheit und Eleganz dieser Darstellung zu schätzen wissen.

Die List comprehension ist an die mathematische Mengenschreibweise (beschreibende Form, erinnern Sie sich? :>) angelehnt. So beschreibt beispielsweise der Ausdruck $ C=\{ x | x = b^2 \land 10 \leq b < 20, b \in \mathbb{N} \} $ die Menge $C$ der Quadratzahlen aller natürlichen Zahlen zwischen 10 und 20 (10 inklusive, 20 exklusive). 

Man könnte also schreiben (Ergebnis als Liste):

In [None]:
quadrate = []
for b in range(10,20):
    quadrate.append(b**2)
    
quadrate

Nun mit **list comprehension**:

In [None]:
quadrate = [b**2 for b in range(10, 20)]

quadrate # voila!

Die Listennotation mit [eckigen Klammern] wird also nicht nur verwendet, um Elemente explizit aufzuzählen, sondern auch um Listen aus anderen Werten, List-Elementen, ... zu *berechnen* bzw. diese *auszuwählen*.

Syntax: `[Berechnung for Variable in Liste if Bedingung]`

Vergleiche Sie nochmals die Lösungsansätze "traditionell" und mit "list comprehension".

Aufgabe:
Geben Sie in GROSSBUCHSTABEN alle Namen aus einer Liste *namensliste* aus, die mindestens fünf Zeichen lang sind.

In [None]:
# namensliste von oben
namensliste = ["edgar","samir","san","robinho","leon","siberxxxxxxx"]




# mit Schleife:
#namen_neu = []
#for name in namensliste:
#    if len(name) > 4:
#        namen_neu.append(name.upper())
#print(namen_neu)

# mit list comprehension:
namen_neu = [name.upper() for name in namensliste if len(name) > 4]
print(namen_neu)

#### Und das, meine lieben Freunde der gepflegten Informatik, war noch lange nicht alles. Sie sollten bis hierher zumindest ein klitzekleines Gefühl für Listen und Tupels haben und schonmal was von *list comprehensions* gehört haben, im besten Falle solche decodieren/lesen können!