## Listen und Sequenzdatentypen

Sehr häufig müssen viele Variablen der Reihenfolge nach zusammengefasst werden. Beispiele hierfür sind:
* Messungen einer physikalischen Größe (Temperaturverlauf während eines Tages, Windrichtung, ...)
* Datenpunkte für Plots (x und y Koordinaten)
* Matrizen / Vektoren
* Buchstabenfolgen (als Zusammensetzung einzelner Zeichen zu einer Zeichenkette)

Python bietet hierfür einen Datentyp (eine Datenstruktur) namens <code>list</code> an, man spricht von einem sogenannten **Sequenzdatentyp**. Eine Liste wird in Python mit eckigen Klammern erstellt:

In [1]:
# Leere Liste anlegen
empty_list = []
print(empty_list, type(empty_list))

# Liste aus ganzen Zahlen
list_of_numbers = [1, 2, 3, 5, -1]
print(list_of_numbers)

[] <class 'list'>
[1, 2, 3, 5, -1]


Eine Liste darf auch unterschiedliche Datentypen, also zum Beispiel auch wieder Listen, enthalten:

In [2]:
list_mixed = [1, 2, 3, 4, 'a', ['b', 5]]
print("Ausgabe der Liste mit Hilfe des print() Befehls:", list_mixed)
print("Datentyp:", type(list_mixed))

Ausgabe der Liste mit Hilfe des print() Befehls: [1, 2, 3, 4, 'a', ['b', 5]]
Datentyp: <class 'list'>


### Operationen mit Listen
Die folgende Tabelle gibt einen Überblick über die wichtigsten Operationen mit Listen:
<table style="font-size: 1em">
 <thead>
  <tr>
   <th>Befehl</th>
   <th>Beschreibung</th>
  </tr>
 </thead>
 <tbody>
  <tr>
   <td><code>x in s</code></td>
   <td><code>True</code>, falls <code>x</code> in <code>s</code> enthalten ist</td>
  </tr>
  <tr>
   <td><code>x not in s</code></td>
   <td><code>True</code>, falls <code>x</code> nicht in <code>s</code> enthalten ist</td>
  </tr>
  <tr>
   <td><code>s + t</code></td>
   <td>Zusammengesetzte Liste aus <code>s</code> und <code>t</code></td>
  </tr>
  <tr>
   <td><code>s*n</code></td>
   <td><code>n</code>-malige Wiederholung der Liste <code>s</code></td>
  </tr>
  <tr>
   <td><code>s[i]</code></td>
   <td><code>i</code>-tes Element der Liste <code>s</code>. Beginnend ab 0.</td>
  </tr>
  <tr>
   <td><code>s[i:j]</code></td>
   <td>Ausschnitt <code>i-j</code>der Liste <code>s</code></td>
  </tr>
  <tr>
   <td><code>s[i:j:k]</code></td>
   <td>Ausschnitt <code>i-j</code>der Liste <code>s</code> mit Schrittweite k</td>
  </tr>
  <tr>
   <td><code>len(s)</code></td>
   <td>Anzahl der Elemente von <code>s</code></td>
  </tr>
  <tr>
   <td><code>s.count(x)</code></td>
   <td>Anzahl wie oft <code>x</code> in <code>s</code> vorkommt.</td>
  </tr>
  <tr>
   <td><code>s.append(x)</code></td>
   <td>Hängt <code>x</code> an die Liste <code>s</code> an.</td>
  </tr>
  <tr>
   <td><code>s.insert(i,x)</code></td>
   <td>Fügt das Element <code>x</code> an die i-te Stelle in der Liste <code>s</code> ein.</td>
  </tr>
  <tr>
   <td><code>sum(s)</code></td>
   <td>Addiert die Elemente der Liste <code>s</code>.</td>
  </tr>
  <tr>
   <td><code>max(s)</code></td>
   <td>Findet das maximale Element in der Liste <code>s</code>.</td>
  </tr>
  <tr>
   <td><code>del s[i]</code></td>
   <td>Löscht das i-te Element aus der Liste <code>s</code></td>
  </tr>
 </tbody>
</table>

Es folgen einige Beispiele zur Verwendung der obigen Befehle, beginnend mit dem <code>in</code> Befehl.

In [4]:
s = [1, 2, '3', [4, 5]]
print(2 in s)
print(4 in s)
print(3 in s)
print([4,5] in s)

True
False
False
True


Häufig müssen wir Listen mit $n$-mal dem gleichen Element anlegen:

In [5]:
n = 10
long_list = [1,2,3,4,5]*n
print(long_list)
print("Länge von long_list =", len(long_list))

[1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
Länge von long_list = 50


Kombination von Listen:

In [6]:
s = [1,2,3]
t = [4,5,1]
print(s + t)  # s.append(t) funktioniert hier nicht, wird später erklärt
print(s*4)
print(len(s + t*4))

[1, 2, 3, 4, 5, 1]
[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]
15


### Indizierung von Listen:
Die Elemente einer Liste sind in Python von 0 beginnend indiziert, bspw. wird die Liste <code>s = [1, 44, ['s', 'p'], '4', 5]</code> intern folgendermaßen indiziert:
<table style="font-size: 1em"><tr><th>Index</th><td>0</td><td>1</td><td>2</td><td>3</td><td>4</td></tr>
<th>-Index</th><td>-5</td><td>-4</td><td>-3</td><td>-2</td><td>-1</td></tr>
<tr><th>Wert</th><td>1</td><td>44</td><td>['s', 'p']</td><td>'4'</td><td>5</td></tr></table>

Damit kann direkt auf die Elemente der Liste zugegriffen werden, die negativen Indizes stellen dabei einen gewissen zyklischen Zugriff sicher, allerdings "nur einmal" und nicht komplett zyklisch:

In [7]:
s = [1, 44, ['s', 'p'], '4', 5]
print("s[0] =", s[0])
print("s[2] =", s[2])
print("s[-4] =", s[-4])
print("s[-6] =", s[-6])  # Index 6 existiert nicht

s[0] = 1
s[2] = ['s', 'p']
s[-4] = 44


IndexError: list index out of range

In [8]:
# Der Zugriff kann auch verschachtelt stattfinden, um auf Listen von Listen zuzugreifen:
s = [1, 44, ['s', 'p'], '4', 5]
print("s[2][1] =", s[2][1])

s[2][1] = p


Gängige Listenoperationen können damit wie folgt selektiv ausgeführt werden:

In [9]:
s = [1,2,3]
s[0] = -1   # Ändert den Wert an der esten Stelle zu -1
print(s)
s.append(4) # Hängt die 4 an das Ende der Liste an
print(s)
s.insert(4,1) # Fügt die Zahl 1 an der 4ten (eigentlich 5ten, wegen der Null-Indizierung) Stelle ein
print(s)
del s[2]    # Löscht das dritte (Index 2) Element der Liste
print(s)
del s[0:3]  # Es können auch mehrere Elemente auf einmal gelöscht werden
print(s)

[-1, 2, 3]
[-1, 2, 3, 4]
[-1, 2, 3, 4, 1]
[-1, 2, 4, 1]
[1]


### Extraktion von Teillisten
Python bietet mit dem Doppelpunkt-Operator eingebaute Mechanismen, um Teillisten zu extrahieren. Dabei gilt die folgende Regel: Bei allen Indexoperationen wird der Startindex stets dazugezählt, der letzte Index wird aber nicht beachtet. Das ist eine Konsequenz der Indizierung mit 0.

In [10]:
s = [1, 44, ['s', 'p'], '4', 5]
print("s[0:2] =", s[0:2])
print("s[1,3] =", s[1:3])
print("s[0:len(s)] =", s[0:len(s)])


s[0:2] = [1, 44]
s[1,3] = [44, ['s', 'p']]
s[0:len(s)] = [1, 44, ['s', 'p'], '4', 5]


In [14]:
s = [1, 44, ['s', 'p'], '4', 5]

# Wird das zweite Argument weggelassen, wird stets bis zum Ende iteriert:
print("s[0:] =", s[0:])  # Index 0,1,2,3,4
# Wird das erste Argument weggelassen, wird stets am Anfang begonnen
print("s[:3] =", s[:3])  # Index 0,1,2

s[1:] = [44, ['s', 'p'], '4', 5]
s[:3] = [1, 44, ['s', 'p']]


In [11]:
s = [1, 44, ['s', 'p'], '4', 5]

# Mit dem dritten Argument wird festgelegt, in welcher Schrittweite iteriert wird:
# Wir extrahieren in Zweierschritten aus der Liste:
print("s[0:len(s):2] =", s[0:len(s):2])
# Und die dazu passende abkürzende Schreibweise:
print("s[::2] =", s[::2])

s[0:len(s):2] = [1, ['s', 'p'], 5]
s[::2] = [1, ['s', 'p'], 5]


Die Elemente der Liste können auch von hinten beginnend indiziert werden:

In [2]:
s = [1, 44, ['s', 'p'], '4', 5]
# Letztes Element:
print(s[-1])
# Letzten 3 Elemente:
print(s[-3:])
# Zweites bis vorletztes Element:
print(s[1:-1])

5
[['s', 'p'], '4', 5]
[44, ['s', 'p'], '4']


## Beispiele: Listen

### Beispiel: Liste der ersten 10 Quadratzahlen

In [1]:
square_numbers = []
i = 1
while i<=10:
    square_numbers.append(i*i)
    i = i + 1

print(square_numbers)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


### Beispiel: Fibonacci Zahlen
Eine sehr bekannte Folge in der Mathematik ist die sogenannte Fibonacci-Folge:
Für $ f_1 = 1, f_2 = 1 $ definieren wir die Vorschrift
$$ f_n = f_{n-1} + f_{n-2}, \quad \text{für } n>2. $$
Wir übersetzen die Vorschrift in ein Python-Programm mit Listen:

In [2]:
# Wir geben die Fibonacci-Zahlen f_n bis n_max aus
n_max = 10
# Wir initialisieren die Folge zunächst mit Einsen.
# Damit sind automatisch die ersten beiden Folgen-Glieder
# korrekt initialisiert.
f = [1]*n_max

# Wegen der Nullindizierung beginnt die Schleife bei 2 und nicht bei 3
i = 2
while i < n_max:
    f[i] = f[i-1] + f[i-2]
    i += 1

print("Die ersten", n_max, "Fibonacci-Glieder sind")
print(f)

Die ersten 10 Fibonacci-Glieder sind
[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]


## Mini-Aufgaben zur Überprüfung des Verständnis: Listen

Indizieren Sie die folgenden Zugriffe korrekt:

In [2]:
q = [['a', 'b', 'c'], ['d', 'e', 'f'], ['g', 'h'], 'i']
print("Buchstabe a =", ...)
print("Buchstabe i =", ...)
print("Buchstabe i =", ...) # alternative Lsg
print("Die Liste [’d’, ’e’, ’f’] =", ...)
print("Das vorletzte Elemente 'h' =", ...)

# Lösung
q = [['a', 'b', 'c'], ['d', 'e', 'f'], ['g', 'h'], 'i']
print("Buchstabe a =", q[0][0])
print("Buchstabe i =", q[-1])
print("Buchstabe i =", q[3])
print("Die Liste [’d’, ’e’, ’f’] =", q[1])
print("Das vorletzte Elemente 'h' =", q[-2][-1])

Buchstabe a = a
Buchstabe i = i
Buchstabe i = i
Die Liste [’d’, ’e’, ’f’] = ['d', 'e', 'f']
Das vorletzte Elemente 'h' = h


Wir verwenden verschachtelte Listen, um einen einfachen Terminkalender abzuspeichern, der keine Stunden kennt. Schreiben Sie ein Programm, mit dem Sie prüfen können, ob ein gegebener Tag noch frei ist. Falls dieser nicht frei ist, geben Sie den entsprechenden Termin aus.



Hinweise:
* Verwenden Sie eine Schleife, und extrahieren Sie zunächst die einzelnen Kalendereinträge
* Verwenden Sie dann geeignete bedingte Anweisungen, um einen Kalendereintrag auf eine Kollision zu überprüfen
* Beachten Sie, das bei Tag-Monat-Jahr punktgenaue Treffer zählen

In [11]:
calendar = [
    # Format:
    # Datum       , Beschreibung
    [[22, 8, 2023], 'Geburtstag Dominik'],
    [[14, 4, 2023], 'Kino'],
    [[15, 4, 2023], 'Vorlesungsvorbereitung Programmierkurs'],
    [[16, 4, 2023], 'Treffen mit P.'],
    [[17, 4, 2023], 'Sport']
]

# Datum, das auf Verfügbarkeit überprüft werden soll 
day = 22
month = 4
year = 2023

# Lösung
termin_frei = True
for event in calendar:
    td, tm, ty = event[0]
    if td == day and tm == month and ty == year:
        termin_frei = False
        termin = event[1]

if termin_frei:
    print('Termin ist verfügbar')
else: print('An diesem Tag ist bereits:', termin)

22 8 2023
14 4 2023
15 4 2023
16 4 2023
17 4 2023
Termin ist verfügbar


## Comprehensions für iterierbare Datenstrukturen

Mit **Comprehensions** bietet Python eine spezielle Möglichkeit, um mit sogenannten **iterierbaren Objekten zu arbeiten**, also beispielsweise mit Listen, Dictionaries und Mengen. Die allgemeine Syntax lautet:

<code> Anweisung(en) for Element in IterierbaresObjekt if BedingungFürElement </code>

Hierbei ist der if-Teil optional. Es folgen einige Beispiele, die verdeutlichen, dass sich mit Comprehensions viele Dinge sehr bequem abbilden lassen. Wir betonen aber bereits an dieser Stelle, dass Comprehensions keine neuen Möglichkeiten schaffen. Im Gegenteil lassen sich alle Comprehensions auch manuell mit (indizierten) Schleifen (<code>for</code> oder <code>while</code>) "nachbauen". Die in Python bereitgestellten Comprehensions sind allerdings meist **effizienter**, und immer **einfacher** in der Nutzung. Um diese These zu verifizieren, empfiehlt es sich, exemplarische Beispiele in verschiedenen Varianten zu programmieren,  und mit der Stoppuhr-Funktion zu untersuchen.


## List Comprehensions

Wir beginnen mit einfachen Comprehension-Ausdrücken über Listen. Der obige generelle Syntax für eine Comprehension wird bei List Comprehensions in eckige Klammern eingebettet. Zur Erinnerung: <code>my_list = []</code> ist der Initialisator für leere Listen, und <code>list = [ 1,2,3,4 ]</code> erzeugt eine initialisierte Liste. Deshalb ist es klar, dass eine Comprehension genau dann eine Liste erzeugt, wenn sie in eckige Klammern eingeschlossen ist.

Die folgenden Beispiele verdeutlichen die Einfachheit und Mächtigkeit von List Comprehensions:

In [None]:
A = [1, 2, 3, 4]
#A = "abcd"  # Die Eingabe für eine List Comprehension muss keine Liste sein!

# Iteration über ganz A
print([i for i in A])
# Alternativ: 
my_list = [i for i in A]
print(my_list)


[1, 2, 3, 4]
[1, 2, 3, 4]


In [None]:
A = [1, 2, 3, 4]

# Iteration über fast ganz A,
# Verdeutlichung dass der Index ungleich der Ausgabe ist
print([i+5 for i in A if i != 1])


[7, 8, 9]


In [None]:
A = [1, 2, 3, 4]

# Comprehensions können auch geschachtelt werden
print([(i,j) for i in A for j in A])

[(1, 1), (1, 2), (1, 3), (1, 4), (2, 1), (2, 2), (2, 3), (2, 4), (3, 1), (3, 2), (3, 3), (3, 4), (4, 1), (4, 2), (4, 3), (4, 4)]


Im letzten Beispiel wird ein <code>tuple</code> verwendet, welche für Sequenzen fester Länge sinnvoll ist. Im Beispiel ist die Länge 2, ein Tupel fasst genau zwei Werte zusammen. Der Syntax für Tupel ist eine Komma-separierte Liste von Variablen, die durch runde Klammern eingeschlossen werden. Wie Strings sind solche Variablen aber nicht veränderbar ("immutable"), das diskutieren wir im Detail später.

Das folgende Beispiel zeigt ausführlicher, wie Tupel in Python funktionieren:

In [None]:
t = ("wort",4)
print(t)
print(type(t))

# Extraktion der Elemente des Tupels
a, b = t
print(a,b)

# Beispiel für eine logische Operation mit Tupeln
print("wort" in t)

('wort', 4)
<class 'tuple'>
wort 4
True


### Beispiel: Alle geraden / ungeraden Zahlen
Wir erzeugen Listen aller geraden und ungeraden Zahlen bis zu einem vorgegebenen Maximalwert:

In [None]:
nmax = 20
# Erinnerung: das zweite Argument von range() ist exklusive
odd_numbers = [s for s in range(0, nmax+1) if s%2 == 1]
even_numbers = [s for s in range(0, nmax+1) if s%2 == 0]
print("odd_numbers =", odd_numbers)
print("even_numbers =", even_numbers)

odd_numbers = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
even_numbers = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20]


### Beispiel: Kombinationen für Tripel aus einer Basismenge
Auch kombinatorische Aufgaben lassen sich sehr einfach implementieren:

In [None]:
base_set = 'abcd'

triples = [s1+s2+s3 for s1 in base_set 
                    for s2 in base_set
                    for s3 in base_set]
print(triples)
print("Anzahl der Tripel:", len(triples))

['aaa', 'aab', 'aac', 'aad', 'aba', 'abb', 'abc', 'abd', 'aca', 'acb', 'acc', 'acd', 'ada', 'adb', 'adc', 'add', 'baa', 'bab', 'bac', 'bad', 'bba', 'bbb', 'bbc', 'bbd', 'bca', 'bcb', 'bcc', 'bcd', 'bda', 'bdb', 'bdc', 'bdd', 'caa', 'cab', 'cac', 'cad', 'cba', 'cbb', 'cbc', 'cbd', 'cca', 'ccb', 'ccc', 'ccd', 'cda', 'cdb', 'cdc', 'cdd', 'daa', 'dab', 'dac', 'dad', 'dba', 'dbb', 'dbc', 'dbd', 'dca', 'dcb', 'dcc', 'dcd', 'dda', 'ddb', 'ddc', 'ddd']
Anzahl der Tripel: 64


In [None]:
# Zum besseren Verständnis programmieren wir dieses Beispiel
# auch noch einmal in ausführlicher Form mit Schleifen
base_set = 'abcd'
triples = []
for i in base_set:
    for j in base_set:
        for k in base_set:
            triples.append(i+j+k)  # i+j+k ist eine String-Konkatenation
            
print(triples)
print("Anzahl der Tripel:", len(triples))

['aaa', 'aab', 'aac', 'aad', 'aba', 'abb', 'abc', 'abd', 'aca', 'acb', 'acc', 'acd', 'ada', 'adb', 'adc', 'add', 'baa', 'bab', 'bac', 'bad', 'bba', 'bbb', 'bbc', 'bbd', 'bca', 'bcb', 'bcc', 'bcd', 'bda', 'bdb', 'bdc', 'bdd', 'caa', 'cab', 'cac', 'cad', 'cba', 'cbb', 'cbc', 'cbd', 'cca', 'ccb', 'ccc', 'ccd', 'cda', 'cdb', 'cdc', 'cdd', 'daa', 'dab', 'dac', 'dad', 'dba', 'dbb', 'dbc', 'dbd', 'dca', 'dcb', 'dcc', 'dcd', 'dda', 'ddb', 'ddc', 'ddd']
Anzahl der Tripel: 64


## Übungsaufgaben

### 1. Comprehensions
Es sei $\mathbb N = \{1,2,\dots\}$, d.h. die natürlichen Zahlen ohne die Null. Legen Sie die folgenden Objekte in Python an:

* Liste $[ x_0, x_1, \, \dots, \, x_{n-1} ]$ mit $x_i := a + i \Delta x$ für $i = 0,1,\dots,n$, $\Delta x := \frac{b-a}{n}$ für ein gegebenes Intervall $[a,b] \subset \mathbb R$ und $n \in \mathbb N$


In [1]:
# Lösung
a,b,n = 0.75, 3.25, 20
l1 = [a+i*(b-a)/n for i in range(n)]
print(l1)

[0.75, 0.875, 1.0, 1.125, 1.25, 1.375, 1.5, 1.625, 1.75, 1.875, 2.0, 2.125, 2.25, 2.375, 2.5, 2.625, 2.75, 2.875, 3.0, 3.125]


### 2. Strings aus Liste entfernen

Schreiben Sie ein Programm, welches aus einer Liste, die strings und nicht-negative ganze Zahlen enthält, eine Liste macht, die nur die Zahlen enthält.

In [2]:
list1 = [1,2,'a','b']

# Lösung
new_list = []
for el in list1:
    if type(el) == int:
        new_list.append(el)

print(new_list)

[1, 2]


### 3. Aufgabe

Erstellen Sie aus einer Liste und einer Zahl eine neue Liste, die jede Zahl der Liste höchstens N-mal enthält, ohne die Reihenfolge zu ändern.
Wenn beispielsweise die Eingabezahl 2 ist und die Eingabeliste `[1,2,3,1,2,1,2,3]` lautet, nehmen Sie `[1,2,3,1,2]`, lassen die nächsten `[1,2]` weg, da dies dazu führen würde, dass 1 und 2 dreimal im Ergebnis vorkommen, und nehmen dann 3, was zu `[1,2,3,1,2,3]` führt.
Bei der Liste `[20,37,20,21]` und der Zahl 1 wäre das Ergebnis `[20,37,21]`.

In [5]:
# Lösung

list1=[1,2,3,1,2,1,2,3]

new_list1 = []
n = 1
for el in list1:
    if new_list1.count(el) < n:
        new_list1.append(el)
print(new_list1)

[1, 2, 3, 1, 2, 1, 2, 3]
