Notebook zu Datentypen: Set und Dictionary

Version 1.2, 5. Januar 2024, Informatik, EAH Jena

(c) Christina B. Class


# 1. Datentypen: Die Menge `set`

`set` ist der Python Datentyp, der eine Menge abbildet. Eine Menge ist veränderbar. Wie auch in der Mathematik, kann in einer Menge ein bestimmtes Element nur einmal vorkommen:

$\mathbb{N} \cup \{1\} = \mathbb{N}$ 

Die Elemente in einem Set haben keine Reihenfolge, daher kann auf ein bestimmtes Element nicht direkt zugegriffen werden z.B. über einen Index oder einen Schlüssel. In Mengen ist "nur" möglich, zu testen, ob bestimmte Werte Element der Menge sind oder nicht. Hierzu werden die Operatoren `in` und `not in` genutzt.

## 1.1 Erzeugung von Mengen

Eine **leere Menge** wird über `set()` erzeugt. Eine Erzeugung durch Angabe der Mengen-Klammern alleine funktioniert nicht.

In [None]:
s=set()
d={}

print(type(s))
print(type(d))

Mit `{}` wird ein leeres Dictionary erzeugt.

Eine Menge mit existierenden Elementen kann direkt oder über den Konstruktor `set()` erzeugt werden:

In [None]:
bsp1={1,2,3,4}
bsp2=set((1,2,3,4))
bsp3=set(range(1,10))

print(bsp1)
print(bsp2)
print(bsp3)

Bitte beachten Sie, dass der Konstruktor ein Iterable als Parameter erhält. Eine einelementige Menge können Sie nicht erzeugen, wenn Sie das Element einfach direkt als Parameter übergeben:  

In [None]:
bsp1={1}
bsp2=set((1,))
bsp3=set([1])

print(bsp1)
print(bsp2)
print(bsp3)

Folgender Aufruf führt zu einem Fehler:

In [None]:
bsp=set(1)

Genauso wie auch:

In [None]:
bsp=set((1))

Erinnerung: `(1)` ist ein `int` und `(1,)` ist ein einelementiges `tuple`.

## 1.2 Erzeugung von Mengen mit List Comprehensions

List Comprehensions können auch zur Erzeugung von Mengen verwendet werden. Hierbei werden die äußeren `[]` durch die Mengenklammern `{}` ersetzt.

Alles andere ist unverändert:

**Beispiel 1**

In [None]:
liste=[i**2 for i in range(1,6)]
menge={i**2 for i in range(1,6)}

print(liste)
print(menge)

**Beispiel 2:**

In [None]:
liste=[(i,i**2) for i in range(1,6) if i%2!=0]
menge={(i,i**2) for i in range(1,6) if i%2!=0}

print(liste)
print(menge)

**Hinweis**

Die Ausgabe in obigem Beispiel 2 sieht bei mir folgendermaßen aus:

![menge.png](attachment:menge.png)

Bei Ihnen mag es anders aussehen.

Die Elemente in einer Menge haben, wie oben bereits erwähnt, keine definierte Reihenfolge. Daher sind die Mengen `{1,2,3}` und `{1,3,2}` gleich.

In [None]:
liste1=[1,2,3,4]
liste2=[4,3,2,1]
print(liste1)
print(liste2)
print('gleich?',liste1==liste2)

In [None]:
menge1={1,2,3,4}
menge2={4,3,2,1}
print(menge1)
print(menge2)
print('gleich?',menge1==menge2)

## 1.3 Verwendung der Menge

### Bekannte Funktionen und Operatoren

Die Funktion `len()` ist für Mengen definiert und gibt an, wieviele Elemente eine Menge hat.

Wie bereits mehrfach erwähnt, definiert eine Menge keine Reihenfolge der Elemente. Die Operatoren `in` und `not in` geben, wie für Listen, Tuple und Zeichenketten, an, ob ein bestimmter Wert in der Menge enthalten ist.  

In [None]:
meineMenge={1,4,6,12,54}

print(meineMenge)
print('Anzahl Elemente:',len(meineMenge))
print('6 vorhanden?', 6 in meineMenge)
print('10 nicht vorhanden?', 10 not in meineMenge)

## 1.4 Ausgabe der Menge

Eine Menge ist ein Iterable und kann somit mit der `for` Schleife direkt ausgegeben werden. Da es keinen Index für den Zugriff gibt, kann eine Menge nicht mit einer `while` Schleife ausgegeben werden. 

In [None]:
meineMenge={1,4,6,12,54}

for el in meineMenge:
    print(el)

## 1.5 Veränderung der Menge

Da es keine Reihenfolge gibt, gibt es **nicht** die Möglichkeit, einen Wert  anzuhängen (`append()`), ein Element an einer bestimmten Position einzufügen (`insert()`)  oder um eine andere Menge zu erweitern (`extend()`), also deren Elemente anzuhängen. 

Um ein neues Element in die Menge hinzuzufügen gibt es die Methode `add()`. Die Methode `union()` erzeugt die Vereingungsmenge zweier Mengen.

In [None]:
meineListe=[1,2]
meineMenge={1,2}

meineListe.append(3)
meineMenge.add(3)
print(meineListe, meineMenge)
meineListe.insert(2,5)
meineMenge.add(5)
print(meineListe, meineMenge)
meineListe.append(3)
meineMenge.add(3)
print(meineListe, meineMenge)

In [None]:
menge1={1,2,3}
menge2={1,4,5}
liste1=[1,2,3]
liste2=[1,4,5]
print('extend:',liste1,liste2, end=' ')
liste1.extend(liste2)
print(liste1)
print('union: ',menge1,menge2, end=' ')
menge3=menge1.union(menge2)
print(menge3)

Beachten Sie in obigem Beispiel, dass in einer Menge, im Gegensatz zu einer Liste, ein Element nur einmal vorkommen kann.

Elemente werden mit der Methode `discard()` bzw. `remove()` gelöscht. `remove()` kennen Sie auch schon von Listen, wo diese Methode das erste Vorkommen eines Wertes löscht. Da in Mengen jeder Wert nur einmal vorkommen kann, wird der Wert durch `remove()` komplett gelöscht.

Python bietet verschiedene Mengenoperationen an, die Sie auch aus der Mathematik kennen.

**Beispiel 1: Schnittmenge**

$\{1,2,3,4,5,6,7,8,9,10\} \cap \{3,6,9\} = \{3,6,9\}$ 

In [None]:
menge1=set(range(1,11))
menge2={3,6,9}

print('Schnittmenge:', menge1.intersection(menge2))

**Beispiel 2: Mengendifferenz**

$\{1,2,3,4,5,6,7,8,9,10\} - \{3,6,9\} = \{1,2,4,5,7,8,10\}$ 

In [None]:
menge1=set(range(1,11))
menge2={3,6,9}

print('Mengendifferenz:', menge1.difference(menge2))

# 2. Datentypen: Das Dictionary `dict`

Ein Dictionary, in manchen Programmiersprachen auch Map genannt, erlaubt es, Schlüssel-Wert-Paare abzuspeichern. Die **Schlüssel** müssen hierbei **eindeutig** sein. 

## 3.1 Definition eines Dictionary

Ein leeres Dictionary wird mit den leeren geschweiften Klammern `{}` oder `dict()` definiert.

In [None]:
d1={}
d2=dict()

print(type(d1))
print(type(d2))

Bei der Definition eines Dictionary mit Elementen müssen die Schlüssel-Wert-Paare übergeben werden. Beim Aufruf des Konstruktors übergeben Sie daher ein Iterable als Parameter, das diese Paare als Tupel enthält:

In [None]:
d1=dict([(1,2),(3,4)])
# oder z.B.
d2=dict(((1,2),(3,4)))

print(d1)
print(d2)

Werden die Schlüssel-Werte-Paare bei der Erzeugung in die geschweiften Klammern geschrieben, werden Sie folgendermaßen spezifiziert: `s:w`, wobei `s` der Schlüssel und `w` der Wert ist. 

In [None]:
d3={1:2,3:4}
print(d3)

## 2.2 Zugriff auf das Dictionary

Gegeben ist folgendes Dictionary:

In [None]:
beispiel={1:12,'s1':13,'text':17,-4:12,3.4:"8"}
print(beispiel)

Wie Sie sehen können, können sowohl Schlüssel als auch Werte unterschiedliche Datentypen haben.

Der Zugriff auf Elemente des Dictionary erfolgt über den Schlüssel. Als Operator dienen, wie auch bei sequentiellen Datentypen, die `[]`:

In [None]:
print('Wert an Schlüssel s1:',beispiel['s1'])
print('Wert an Schlüssel 1:',beispiel[1])
print('Wert an Schlüssel 3.4:',beispiel[0.34e+1])

Ein Dictionary ist ein veränderbarer (mutable) Datentyp. Mit Hilfe des Zugriffs über den Schlüssel kann der dazugehörige Wert durch eine Zuweisung verändert werden. 

In [None]:
beispiel['s1']=17

Existiert der Schlüssel nicht im Dictionary, wird durch die Zuweisung ein Wert mit diesem Schlüssel angelegt, also ein neues Schlüssel-Wert-Paar definiert.

In [None]:
print(beispiel)
beispiel[2]=123
print(beispiel)

Der Operator `in` ermöglicht es Ihnen, zu testen, ob ein bestimmter Schlüssel im Dictionary vorhanden ist. Sie können hiermit nicht die Existenz von Werten überprüfen. 

In [None]:
print(beispiel)
print("in 'text':",'text' in beispiel)
print("in '8':",'8' in beispiel)

Oben wurde erwähnt, dass die Anweisung `beispiel[s]=w` einen existierenden Wert an Schlüssel `s` mit `w` überschreibt.
Dies gilt auch, wenn Sie bei der Erzeugung des Dictionary mehrere Schlüssel-Wert-Paare mit dem gleichen Schlüssel übergeben. Der  zuletzt definierte Wert wird dann dem Schlüssel zugewiesen:

In [None]:
d1={1:2,2:3,1:3,3:5,1:6}
print(d1)

## 2.3 Ausgabe des Dictionary

Auch das Dictionary kann mit einer `for` Schleife ausgegeben werden. Allerdings benötigt die `for` Schleife ein Iterable. Es gibt drei Methoden, um ein Iterable aus einem Dictionary zu erzeugen:
1. `items()`: erzeugt ein Iterable aller Schlüssel-Wert-Paare
2. `keys()`: erzeugt ein Iterable aller Schlüssel
3. `values()`: erzeugt ein Iterable aller Werte

Bitte beachten Sie, dass ein Dictionary kein sequentieller Datentyp ist. Die Reihenfolge der Ausgabe der Werte wurde ursprünglich nicht festgelegt. Mit dem Python Standard 3.7 wurde definiert, dass die Schüssel-Wert-Paare in der Reihenfolge in einem Dictionary angespeichert werden, in der sie definiert wurden. Für frühere Python Versionen, gibt es keine solche Festlegung und über die Reihenfolge keine Aussage getroffen werden.

**Ausgabe mit `keys()`**

`keys()` erzeugt ein Iterable aller Schlüssel. Diese können dann ausgegeben werden:

In [None]:
beispiel={1:12,'s1':13,'text':17,-4:12,3.4:"8"}
for k in beispiel.keys():
    print(k)

Über den Schlüssel kann man auch den Wert ausgeben:

In [None]:
beispiel={1:12,'s1':13,'text':17,-4:12,3.4:"8"}
for k in beispiel.keys():
    print('Schlüssel',k,'mit dem Wert',beispiel[k])

**Ausgabe mit `items()`**

Möchte man die Schlüssel-Wert-Paare ausgeben, kann man auch direkt die Methode `items()` verwenden:

In [None]:
beispiel={1:12,'s1':13,'text':17,-4:12,3.4:"8"}
for i in beispiel.items():
    print(i)

`items()` gibt ein Tupel zurück, das man dann entpacken kann:

In [None]:
beispiel={1:12,'s1':13,'text':17,-4:12,3.4:"8"}
for s,w in beispiel.items():
    print(s,'ist der Schluessel und',w,'ist der Wert')

**Ausgabe mit `values()`**

Eine letzte Möglichkeit, das Dictionary auszugeben, ist mit der Methode `values()`.

In [None]:
beispiel={1:12,'s1':13,'text':17,-4:12,3.4:"8"}
for v in beispiel.values():
    print(v)

**Bitte beachten Sie:** das Dictionary bietet **keine** Möglichkeit, den Schlüssel eines Werte zu finden (derselbe Wert könnte ja mit mehreren Schlüsseln eingetragen sein). Mit `items()` und mit `keys()` haben Sie die Möglichkeit, die Schlüssel-Werte-Paare zu erhalten, mit `values()` bekommen Sie **nur** die Werte.   

*Ende des Notebooks*

<a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/4.0/"><img alt="Creative Commons Lizenzvertrag" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-nd/4.0/88x31.png" /></a><br /><span xmlns:dct="http://purl.org/dc/terms/" property="dct:title">Dieses Notebook wurde von Christina B. Class für die Lehre an der EAH Jena erstellt. Es ist lizenziert unter einer <a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/4.0/">Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitungen 4.0 International Lizenz</a>.
