# ITdigital: Python als universelles Werkzeug
# 3. Weitere Datentypen (Listen, Sets, Diktionäre, Tupel)
____
lukas.szabo@bfz.de

## Nachtrag zur Objektzuweisung

Achten Sie bei Objektzuweisung auf bereits vergebene Bezeichnungen. Highlighting durch die genutzte Entwicklungsumgebung kann helfen. 

In [16]:
print(type(str(1)))

<class 'str'>


In [17]:
## bad idea
#str = 'String' 

In [18]:
print(type(str(1)))

<class 'str'>


**Hinweis:** Neustart des Kernels setzt die Überschreibung zurück!

## Indizierung (sequenzieller Datentypen)

Bestimmte Objekte (sequence types) können nach dem Schema `start:stop:step` indiziert werden. Dabei werden gezielt Elemente des Objekts angesprochen.

-5 | -4 | -3 | -2 | -1 | **0** | 1 | 2 | 3 | 4 | 5

g | n | i | r | t | **S** | t | r | i | n | g

Indizierung beginnt im ***Erdgeschoss***!

In [19]:
s = "String"
print(s[0])

S


Es kann vorwärts und **rückwärts** indiziert werden.

In [20]:
## S t ring
s[1] == s[-5] 

True

Auch kann ein bestimmter **Bereich** eines Objekts indiziert werden (**slicing**). Dabei ist der **erste Grenzwert eingeschlossen**, der **zweite Grenzwert ausgeschlossen**.

In [21]:
r = s[2:6]
print(r)

ring


In [22]:
g = s[5] + s[2:5]
print(g)

grin


Indizierung kann auch in einer bestimmten **Schrittfolge** vollzogen werden.

In [23]:
t1 = s[::1]
t2 = s[::2]
t3 = s[1:6:2]
print(t1, t2, t3)

String Srn tig


## Listen [ ]
Listen sind **veränderbare** (eng. mutable) Sequenzen von Elementen. Sie werden durch **`[]`** begrenzt. Enthaltene Elemente werden mit **Komma** seperiert. Listen können **indiziert** werden.

In [24]:
i = 13
f = 4.5
s = 'fnord'

## reminder: 1l1I
L = [13, 4.5, 'fnord']
print(L)

[13, 4.5, 'fnord']


Auch Objekte können Elemente von Listen sein.

In [25]:
obj_list = [i, f, s, L]
print(obj_list)

[13, 4.5, 'fnord', [13, 4.5, 'fnord']]


Listen können (wie auch Strings) indiziert werden.

In [26]:
print(obj_list[1:3])

[4.5, 'fnord']


Die Länge von Listen kann bestimmt werden.

In [27]:
print(len(obj_list), len(obj_list[3]), len(obj_list[3][2]))

4 3 5


Listen sind **veränderbar** (engl. mutable). Elemente können verändert werden.

In [28]:
mutable = ['spam', 'touch', 'this']
mutable[0] = 'can'
print(mutable)

['can', 'touch', 'this']


Rückblick: Strings sind **unveränderbar** (engl. immutable). Elemente können nur durch Funktionen verändert werden (wobei ein neuer String erzeugt wird).

In [29]:
immutable = 'can\'t touch this' ## attention: escaping!
print(immutable)

can't touch this


In [30]:
print(immutable.replace('\'t', ''))

can touch this


Strings können zwar indiziert werden (**sequenziell**)...

In [31]:
print(immutable[4])

t


... bleiben aber **unveränderbar**.

In [32]:
#immutable[4] = 'T'

## Tupel ( )
Tupel sind **unveränderbare** Sequenzen von Elementen. Sie werden durch **`()`** begrenzt. Tupel können **indiziert** werden.

In [33]:
t = (3, 'inside')
sp = '  ' 
print(t, sp, t[0], sp, t[1], sp, type(t))

(3, 'inside')    3    inside    <class 'tuple'>


## Diktionäre { }
Diktionäre sind Sequenzen von **Schlüssel-Wert-Paaren** (engl. key value pairs). Diktionäre sind durch **`{}`** begrenzt. Paare werden jeweils durch **`:`** verbunden. Diktionäre sind **veränderbar** und können **nicht indiziert** werden. 

`d = {key1: value1, key2: value2, ...}`

In [34]:
courses = {"gT": "Mo, 16.00-18.00 Uhr", "wa": "Do, 18-20.00 Uhr"}
print(courses)

{'gT': 'Mo, 16.00-18.00 Uhr', 'wa': 'Do, 18-20.00 Uhr'}


Veränderbar...

In [35]:
courses['kmx'] = "Fr, 10-12.00 Uhr"
print(courses)

{'gT': 'Mo, 16.00-18.00 Uhr', 'wa': 'Do, 18-20.00 Uhr', 'kmx': 'Fr, 10-12.00 Uhr'}


...aber nicht indizierbar.

In [36]:
#courses[0:2]

Beispiele für Funktionen extra für Diktionäre:

In [37]:
print(courses.keys(), '---', courses.values())

dict_keys(['gT', 'wa', 'kmx']) --- dict_values(['Mo, 16.00-18.00 Uhr', 'Do, 18-20.00 Uhr', 'Fr, 10-12.00 Uhr'])


## Sets { }
Sets sind ungeordnete Sequenzen mit nur **einzigartiger Elemente**, welche durch **`{}`** begrenzt werden.

In [38]:
confirmed = "Illuminati"
set(confirmed)

{'I', 'a', 'i', 'l', 'm', 'n', 't', 'u'}

## Exkurs: Hilfefunktion

In [39]:
#help(5)
#help(int)

#help('Illuminati')
#help(str)

#help('nltk')

## Exkurs: Import von Paketen
Zusätzliche Module und Pakete müssen eingeladen bzw. importiert werden.

In [40]:
import collections
collections.Counter(confirmed)

Counter({'I': 1, 'a': 1, 'i': 2, 'l': 2, 'm': 1, 'n': 1, 't': 1, 'u': 1})

## Übungen

1) Betrachten Sie die folgenden Objekte, stelle Sie die jeweiligen Datentypen fest und berechnen Sie (soweit möglich) die Länge der Objekte. Änderen Sie dann den Datentyp der Objekte zu String und berechnen Sie erneut die Länge der Objekte. Was fällt auf?

In [41]:
one = 1
two = [1,2]
three = (1,2,3)
four = {1:2,3:4} 

2) Ersetzen Sie im String *Snakes* durch *Python*. Verändern Sie danach den String so, dass jeder Buchstabe im String großgeschrieben ist.

In [43]:
pref =  'I like Snakes'

3) Gegeben sind drei Strings. Kombinieren Sie diese Strings in einem neuen Objekt, sodass alle Buchstaben als Kleinbuchstaben abgespeichert werden. (Bonus: Verändern Sie den neu erzeugten String zusätzlich so, dass er gut leserlich ist.)

In [7]:
zen = "Simple is better than complex. "
of = "COMPLEX IS BETTER THAN COMPLICATED"
python = "flat is better than nested."

4) Legen Sie eine Liste an, deren einzelne Elemente aus den Wörtern des in 3) neu generierten String-Objekts bestehen. Geben Sie das erste und letzte Element als Tupel aus.

5) Erstellen Sie ein Diktionär, welches die Elemente der in 4) erstellten Liste als Values enthält. Der jeweilige Key soll der Position des Elements aus Aufgabe 4 entsprechen (Hinweis: Funktionen dict() und zip()). 

In [12]:
bsp = {0:'simple', 1:'is'}

6) Importieren Sie die Python Bibliothek collections. Verwenden Sie anschließend die Funktion `Counter` um eine Häufigkeitsauszählung der Listenelemente aus 4) in einem neuen Objekt zu speichern. Welchen Datentyp hat das Objekt?

7) Berechnen Sie die Summe der Häufigkeiten aus 6) und speicheren Sie das Ergebnis in einem neuen Diktionär unter dem Key `summe`. 

**Bonus**

8) Schreibt ein Programm, dass die Teilbarkeit einer ganzen Zahl überprüft. Wenn die Zahl durch 5 und durch 3 teilbar ist, soll das Programm einen entsprechenden Hinweis drucken. Weiterhin soll unterschieden und gedruckt werden, ob die Zahl nur durch 5 oder nur durch 3 teilbar ist (Hinweise: Rest Operator `%` und `if`/`elif`/`else`-Bedingungen)

In [19]:
#similar example
zahl = 13

if int(zahl) % 2 != 0:
    print('Ungerade!')
else:
    print('Gerade!')

Ungerade!
