# Python Crash Course 2

# Agenda
Innerhalb dieses Notebooks behandeln wir:

- Strings
- Lists, Ranges, Dicts, Sets

## Strings
Zu den Basisdatentypen gehört auch der Typ `string` für Textvariablen.

In [None]:
# whatever strings you want
(
    'hello world!',
    "hello world!"
)

In [None]:
#sehr bequemer Umgang mit Hochkommas:
print('she said, "how are you?"')
print("that's right!")

In [None]:
(
    'hello' + ' ' + 'world',
    'thinking... ' * 3,
    '*' * 3
)

Strings gehören zu den *sequence* type; https://docs.python.org/3.5/library/stdtypes.html#typesseq

Dazu gehören auch: *ranges*, *tuples* (beide immutable), und *lists* (mutable).

Alle immutable sequences können die  [common sequence operations](https://docs.python.org/3/library/stdtypes.html#common-sequence-operations), und die mutable sequences zusätzlich die [mutable sequence operations](https://docs.python.org/3/library/stdtypes.html#mutable-sequence-types)

In [None]:
# indexing
greeting = 'hello there'
(
    greeting[0],
    greeting[6],
    len(greeting),
    greeting[len(greeting)-1]
)

In [None]:
# negative indexes
(
    greeting[-1],
    greeting[-2],
    greeting[-len(greeting)]
)

In [None]:
# "slices"
greeting = 'hello there'
(
    greeting[0:11],
    greeting[0:5],
    greeting[6:11]
)

In [None]:
# default slice ranges
(
    greeting[:11],
    greeting[6:],
    greeting[:]
)

In [None]:
# slice "steps"
(
    greeting[0:11:2],
    greeting[::3],
    greeting[6:11:2]
)

In [None]:
# negative steps
greeting[::-1]

In [None]:
# other sequence ops
greeting = 'hello there!'
(
    greeting.count('e'),
    greeting.index('e'),
    greeting.index('e', 2),
    'e' in greeting,
    'ü' not in greeting,
    min(greeting),
    max(greeting)
)

Strings also support a large number of [type-specific methods](https://docs.python.org/3/library/stdtypes.html#string-methods).

### Format Strings

We frequently want to interpolate values found in variables or computed using expressions into strings. We can do this with *format strings*.

In [None]:
adjective = 'frigid'
adverb = 'hastily'
noun = 'Alfred'
number = 8
verb = 'eat'

sentence = f'It was a {adjective} day when {noun} decided to {adverb} {verb} {number*100} lines of code.'

print(sentence)

We can also use the `format` string method.

In [None]:
sentence = 'It was a {} day when {} decided to {} {} {} lines of code.'.format(adjective, noun, adverb, verb, number*100)

print(sentence)

# Lists, Ranges, Dicts und Sets

Neben den Basisdatentypen bringt die Python Standardbibliothek noch einige weitere sehr mächtige Datentypen mit.

Wir starten mit **Ranges**.

## Range

Eine Range ist eine Zahlenspanne zwischen einer Startzahl, einer Endzahl und optional einer Schrittweite.



In [None]:
r = range(10)

for i in r:
    print(i)

In [None]:
r = range(3,15)

for i in r:
    print(i)

In [None]:
r = range(1,1000,150)

for i in r:
    print(i)

## Listen

**Listen** sind ein sehr beliebter Datentyp in Python, weil sie sehr vielfältig und einfach verwendet werden können. Trotzdem aber sehr mächtige Funktionalitäten mitbringen.

In [None]:
l = [1,2,3,4,1]
print(l)

In [None]:
# Länge
len(l)

In [None]:
# Indexing
l[2]

In [None]:
# Zuweisung
l[0] = "Hello"
l

In [None]:
l = ["Hello"]
l + ["World"]

In [None]:
l

Listen aus anderen Dingen:

In [None]:
l = list(range(6))
l

In [None]:
l = list("Wirtschaftsinformatik")
l

In [None]:
'I love Advanced Programming'.split()

In [None]:
'apples, bananas, cats, dogs'.split(',')

In [None]:
# also, strings from lists of strings
'-'.join(['a', 'e', 'i', 'o', 'u'])

In [None]:
' 👏 '.join('this is a beautiful day'.split())

#### Listen einfach aufbauen (List comprehension)

In [None]:
[x for x in range(10)]

In [None]:
adjs = ('hot', 'blue', 'quick')
nouns = ('table', 'fox', 'sky')
[adj + ' ' + noun for adj in adjs for noun in nouns]

In [None]:
# pythagorean triples
n = 50
[(a,b,c) for a in range(1,n) 
         for b in range(a,n) 
         for c in range(b,n) 
         if a**2 + b**2 == c**2]

### Sets

Ein [set](https://docs.python.org/3.7/library/stdtypes.html#set-types-set-frozenset) ist eine Datenstruktur die eine *ungeordnete* Menge von eineindeutigen Elementen darstellt. So wie eine mathematische Menge.

In [None]:
s = {1, 2, 1, 1, 2, 3, 3, 1}

In [None]:
s

In [None]:
t = {2, 3, 4, 5}

In [None]:
s.union(t)

In [None]:
s | t

In [None]:
s.difference(t)

In [None]:
s - t

In [None]:
s.intersection(t)

In [None]:
s & t

### Dicts

Ein [dictionary](https://docs.python.org/3/library/stdtypes.html#mapping-types-dict) ist eine Datenstruktur die aus Schlüssel-Wert-Paaren besteht.

In [None]:
d = {
    'Superman':  'Clark Kent',
    'Batman':    'Bruce Wayne',
    'Spiderman': 'Peter Parker',
    'Ironman':   'Tony Stark'
}

In [None]:
d['Ironman']

In [None]:
d['Ironman'] = 'James Rhodes'

In [None]:
d

In [None]:
del d['Ironman']
d

In [None]:
for k in d:
    print(f'{k} => {d[k]}') 

In [None]:
for k in d.keys():
    print(f'{k} => {d[k]}')

In [None]:
for v in d.values():
    print(v)

In [None]:
for k,v in d.items():
    print(f'{k} => {v}')

#### Dictionary comprehensions

In [None]:
{e:2**e for e in range(0,100,10)}

In [None]:
{x:y for x in range(3) for y in range(10)}

# Aufgaben
Bitte bearbeiten Sie die folgenden Aufgaben.

## Aufgabe 1 (Palindrom Check)
Schreiben Sie ein Programm, das überprüft, ob ein gegebener String ein Palindrom ist. Ein Palindrom ist ein Wort oder ein Satz, der vorwärts und rückwärts gelesen gleich ist (Leerzeichen und Groß-/Kleinschreibung werden ignoriert).

Beispiele für Palindrome:
- Eine Horde bedrohe nie.
- A man a plan a a canal panama.
- EINE TREUE FAMILIE BEI LIMA FEUERTE NIE

In [None]:
# Initialisierung
text = "Eine Horde bedrohe nie"

# Palindrom-Überprüfung
text = text.replace(" ", "").lower()
ist_palindrom = text == text[::-1]

print(f"'{text}' ist ein Palindrom: {ist_palindrom}")

## Aufgabe 2 (Quadratzahlen in einem Bereich)

Schreiben Sie ein Programm, das die Quadratzahlen in einem gegebenen Bereich berechnet und als Liste ausgibt. Verwenden Sie hierfür die List comprehension.

In [None]:
# Initialisierung
start = 1
end = 10

# Quadratzahlen berechnen
quadratzahlen = [i ** 2 for i in range(start, end + 1)]

print(quadratzahlen)


## Aufgabe 3 (Hegel lesen)
In dieser Aufgabe lesen wir die [Phänomenologie des Geistes](https://de.wikipedia.org/wiki/Ph%C3%A4nomenologie_des_Geistes) von Georg Wilhelm Friedrich Hegel. Glücklicherweise bedeutet "Lesen" nicht immer auch "Verstehen". 
Ihre Aufgabe ist es herauszufinden:
- Wie viele Wörter hat Hegel geschrieben?
- Wie viele eineindeutige Wörter hat Hegel geschrieben?
- Welches ist das am häufigsten verwendete Wort von Hegel?

In [None]:
# Führen Sie diese Code-Zelle einmal aus, um das Buch komplett einzulesen:
import urllib.request

hegel_url    = 'https://www.gutenberg.org/cache/epub/6698/pg6698.txt'
pdg_text = urllib.request.urlopen(hegel_url).read().decode()

Schauen Sie mal in den Text rein, z.B. hier die erste Beschreibung der Hegelschen Synthese:

In [None]:
print(pdg_text[7837:8449])

Wie kommen sie von den einzelnen Zeichen `pdg_text`zu den Wörtern der Phänomenologie des Geistes? (*Hinweis:* die split-Funktion könnte helfen.)

In [None]:
pdg_words = pdg_text.lower().split()
len(pdg_words)

Und nun zu den eineindeutigen Wörtern?

In [None]:
pdg_words_unique = set(pdg_words)
len(pdg_words_unique)

Und nun zur Häufigkeit der einzelnen Wörter. Wie oft wurde jedes Wort geschrieben? (*Hinweis:* verwenden Sie ein `dict`.)

In [None]:
pdg_word_count = {}

for word in pdg_words:
    if word in pdg_word_count:
        pdg_word_count[word] += 1
    else:
        pdg_word_count[word] = 1


In [None]:
print(pdg_word_count)

In [None]:
(pdg_word_count["sein"], pdg_word_count["dasein"])

Jetzt müssen Sie das Wörterbuch nur noch sortieren. Das ist etwas trickreich:

In [None]:
pdg_word_count_sorted = sorted(pdg_word_count.items(), key=lambda t: t[1], reverse=True)
pdg_word_count_sorted[:10]