## Kapitel 2: Fortgeschrittene Aspekte von Python

### 2.1 Sets

#### Aus einer Liste mit Wiederholungen wird mit Hilfe eines Sets eine Liste ohne Wiederholungen

In [None]:
list_pts = [(0, 0), (-1, 2), (0, 0), (1, 2), (-1, 2), (0,0)]

In [None]:
set_pts = set(list_pts)
set_pts

In [None]:
uniq_list_pts = list(set_pts)
uniq_list_pts

#### Sets enthalten keine Wiederholungen

In [None]:
set_of_ints = {1, 3, 2, 5, 2, 1, 3, 4}
set_of_ints

#### Sets lassen sich verändern, sie sind »mutable« …

In [None]:
data = {1, 2, 4}
data.add(3)
data

In [None]:
data.remove(1)
data

In [None]:
data.remove(10)

#### … und taugen daher nicht als Schlüssel in Dictionaries. Hierfür gibt es das frozenset.

In [None]:
evens = frozenset([2, 4, 6, 8])

In [None]:
evens.add(10)

In [None]:
odds = frozenset([1, 3, 5, 7])

In [None]:
numbers = {evens: "some even numbers", odds: "some odd numbers"}
numbers.keys()

#### Suchen in einem Set geht normalerweise wesentlich schneller als in einer Liste.

In [None]:
nmax = 1000000
xlist = list(range(nmax))
xset = set(xlist)

In [None]:
%timeit 1 in xlist

In [None]:
%timeit 1 in xset

In [None]:
%timeit nmax-1 in xlist

In [None]:
%timeit nmax-1 in xset

In [None]:
a = set([1, 2, 3])
b = set([4, 5, 6])

#### Es lassen sich verschiedene Mengenoperationen durchführen.

In [None]:
a.union(b)

In [None]:
c = set([1, 3, 6])

In [None]:
a.intersection(c)

In [None]:
a.symmetric_difference(c)

In [None]:
a.difference(c)

In [None]:
d = set([1, 3])

In [None]:
a.issuperset(d)

In [None]:
a.issubset(d)

In [None]:
a.isdisjoint(b)

### 2.2 Das ``collections``-Modul

In [None]:
import collections

#### Problem: Tuples lassen sich nur über den Index addressieren.

In [None]:
farbe = (135, 206, 235)
farbe[1]

In [None]:
r, g, b = farbe
g

#### Lösung: ``namedtuples``

In [None]:
Farbe = collections.namedtuple('Farbe', 'r g b')

In [None]:
f1 = Farbe(135, 206, 235)
f1[1]

In [None]:
f1.g

In [None]:
f2 = Farbe(50, 205, 50)

In [None]:
f1.b > f2.b

#### Es sind auch längere Namen möglich 

In [None]:
Farbe = collections.namedtuple('Farbe', 'rot grün blau')
f1 = Farbe(135, 206, 235)
f1.grün

#### ``namedtuple``s sind immutable und können somit als Schlüssel für Dictionaries verwendet werden.

In [None]:
f1.rot = 20

In [None]:
f2 = Farbe(50, 205, 50)
rgbdict = {f1: 'SkyBlue', f2: 'LimeGreen'}
rgbdict[Farbe(135, 206, 235)]

#### Problem: Einfügen eines Elements am Anfang einer Liste ist zeitaufwändig

In [None]:
%%timeit
xlist = list()
for n in range(100000):
    xlist.append(n)

In [None]:
%%timeit
xlist = list()
for n in range(100000):
     xlist.insert(0, n)

#### Lösung: ``deque`` (double-ended queue)

In [None]:
%%timeit
xdeq = collections.deque()
for n in range(100000):
    xdeq.append(n)

In [None]:
%%timeit
xdeq = collections.deque()
for n in range(100000):
    xdeq.appendleft(n)

#### Beispiel: FIFO

In [None]:
xdeq = collections.deque([2, 1])
xdeq

In [None]:
xdeq.appendleft(3)
xdeq

In [None]:
xdeq.pop()

In [None]:
xdeq

In [None]:
xdeq.pop()

In [None]:
xdeq

In [None]:
xdeq.appendleft(4)
xdeq

In [None]:
xdeq.pop()

In [None]:
xdeq

#### Rotieren von Listen

In [None]:
xdeq = collections.deque(range(10))
xdeq

In [None]:
xdeq.rotate(3)
xdeq

In [None]:
xdeq.rotate(-5)
xdeq

#### Problem: Die Ordnung von Einträgen in Dictionaries ist nicht garantiert.

In [None]:
nobelpreise = dict([('Marie Curie', 1903),
                    ('Maria Goeppert Mayer', 1963),
                    ('Klaus von Klitzing', 1985),
                    ('Albert Einstein', 1921)])
  
for preis in nobelpreise:
    print(preis)

#### Lösung: ``OrderedDict``

In [None]:
nobelpreise = collections.OrderedDict([('Marie Curie', 1903),
                  ('Maria Goeppert Mayer', 1963),
                  ('Klaus von Klitzing', 1985),
                  ('Albert Einstein', 1921)])
  
for preis in nobelpreise:
    print(preis)

#### Sortieren eines ``OrderedDict``

In [None]:
nobelpreise_sorted = collections.OrderedDict(
                         sorted(nobelpreise.items(),
                                key=lambda x: x[1]))
  
for name, jahr in nobelpreise_sorted.items():
    print(jahr, name)

### 2.3 List comprehensions

#### Listen lassen sich manchmal kompakter, übersichtlicher und etwas schneller mit Hilfe einer List comprehension erzeugen.

In [None]:
squares = []
for n in range(10):
    squares.append(n*n)
squares

In [None]:
squares = [n*n for n in range(10)]
squares

In [None]:
from math import pi, sin
[(0.1*pi*n, sin(0.1*pi*n)) for n in range(6)]

In [None]:
%%timeit result = []
for n in range(1000):
    result.append(n*n)

In [None]:
%timeit result = [n*n for n in range(1000)]

#### Schleifen lassen sich schachteln, auch in List comprehensions.

In [None]:
[x**y for y in range(1, 4) for x in range(2, 5)]

In [None]:
result = []
for y in range(1, 4):
    for x in range(2, 5):
        result.append(x**y)
result

#### Beim Erzeugen einer Liste kann man in der List comprehension auch Bedingungen stellen.

In [None]:
[(x, y) for x in range(1, 11) for y in range(2, x) if x % y == 0]

#### Ein schnelles Sortierverfahren

In [None]:
def quicksort(x):
    if len(x) < 2: return x
    return (quicksort([y for y in x[1:] if y < x[0]])
            +x[0:1]
            +quicksort([y for y in x[1:] if x[0] <= y]))

In [None]:
import random
liste = [random.randint(1, 100) for n in range(10)]
liste

In [None]:
quicksort(liste)

#### Entsprechend lässt sich auch ein Dictionary erzeugen

In [None]:
s = 'Augsburg'
{x: s.count(x) for x in s}

#### Verwandte Techniken

In [None]:
[x*x for x in range(1, 11)]

In [None]:
quadrate = map(lambda x: x*x, range(1, 11))

In [None]:
list(quadrate)

In [None]:
s = '0.1 0.2 0.4 -0.5'
zeilenelemente = map(float, s.split())
list(zeilenelemente)

In [None]:
initialen = filter(lambda x: x.isupper(), 'Albert Einstein')
"".join(initialen)

#### Abbildungen von einer Liste auf einen Wert

In [None]:
import functools
factorial = lambda n: functools.reduce(lambda x, y: x*y, range(1, n+1))
factorial(6)

In [None]:
functools.reduce(lambda x, y: x+y, [0.1, 0.3, 0.7])

In [None]:
sum([0.1, 0.3, 0.7])

In [None]:
any([x % 2 for x in [2, 5, 6]])

In [None]:
all([x % 2 for x in [2, 5, 6]])

#### Nummerieren von Listen

In [None]:
for nr, text in enumerate(['eins', 'zwei', 'drei']):
    print(nr+1, text)

#### Zusammenfügen von Listen

In [None]:
a = [1, 2, 3]
b = [4, 5, 6]
ab = zip(a, b)
list(ab)

In [None]:
data = [1, 4, 5, 3, -1, 2]
for x, y in zip(data[:-1], data[1:]):
    print((x+y)/2)

### 2.4 Generatoren und Iteratoren

#### Ein Generatorausdruck …

In [None]:
quadrate = (x*x for x in range(4))
quadrate

#### … erzeugt Elemente …

In [None]:
for q in quadrate:
    print(q)

#### … bis nichts mehr da ist

In [None]:
next(quadrate)

In [None]:
quadrate = (x*x for x in range(4))
next(quadrate)

In [None]:
next(quadrate)

In [None]:
next(quadrate)

In [None]:
next(quadrate)

In [None]:
next(quadrate)

#### Am Ende gibt es eine StopIteration-Ausnahme.

In [None]:
def q():
    try:
        return next(quadrate)
    except StopIteration:
        return "Das war's mit den Quadratzahlen."
    
quadrate = (x*x for x in range(4))
[q() for n in range(5)]

#### Aus Listen und anderen Sequenzen lässt sich ein Iterator erzeugen.

In [None]:
i = iter([1, 2, 3])
next(i)

In [None]:
next(i)

In [None]:
next(i)

In [None]:
next(i)

#### Erzeugung von Fibonaccizahlen

In [None]:
class Fibonacci:
    def __init__(self, nmax):
        self.nmax = nmax
        self.a = 0
        self.b = 1
        
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.nmax == 0:
            raise StopIteration
        self.b, self.a = self.b+self.a, self.b
        self.nmax = self.nmax-1
        return self.a

In [None]:
for n in Fibonacci(10):
    print(n, end=' ')

#### Generator für ein pascalsches Dreieck

In [None]:
def pascaltriangle(n):
    coeff = 1
    yield coeff
    for m in range(n):
        coeff = coeff*(n-m)//(m+1)
        yield coeff

In [None]:
for n in range(11):
    print(' '.join(str(p).center(3) for p in pascaltriangle(n)).center(50))

#### itertools – Eine Sammlung nützlicher Iteratoren

In [None]:
import itertools
for s in itertools.permutations('ABC'):
    print(s)

### 2.5 Dekoratoren

#### Eine Closure

In [None]:
def add_tax(taxrate):
    def _add_tax(value):
        return value*(1+0.01*taxrate)
    return _add_tax

In [None]:
add_mwst = add_tax(19)
add_reduzierte_mwst = add_tax(7)

In [None]:
for f in [add_mwst, add_reduzierte_mwst]:
    print('{:.2f}'.format(f(10)))

#### Ein einfacher Dekorator

In [None]:
def register(func):
    print('{} registered'.format(func.__name__))
    return func
  
@register
def myfunc():
    print('executing myfunc')

In [None]:
myfunc()

In [None]:
@register
def myotherfunc():
    print('executing myotherfunc')

In [None]:
myotherfunc()

#### Dekorator zur Bestimmung der Laufzeit einer Funktion

In [None]:
import time
from itertools import chain

def logging(func):
    def func_with_log(*args, **kwargs):
        argumente = ', '.join(map(repr, chain(args, kwargs.items())))
        print('calling {}({})'.format(func.__name__, argumente))
        start = time.time()
        result = func(*args, **kwargs)
        elapsed = time.time()-start
        print('got {}({}) = {} in {:5.3f} ms'.format(
               func.__name__, argumente, result, elapsed*1000
                                                    ))
        return result
    return func_with_log

In [None]:
@logging
def factorial(n):
    if n == 1:
        return 1
    else:
        return n*factorial(n-1)

In [None]:
factorial(5)

#### Dekorator zum Speichern von Ergebnissen

In [None]:
import functools

def memoize(func):
    cache = {}
    @functools.wraps(func)
    def _memoize(*args):
        if args in cache:
            return cache[args]
        result = func(*args)
        cache[args] = result
        return result
    return _memoize

In [None]:
@logging
@memoize
def factorial(n):
    if n == 1:
        return 1
    else:
        return n*factorial(n-1)

In [None]:
factorial(4)

In [None]:
factorial(3)

### 2.6 Ausnahmen

#### Ausnahme abfangen oder weitermachen

In [None]:
def lese_datei(filename):
    try:
        datei = open(filename)
    except IOError as e:
        print('abgefangener Fehler:', e)
    else:
        content = datei.readlines()
        datei.close()
        return content

In [None]:
!echo 'Das ist der Inhalt der Test-Datei.\n' > test.dat
!ls

In [None]:
lese_datei('test.dat')

In [None]:
!rm test.dat
!ls

In [None]:
lese_datei('test.dat')

#### Abfangen verschiedener Ausnahmen

In [None]:
def myfunc(x):
    mydict = {1: 'eins', 2: 'zwei'}
    try:
        print(mydict[int(x)])
    except KeyError as e:
        print('KeyError:', e)
    except TypeError as e:
        print('TypeError:', e)

In [None]:
myfunc(1.5)

In [None]:
myfunc(5.5)

In [None]:
myfunc(1+3j)

#### Das Gleiche ohne Wiederholung von Code

In [None]:
def myfunc(x):
    mydict = {1: 'eins', 2: 'zwei'}
    try:
        print(mydict[int(x)])
    except (KeyError, TypeError) as e:
        print(': '.join([type(e).__name__, str(e)]))

In [None]:
myfunc(5.5)

In [None]:
myfunc(1+3j)

#### Wenn etwas auf jeden Fall durchgeführt werden soll

In [None]:
def myfunc(nr, x):
    datei = open('test_%i.dat' % nr, 'w')
    datei.write('ANFANG\n')
    try:
        datei.write('%g\n' % (1/x))
    except ZeroDivisionError as e:
        print('ZeroDivisionError:', e)
    finally:
        datei.write('ENDE\n')
        datei.close()
   
for nr, x in enumerate([1.5, 0, 'Test']):
    myfunc(nr, x)

In [None]:
!ls

In [None]:
!cat test_0.dat
print('-'*80)
!cat test_1.dat
print('-'*80)
!cat test_2.dat

In [None]:
def myfunc(nr, x):
    datei = open('test_%i.dat' % nr, 'w')
    datei.write('ANFANG\n')
    try:
        datei.write('%g\n' % (1/x))
    except ZeroDivisionError as e:
        print('ZeroDivisionError:', e)
    datei.write('ENDE\n')
    datei.close()
   
for nr, x in enumerate([1.5, 0, 'Test']):
    myfunc(nr, x)

In [None]:
!ls

In [None]:
!cat test_0.dat
print('-'*80)
!cat test_1.dat
print('-'*80)
!cat test_2.dat

#### Selbst eine Ausnahme auslösen …

In [None]:
raise ValueError('42 ist keine erlaubte Eingabe!')

#### … und woanders behandeln

In [None]:
def reciprocal(x):
    try:
        return 1/x
    except ZeroDivisionError:
        msg = 'May be the main program knows what to do...'
        raise ZeroDivisionError(msg)
   
try:
    reciprocal(0)
except ZeroDivisionError as e:
    print(e)
    print("Let's just continue!")
   
print("That's the end of the program.")

### 2.7 Kontext mit with-Anweisung

#### Kontextmanager zur Vermeidung von try … finally …

In [None]:
with open('test.dat', 'w') as file:
    for n in range(4, -1, -1):
        file.write('{:g}\n'.format(1/n))

In [None]:
!cat test.dat

In [None]:
try:
    with open('test.dat', 'w') as file:
        for n in range(4, -1, -1):
            file.write('{:g}\n'.format(1/n))
except ZeroDivisionError:
    print('division by zero')

print('file is closed: {}'.format(file.closed))