# Python Workshop for Beginners

### Basics, Datentypen, Schleifen, Funktionen und Klassen, Idiome

#### Einleitung
Dieses Notebook enthält das gesamte Material des Workshops und dient als interaktive Resource.  
Code-Zellen können mit Strg+Enter oder Shift+Enter ausgeführt werden.

## Basics
> Python ist eine universelle, üblicherweise interpretierte, höhere Programmiersprache. Sie hat den Anspruch, einen gut lesbaren, knappen Programmierstil zu fördern.
> 
> Python unterstützt mehrere Programmierparadigmen, z. B. die objektorientierte, die aspektorientierte und die funktionale Programmierung. Ferner bietet es eine dynamische Typisierung. Wie viele dynamische Sprachen wird Python oft als Skriptsprache genutzt.
> — [Wikipedia](https://de.wikipedia.org/wiki/Python_(Programmiersprache))

Python ist um die Idee herum aufgebaut, das Code in der Regel nur einmal geschrieben wird, aber viel öfter gelesen wird. Leserlichkeit ist deshalb eines der Hauptkonzepte und macht Python sehr einsteigerfreundlich.  
Weitere Prinzipien sind im *Zen of Python* beschrieben:

> Beautiful is better than ugly.  
> Explicit is better than implicit.  
> Simple is better than complex.  
> Complex is better than complicated.  
> Flat is better than nested.  
> Sparse is better than dense.  
> Readability counts.  
> Special cases aren't special enough to break the rules.  
> Although practicality beats purity.  
> Errors should never pass silently.  
> Unless explicitly silenced.  
> In the face of ambiguity, refuse the temptation to guess.  
> There should be one-- and preferably only one --obvious way to do it.  
> Although that way may not be obvious at first unless you're Dutch.  
> Now is better than never.  
> Although never is often better than *right* now.  
> If the implementation is hard to explain, it's a bad idea.  
> If the implementation is easy to explain, it may be a good idea.  
> Namespaces are one honking great idea -- let's do more of those!  
> 
> — [The Zen of Python](https://peps.python.org/pep-0020/)

#### Why you should care about Python

Laut [TIOBE Index](https://www.tiobe.com/tiobe-index/) ist Python aktuell die am populärste — und am schnellsten wachsende — Programmiersprache der Welt und wird in nahezu allen Bereichen eingesetzt. Die einzige Ausnahme sind sicherheitskritische Embedded-Systeme.

Zu den Stärken gehören schnelles Prototyping und ein riesiges Package-Repository. Egal was ihr für ein Problem habt, wahrscheinlich gibt es schon ein Paket das genau dieses Problem löst, oder es zumindest sehr einfach macht.

Während in der Vergangenheit vor allem wissenschaftliche und ML Anwendungen stark auf Python gesetzt haben, ist die Verbreitung heute so groß, dass fast alle Tools die wir in unserem Projekt nutzen entweder direkte Python Entwicklungen sind oder SDKs oder Interfaces für Python zur Verfügung stellen:

* [Azure Python SDK](https://docs.microsoft.com/en-us/azure/developer/python/sdk/azure-sdk-overview)
* [AWS SDK for Python](https://aws.amazon.com/sdk-for-python/)
* [Google Cloud API](https://cloud.google.com/python/docs/reference)
* [Pyspark](https://spark.apache.org/docs/latest/api/python/getting_started/index.html)
* [Apache Airflow](https://airflow.apache.org/)
* [Django](https://www.djangoproject.com/)
* SciPy
* Pandas
* NumPy
* Tensorflow
* Keras
* Scikit-learn

## Datentypen
Neben den Standarddatentypen (int, float, bool, str) sind vor allem dictionaries äußerst nützlich und auch innerhalb der Python Standardlibrary sehr weit verbreitet
<table><tr>
<td> <img src="https://upload.wikimedia.org/wikipedia/commons/thumb/1/10/Python_3._The_standard_type_hierarchy.png/370px-Python_3._The_standard_type_hierarchy.png" alt="Drawing" style="width: 500px;"/> </td>
<td> <img src="https://paulvanderlaken.files.wordpress.com/2019/11/image-7.png" alt="Drawing" style="width: 500px;"/> </td>
</tr></table>

In [2]:
# Listen
print("Listen:")
my_list = [1,2,3,4,"5"]    # können verschiedene Datentypen enthalten
my_list.append(6)          # können erweitert werden 
my_list.extend([7,8,9])    
print(my_list)
print(my_list[0])          # Index basierter Zugriff
print(my_list[:8:2])       # Slicing
my_list[0]=[1,2]           # Veränderbar
print(my_list)

print("Tupel:")
# Tupel sind wie Listen, können aber nicht verändert werden:
my_tuple = (1,2,3,4,5)
print(my_tuple)
print(my_tuple[-2:])       # Slicing vom Ende her
print()

small_tuple = (1,2)
a, b = small_tuple         # Entpacken in variablen
print(a)

Listen:
[1, 2, 3, 4, '5', 6, 7, 8, 9]
1
[1, 3, '5', 7]
[[1, 2], 2, 3, 4, '5', 6, 7, 8, 9]
Tupel:
(1, 2, 3, 4, 5)
(4, 5)

1


In [16]:
# Dictionaries
my_dict = {"key" : "value1", # mapping zwischen key: value
           (0,1): "value2",
          }
print(my_dict)

my_dict["key2"] = [1,2]      # veränderbar
print(my_dict["key2"])       # indizierbar

print("key" in my_dict)      # Prüfung ob ein key im dictionary ist

l = [2,3]
my_dict[l] = "spam"          # Fehler! keys müssen unveränderlich sein!

{'key': 'value1', (0, 1): 'value2'}
[1, 2]
True


TypeError: unhashable type: 'list'

## Schleifen
For-Schleifen in Python können über alle iterierbaren Objekte ausgeführt werden:  
* Listen
* Tupel
* Dictionaries (keys)
* Sets
* Strings
* Generators
* Iterators

Im Gegensatz zu anderen Programmiersprachen wird standardmäßig *direkt* über die Elemente itteriert, nicht über einen Index

In [30]:
colors = ["green", "red", "blue"]
for i in range(len(colors)):           # iteration über index wie in Java oder C
    print(colors[i])                   # sieht so umständlich aus, dass es nicht richtig sein *kann*
print()

for color in colors:                   # pythonic, for each in Java oder C++
    print(color)
print()

print("Sortiert:")
for color in sorted(colors, reverse=True):
    print(color)
print()

for idx, color in enumerate(colors):   # falls der Index gebraucht wird: enumerate
    print(idx,color)

green
red
blue

green
red
blue

Sortiert:
red
green
blue

0 green
1 red
2 blue


In [32]:
# Was ist mit mehreren Listen gleichzeitig? --> zip 
names = ["bob", "peter", "lisa"]

for name, color in zip(names,colors):
    if name == "lisa":
        break
    else:
        print(name+": "+color) 

bob: green
peter: red


Viele nützliche Funktionen sind in dem Standardmodul [itertools](https://docs.python.org/3/library/itertools.html) zusammengefasst.

## Funktionen

In [35]:
def my_add(a,b):       # Funktionsdefinition
    return a+b

print(my_add(2,3))     # Aufruf

def my_add(a,b,c=0):   # Funktionsdefinition mit default Werten
    return a+b+c

print(my_add(2,3))
print(my_add(2,3,1))

5
5
6


In [None]:
# Best practise: keyword arguments nutzen!
twitter_search("obama",20,False,True)                                # was bedeuten die Argumente??
twitter_search("obama", numteweets=20, retweets=False, unicode=True) # viel lesbarer!

In [36]:
def my_add(a,b,*args,**kwargs):                           # *args und **kwargs können für beliebige anzahl an argumenten stehen
    if kwargs:                                            # args ist ein Tupel, kwargs ist ein Dictionary
        print("Additional keyword arguments are",kwargs)  # nützlich vor allem zum durchreichen von argumenten an andere funktionen
    return a+b+sum(args)

print(my_add(1,2,3,4,additional="spam"))

Additional keyword arguments are {'additional': 'spam'}
10


In [3]:
# * (ent)packt iterierbare objekte, ** (ent)packt Dictionaries
my_tuple = (1,2)
my_dict = {"a": 2, "b":3}

def my_add(a,b):
    return a+b

print(my_add(*my_tuple))

print(my_add(**my_dict))

3
5


In [4]:
def hashbox_print(fcn, *args,**kwargs):          # Funktionen sind 1. class Objekte und können ganz normal übergeben werden
    result_string = str( fcn(*args,**kwargs) )   # *args und **kwargs werden weitergereicht
    print("#"*(len(result_string)+4))
    print("# "+result_string+" #")
    print("#"*(len(result_string)+4))

hashbox_print(my_add,2,3)                        # my_add() ruft die Funktion auf, my_add ist das Funktionsobjekt
hashbox_print(my_add,54,55)

#####
# 5 #
#####
#######
# 109 #
#######


### Anonyme Funktionen
Werden kurze Funktionen (oft als Parameter für andere Funktionen) benötigt, können lambdas genutzt werden. Diese sind kurzlebige, anonyme Funktionen ohne Namen.

In [5]:
hashbox_print(lambda x,y: x*y, 2,3)

#####
# 6 #
#####


### Parameterübergabe
Python verwendet pass-by-object-reference, in-place Änderungen von mutable Objekten haben einen Effekt außerhalb der Funktion, Zuweisungen hingegen nicht!  
**Best practice:** Funktionen sollten keine Parameter verändern, sondern neue Objekte erzeugen und diese zurückgeben. 

In [6]:
def reassign(var):
    var = [0,1]
    
def append(var):
    var.append(1)
    
my_list = [0]
reassign(my_list)
print(my_list)
append(my_list)
print(my_list)

[0]
[0, 1]


## Exception Handling
> I asked God for a bike, but I know God doesn't work that way. So I stole a bike and asked for forgiveness.
>
> — Emo Philips

In Python gilt das Prinzip *Easier to Ask for Forgiveness than Permission* als best-practice (im Gegensatz zu *Look Before You Leap*).  
Exceptions können mit dem try / except / finally Konstrukt abgefangen und gemanaged werden.

In [17]:
a = 10
b = 0

try:                                # Code der eine Exception erzeugen könnte innerhalb try
    c = a / b
    print(c)
except ZeroDivisionError as error:  # Fehler wird abgefangen falls Exception aufgetreten
    print(error)                    # Error-Handling
finally:                            # Finally Block wird IMMER ausgeführt, egal ob es einen Fehler gab oder nicht
    print('Finishing up.')          

division by zero
Finishing up.


## Klassen

In [60]:
class Person:
    def __init__(self, name, age):                           # Initialisierung (NICHT der Konstruktor)
        self.name = name
        self.age = age
    
    def say_hello(self):
        print(f"My name is {self.name}, I'm {self.age} years old")

bob = Person("Bob",32)
bob.say_hello()

My name is Bob, I'm 32 years old


<__main__.Person at 0x7f6540d45de0>

Dunder Methoden zB \_\_init\_\_ sind Methoden mit spezieller Funktion, die von built-in Funktionen aufgerufen werden oder die Logik für Operatoren implementieren.

Eine (unvollständige) Übersicht:
* \_\_init\_\_ 
* \_\_repr\_\_ 
* \_\_str\_\_ 
* \_\_lt\_\_ 
* \_\_le\_\_ 
* \_\_eq\_\_ 
* \_\_ne\_\_ 
* \_\_ge\_\_ 
* \_\_gt\_\_ 
* \_\_bool\_\_
* \_\_call\_\_
* \_\_len\_\_
* \_\_add\_\_
* \_\_sub\_\_
* \_\_mul\_\_
* \_\_enter\_\_
* \_\_exit\_\_
* \_\_iter\_\_

In [1]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    
    def say_hello(self):
        print(f"My name is {self.name}, I'm {self.age} years old")
        
    def __str__(self):                               # wird von print() oder str() genutzt
        return f"{self.name}: {self.age} years old"
    
    def __repr__(self):                              # wird genutzt um ein objekt darzustellen
        return f"<Person '{self.name}'>"
    
    def __lt__(self,other):                          # < operator
        return self.age < other.age
      
    def __gt__(self,other):                          # > operator
        return self.age > other.age
    
alice = Person("Alice",25)
bob = Person("Bob",32)

list(sorted([bob,alice]))

[<Person 'Alice'>, <Person 'Bob'>]

In [2]:
class Employee(Person):                     # Vererbung
    def __init__(self,name, age, job):
        super().__init__(name, age)
        self.job = job
    
    def job_descr(self):
        print(f"I'm working as {self.job}")
        
lisa = Employee("Lisa",29, "Consultant")
lisa.say_hello()
lisa.job_descr()

My name is Lisa, I'm 29 years old
I'm working as Consultant


In [69]:
class Persons:
    def __init__(self,persons):
        self.persons = persons
    
    def __iter__(self):                         # macht Persons iterable
        for person in self.persons:
            yield (person.name, person.age)     # yield macht aus der Funktion eine generator Funktion
            
for name,age in Persons([alice,bob,lisa]):
    print(f"{name=}: {age=}")

name='Alice': age=25
name='Bob': age=32
name='Lisa': age=29


### Polymorphismus und Duck Typing
> If it swims like a duck, looks like a duck and quacks like a duck, it's probably a **duck**

In [6]:
from abc import ABC, abstractmethod

class Animal(ABC):         # Abstrakte Klasse
    
    @abstractmethod        # die folgende Funktion MUSS überschrieben werden
    def make_noise(self):
        pass

class Dog(Animal):         # implementiert Animal
    
    def make_noise(self):  # überschreibt die abstrakte Funktion
        print("Woof!")    

class Cat(Animal):         # implementiert Animal
    
    def make_noise(self):  # überschreibt die abstrakte Funktion
        print("Meow!")
        
def say_hello(animal):     # generische Funktion
    animal.make_noise()    # ruft Methode einer Instanz auf

say_hello(Dog())
say_hello(Cat())

class Duck:                # erbt NICHT von Animal
    
    def make_noise(self):  # implementiert Funktion mit selbem Namen
        print("Quack!")
        
say_hello(Duck())           # Duck Typing!

Woof!
Meow!
Moo!


## Idiome
Idiomatisches Python ist oft lesbarer und performanter!

### Schleifen und Comprehensions
Die Basics wurden oben schon besprochen, es sollte immer direkt über eine Liste / Tuple / ... iteriert werden, nicht über einen Index.  
Ein häufig vorkommender Fall ist das bilden einer Liste oder eines Dictionaries in einer loop. Dafür gibt es list und dict comprehensions sowie generator expressions:

In [32]:
from hashlib import md5

def hash(obj):
    string = str(obj)
    return md5(string.encode()).hexdigest()

iterations = 10_000

# schlecht, mehrere Zeilen für eine Sache die wir erreichen wollen
my_list = []
for idx in range(iterations):
    my_list.append(hash(idx))
    
# besser, eine Sache = eine Zeile mit list comprehension
my_list2 = [hash(idx) for idx in range(iterations)]

In [28]:
# list comprehensions können zusätzliche filter regeln enthalten
even_numbers = [i for i in range(100) if i % 2 ==0]
print(even_numbers)

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98]


In [37]:
# übertreibt es nicht, mehrere loops in einer comprehension sind selten eine gute Idee
result = [(x,y,z) for x in range(10) for y in range(5) for z in range(10) if x*y+z>15]

[(2, 4, 8),
 (2, 4, 9),
 (3, 3, 7),
 (3, 3, 8),
 (3, 3, 9),
 (3, 4, 4),
 (3, 4, 5),
 (3, 4, 6),
 (3, 4, 7),
 (3, 4, 8),
 (3, 4, 9),
 (4, 2, 8),
 (4, 2, 9),
 (4, 3, 4),
 (4, 3, 5),
 (4, 3, 6),
 (4, 3, 7),
 (4, 3, 8),
 (4, 3, 9),
 (4, 4, 0),
 (4, 4, 1),
 (4, 4, 2),
 (4, 4, 3),
 (4, 4, 4),
 (4, 4, 5),
 (4, 4, 6),
 (4, 4, 7),
 (4, 4, 8),
 (4, 4, 9),
 (5, 2, 6),
 (5, 2, 7),
 (5, 2, 8),
 (5, 2, 9),
 (5, 3, 1),
 (5, 3, 2),
 (5, 3, 3),
 (5, 3, 4),
 (5, 3, 5),
 (5, 3, 6),
 (5, 3, 7),
 (5, 3, 8),
 (5, 3, 9),
 (5, 4, 0),
 (5, 4, 1),
 (5, 4, 2),
 (5, 4, 3),
 (5, 4, 4),
 (5, 4, 5),
 (5, 4, 6),
 (5, 4, 7),
 (5, 4, 8),
 (5, 4, 9),
 (6, 2, 4),
 (6, 2, 5),
 (6, 2, 6),
 (6, 2, 7),
 (6, 2, 8),
 (6, 2, 9),
 (6, 3, 0),
 (6, 3, 1),
 (6, 3, 2),
 (6, 3, 3),
 (6, 3, 4),
 (6, 3, 5),
 (6, 3, 6),
 (6, 3, 7),
 (6, 3, 8),
 (6, 3, 9),
 (6, 4, 0),
 (6, 4, 1),
 (6, 4, 2),
 (6, 4, 3),
 (6, 4, 4),
 (6, 4, 5),
 (6, 4, 6),
 (6, 4, 7),
 (6, 4, 8),
 (6, 4, 9),
 (7, 1, 9),
 (7, 2, 2),
 (7, 2, 3),
 (7, 2, 4),
 (7, 2, 5),
 (7,

In [25]:
names = ["bob", "peter", "lisa"]
colors = ["green", "red", "blue"]

# schlecht
my_dict = {}
for name, color in zip(names,colors):
    my_dict[name]=color
    
# besser
my_dict2 = {name: color for name,color in zip(names,colors)}

### If Bedingung: Truthy und Falsey Werte

In [None]:
# Pythonic if: "truthy" und "falsey"
if 1:
    print("numbers are considered True...")
if not 0:
    print("...unless they are 0")

if "a":
    print("strings are considered True...")
if not "":
    print("...unless they are empty")

if colors:
    print("lists are considered True...")
if not []:
    print("...unless they are empty")
    
# Gilt für alle eingebauten Datentypen und für viele erweiterte

### Contextmanagers
Häufig werden in Programmen Resourcen genutzt, die explizit wieder freigegeben werden müssen, z.B. Files, Locks, Semaphores etc.  
Das Problem dabei: was wenn während der Verarbeitung Fehler auftreten und den Ablauf verändern? Klassisch muss alles in try / except Blöcke gefasst werden.  
In Python 

In [None]:
# schlecht:
f = open('data.txt')
try:
    data = f.read()
finally:
    f.close()

# besser:
with open('data.txt') as f:
    data = f.read()

### Generator Funktionen und Expressions
Listen haben einen Nachteil bei sehr großen Datenmengen: sie werden komplett im Speicher vorgehalten. Oft ist das nicht nötig, sondern wir wollen nur eine Berechnung / Aggregation auf die Elemente durchführen. Hier kommen generator Funktionen ins Spiel.

In [25]:
import sys

iterations = int(1e6)

squared_list = [x**2 for x in range(iterations)]  # eckige Klammern --> list comprehension
squared_gen = (x**2 for x in range(iterations))   # runde Klammern --> generator expression


print(sys.getsizeof(squared_list))
print(sys.getsizeof(squared_gen))

squared_gen  # Generator Objekt, Evaluierung ist lazy

8448728
104


<generator object <genexpr> at 0x7f67c878a8f0>

In [26]:
import math

for value in squared_gen:              # Generator Objekte sind iterierbar
    if math.sqrt(value) % 200000 == 0:
        print(value)

0
40000000000
160000000000
360000000000
640000000000


In [None]:
for value in squared_gen:              # Generator Objekte sind nach einem mal erschöpft, Listen bleiben erhalten!
    if math.sqrt(value) % 200000 == 0:
        print(value)

**Best practice**: bei sehr großen Datenmengen sollten Generator Expressions genutzt werden, falls die Daten nur einmal gebraucht werden.  
In Python 3 sind fast alle Funktionen der Standard Library iterator / generator und können mit diesen umgehen.

In [1]:
# Generator Funktionen werden bei einem yield unterbrochen und behalten ihren Zustand:
def counter_gen():
    value = 0                # Initialisierung
    while True:       
        value += 1
        yield value          # Gibt den aktuellen Wert zurück und pausiert den generator

def counter_fcn():            # Alternative mit normaler Funktion
    counter_fcn.value += 1    # Trick um Zustand zu behalten
    return counter_fcn.value  
counter_fcn.value = 0         # Initialisierung, außerhalb der Definition!

In [None]:
for idx in range(3):
    print(counter_fcn())

In [11]:
counter = counter_gen()
for idx in range(3):
    print(next(counter))

1
2
3


In [1]:
def create_counter():         # Alternative 2 mit geschachtelter Funktion
    value = 0                 # Initialisierung
    def counter_fcn():        # inner Funktion
        nonlocal value        # erlaubt es value zu verändern
        value += 1
        return value          # return der inneren Funktion
    return counter_fcn        # äußere Funktion gibt innere Funktion zurück

counter = create_counter()
for idx in range(3):
    print(counter())

1
2
3


In [5]:
def countdown(n):
    value = n
    while True:
        if value == 0:
            yield "Liftoff!"
            break
        else:
            yield value
            value-=1
for i in countdown(3):
    print(i)

3
2
1
Liftoff!


## Monkey Patching und Pythons Import Funktionalität
Der Python-Interpreter importiert Module nur ein einziges mal. Das erlaubt das Ersetzen (monkey patch) von beliebigen Teilen vom Code für alle folgenden Programmteile. 

In [7]:
class Foo:
    def __str__(self):
        return "foo"
    
f = Foo()
print(f)
Foo.__str__ = lambda self: "bar"
print(f)

foo
bar


In [None]:
import builtins
old_print = builtins.print

def new_print(value):
    old_print("debug")
    old_print(value)
    
builtins.print = new_print

In [20]:
print("test")

RecursionError: maximum recursion depth exceeded