# Funktionen
In den vorherigen Skripten wurden in den Beispielen bereits einige Methoden, Funktionen und Loops benutzt.
Diese werden nun in diesem Notebook grundlegender eingeführt.

Eine Funktion ist ein Codeblock, der ausgeführt wird, wenn die Funktion aufgerufen wird. Mithilfe von Funktionen können bestimmte definierte Aufgaben gelöst werden.
Einer Funktion können Parameter übergeben werden, welche beeinflussen, was in der Funktion passiert und somit auch den Output dieser Funktion beeinflussen.
Um eine Funktion zu schreiben, wird sie zunächst definiert, dann wird festgelegt was die Funktion machen soll.

In der Theorie ist eine Funktion eine Verkettung des Inputs (zur Verfügung stehende Information) und Outputs (gewünschte Information). Dabei wird durch Aufgaben/Funktionen aus der zur Verfügung stehenden Information der Output erzeugt. 

Beim Schreiben von Funktionen ist es am besten eine Funktion durch das Topdown-Prinzip zu programmieren. 
Hierbei wird nach folgendem Workflow vorgegangen:
* Aufgabe definieren
* in kleinere Teilaufgaben (Funktion!) einteilen
* Reihenfolge der Teilaufgaben festlegen
* Gemeinsamkeiten der Teilaufgaben in allgemeine Ansätze aufteilen
* Wiederhole dies für alle Teilaufgaben

Man beginnt mit Pseudo-Code für die Funktion, welche die Lösung der Unteraufgabe verarbeitet. (Scheipl, 2019)

Allgemeine Hinweise zum Funktionen schreiben:

* Inputs checken (assert)
* Funktionen sollten immer denselben Output haben, wenn man ihnen dasselbe übergibt (Unabhängigkeit von globalen Variablen, nur von Argumenten abhängig
* lange Parameterlisten/Funktionen &rarr; aufteilen in Unterfunktionen
* C & P &rarr; Funktion (DRY, Don't repeat yourself)
* Keep it simple (KIS) 
    + Programme werden von selbst schneller
    + lieber transparent und korrekt als clever und effizient
    + keine Überflüssige Komplexität


   

In [1]:

# if (builds_wall(x)):
#               if (offends_people(x)):
#                            if (x["hair"]["color"] == "orange"):
#                                          if (not is_finite(x["hair_color"])):
#                                                        if (x["sexism"] > 100):
#                                                                    # ...


# besser:

# def makes_america_great(x):
#     builds_wall(x) & offends_people(x)
#  ... more definitions here

# def is_donald(x):
#   has_weird_orange_hair(x) & grabs_pussy(x) & makes_america_great(x)
#    # ...
#     if (is_donald(x)):
#       # ...



Die Funktion `.format()` ermöglicht es, ein Objekt, welches sich ändern kann, in einen vorgefertigten String einzufügen. Die Position des Objekts im String wird durch geschweifte Klammern angezeigt.

In [2]:
def my_first_function():
    print('Hello world!')

print("type: {}".format(my_first_function))

my_first_function()  # Funktion aufrufen

type: <function my_first_function at 0x0000029B1D1CAB00>
Hello world!


### Argumente
* Man kann Funktionen Argumente übergeben, welche den Funktionsoutput beeeinflussen (sollten!).
* Der Funktion greet_us müssen zwei Namen übergeben werden, damit sie funktioniert.

In [3]:
def greet_us(name1, name2):
    print('Hallo {} und {}!'.format(name1, name2))

greet_us('Max Mueller', 'Gustav Gans')

Hallo Max Mueller und Gustav Gans!


In [4]:
# Funktion mit Rückgabewert
def strip_and_lowercase(original):
    modified = original.strip().lower()
    return modified # Anders als in R hier notwendig

haesslicher_string = '  gross UND KLeinBUchStaben '
pretty = strip_and_lowercase(haesslicher_string)
# print('pretty: {}'.format(pretty))
print(pretty)

gross und kleinbuchstaben


### Argumente
Die Reihenfolge der Argumente kann durch das Nennen des Namens des Argumentes variiert werden. Ansonsten werden die übergebenen Werte in der Reihenfolge zugeordnet, wie sie übergeben werden.

In [5]:
def my_fancy_calculation(first, second, third):
    return first + second - third 

print(my_fancy_calculation(3, 2, 1))

print(my_fancy_calculation(first = 3, second = 2, third = 1))

# Bei Keyword-Argumenten kann die Reihenfolge vertauscht werden
print(my_fancy_calculation(third = 1, first = 3, second = 2))

# Argumente und Keyword-Argumente können gemeinsam verwendet werden,
# allerdings muss mit Argumenten begonnen werden
print(my_fancy_calculation(3, third = 1, second = 2))  

4
4
4
4


### Argumente mit default Werten

In [6]:
def create_person_info(name, age, salary=650, job=None):
    info = {'name': name, 'age': age, 'salary': salary}
    
    # der 'job' key wird nur hinzugefügt, wenn er als Parameter bereitgestellt wird 
    if job:  
        info.update(dict(job=job))
        
    return info

person1 = create_person_info('Anna Voss', 47)  # Standard-Werte für Job und Salary werden verwendet
person2 = create_person_info('Lisa Schmidt', 22, 'hacker', 10000)
print(person1)
print(person2)

{'name': 'Anna Voss', 'age': 47, 'salary': 650}
{'name': 'Lisa Schmidt', 'age': 22, 'salary': 'hacker', 'job': 10000}


**Verwende keine veränderlichen Objekte als default-Argumente!**

&rarr; Eine Funktion sollte bei gleichen übergebenen Argumenten immer (!) denselben Output haben.


In [7]:
def append_if_multiple_of_five(number, magical_list=[]):
    if number % 5 == 0:
        magical_list.append(number)
    return magical_list

print(append_if_multiple_of_five(100))
print(append_if_multiple_of_five(105))
print(append_if_multiple_of_five(123))
print(append_if_multiple_of_five(123, []))
print(append_if_multiple_of_five(123))
print(append_if_multiple_of_five(110))

[100]
[100, 105]
[100, 105]
[]
[100, 105]
[100, 105, 110]


Stattdessen:

In [8]:
def append_if_multiple_of_five(number, magical_list = None):
    if not magical_list:
        magical_list = []
    if number % 5 == 0:
        magical_list.append(number)
    return magical_list

print(append_if_multiple_of_five(100))
print(append_if_multiple_of_five(105))
print(append_if_multiple_of_five(123))
print(append_if_multiple_of_five(123, []))
print(append_if_multiple_of_five(123))

[100]
[105]
[]
[]
[]


### [`pass`](https://docs.python.org/3/reference/simple_stmts.html#the-pass-statement) statement
`pass` ist eine Anweisung, die nichts tut, wenn sie ausgeführt wird. Sie kann z.B. als Platzhalter verwendet werden, um den Code beim Entwerfen von Funktionen und/ oder Klassen syntaktisch korrekt zu halten. Folgendes ist zum Beispiel gültiger Python-Code:

In [1]:
def my_function(some_argument):
    pass

def my_other_function():
    pass

### Lambda Funktionen

Lambda-Funktionen (auch als anonyme Funktionen bekannt) sind Funktionen ohne Namen in Python, die normalerweise für einfache und kurzlebige Operationen bzw Funktionen verwendet werden, um diese in einem einzigen Ausdruck auszuführen.
Anders als "normale" Funktionen werden sie nicht mit 'def', sondern mit dem Schlüsselwort 'lambda' definiert, gefolgt von den jeweiligen Argumenten und einem Ausdruck.

In [2]:
# Eine normale python Funktion:
def funktion(x):
    return x * x
# Als Lambda-Funktion:
lambda x: x * x

<function __main__.<lambda>(x)>

In [8]:
numbers = [1, 2, 3, 4, 5] # Beispiel einer normalen Funktion um Zahlen zu quadrieren

def square(x):
    return x**2

squared_numbers = list(map(square, numbers))
print(squared_numbers)

[1, 4, 9, 16, 25]


In [12]:
# Mit Lambda Funktion:

numbers = [1, 2, 3, 4, 5]

squared_numbers = list(map(lambda x: x**2, numbers))
print(squared_numbers)

[1, 4, 9, 16, 25]


Hier wird die map()-Funktion verwendet, um die Lambda-Funktion lambda x: x**2 auf jedes Element der numbers-Liste anzuwenden. Die Lambda-Funktion nimmt eine Zahl x entgegen und gibt das Quadrat davon zurück. Das Ergebnis wird in der squared_numbers-Liste gespeichert.

Der Vorteil der Lambda-Funktion besteht darin, dass man die Quadratfunktion in diesem Fall direkt in der map()-Funktion definieren kann, ohne eine separate Funktion erstellen zu müssen. Dies macht den Code kompakter und lesbarer.

### Docstrings
Strings zur Dokumentation von Funktionen, Methoden, Modulen und Variablen. 

In [10]:
def print_sum(val1, val2):
    """Function which prints the sum of given arguments."""
    print('sum:' + str(val1 + val2))

help(print_sum)

print_sum(2, 3)

Help on function print_sum in module __main__:

print_sum(val1, val2)
    Function which prints the sum of given arguments.

sum:5


In [14]:
def calculate_sum(val1, val2):
    """This is a longer docstring defining also the args and the return value. 

    Args:
        val1: The first parameter.
        val2: The second parameter.

    Returns:
        The sum of val1 and val2.
        
    """
    return val1 + val2

help(calculate_sum)

Help on function calculate_sum in module __main__:

calculate_sum(val1, val2)
    This is a longer docstring defining also the args and the return value. 
    
    Args:
        val1: The first parameter.
        val2: The second parameter.
    
    Returns:
        The sum of val1 and val2.



## Methoden
Funktionen innerhalb von Klassen werden Methoden genannt. Sie werden ähnlich verwendet wie Funktionen. Funktionen und Methoden unterscheiden sich dadurch, dass Methoden immer mit einem Objekt bzw. einer Klasse assoziiert sind, dies ist bei Funktionen nicht der Fall. Bei den meisten Methoden lautet daher der erste Parameter immer *self*. Wenn die Methode ausgeführt wird, wird *self* automatisch durch die Instanz (das Objekt) ersetzt.
Man unterscheidet zwischen drei unterschiedlichen Methodentypen: 
* Instanzmethoden
* Klassenmethoden
* Statische Methoden

### Instanzmethoden
* häufigste Methode, die in Klassen verwendet wird
* wird verwendet um Details einer Instanz (ein Objekt einer bestimmten Klasse) zu erhalten oder festzulegen
* Eine Instanzvariable ist eine Variable, die innerhalb des Konstruktors oder innerhalb einer Methode definiert ist und nur zur aktuellen Instanz einer Klasse gehört und sich von Objekt zu Objekt unterscheidet.
* Jede Methode, die in einer Klasse erstellt wird, ist eine Instanzmethode, sofern man es nicht explizit als andere Methode festlegt. So wird eine Instanzmethode erstellt:

In [15]:
class My_class:
  def instance_method(self):
    return "This is an instance method."

Um die Methode nun auszuführen, müssen wir sie einem Objekt zuweisen.

In [16]:
objekt = My_class()
objekt.instance_method()

'This is an instance method.'

#### `__init__()`
`__init__()` ist eine spezielle Methode, ein sogenannter Konstruktor, die für die Initialisierung von Instanzen der Klasse verwendet wird. Sie wird aufgerufen, wenn ein Objekt der Klasse erstellt wird. Durch die `__init__()` Methode, können Attribute innerhalb einer Klasse initialisiert werden.

Erst wird die Klasse durch class definiert, dann können mit `__init__()` Attribute übergeben werden. Diese können dann, wenn sie einem Objekt zugewiesen werden, verwendet werden. Dies ist im zweiten Beispiel zu erkennen, in dem zwei Attribute der Klasse übergeben werden. Diese können ausgegeben werden, indem sie erst dem Objekt e zugewiesen werden und dieses dann zusammen mit der Methode ausgeführt wird. In dem ersten Beispiel, werden keine zusätzlichen Attribute initialisiert, sodass der code example = Example() nur den in der Methode festgelegten print-Befehl ausführt.


In [17]:
class Example:
    def __init__(self):
        print('Now we are inside __init__')

print('creating instance of Example')
example = Example()
print('instance created')

creating instance of Example
Now we are inside __init__
instance created


`__init__()` wird normalerweise für die Initialisierung von Instanzvariablen einer Klasse verwendet. Diese können als Argumente hinter `self` aufgeführt werden. Um auf diese Instanzvariablen später während der Verwendung der Methode zugreifen zu können, müssen sie in `self` gespeichert werden. `self` ist das erste Argument der Methoden der Klasse, und somit Zugang zu den Instanzvariablen und weiteren Methoden. In diesem Beispiel werden der Methode zwei Attribute, also zwei Instanzvariablen, übergeben. Diese werden mit `self` an die Methode gebunden. Durch 'def print_variables(self):..' wird definiert was durch die Methode ausgeführt werden soll. In diesem Fall sollen demnach die beiden übergebenen Variablen ausgegeben werden.

In [18]:

class Example:
    def __init__(self, var1, var2):
        self.first_var = var1
        self.second_var = var2
        
    def print_variables(self):
        print(self.first_var, self.second_var)
        
e = Example('abc', 123)
e.print_variables()
    

abc 123


### `__str__()`
`__str__()` ist eine spezielle Methode, die aufgerufen wird, wenn eine Instanz der Klasse in einen String umgewandelt wird (z.B. wenn die Instanz ausgegeben werden soll). Mit anderen Worten, indem die `__str__`-Methode für eine Klasse definiert wird, kann die Ausgabeversion für Instanzen dieser Klasse festgelegt werden. Die Methode sollte einen String zurückgeben. Die `__str__()` Methode ist somit eine informelle Repräsentation eines Objekts als String.

In [19]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
        
    def __str__(self):
        return 'Person: {}'.format(self.name)
    
jack = Person('Jack', 82)
print('This is the string presentation of jack: {}'.format(jack))

This is the string presentation of jack: Person: Jack


### Klassenvariablen vs. Instanzvariablen
Klassenvariablen werden von allen Instanzen der jeweiligen Klasse geteilt, wohingegen Instanzvariablen individuelle Werte für Instanzen der selben Klassenzugehörigkeit zulassen. Die zweite Zeile im nachfolgenden Codeblock ist daher eine Klassenvariable, da sie für alle Instanzen gleich ist. Dahingegen können Instanzvariablen unterschiedliche Werte in einer Klasse annehmen.
Mit `assert` lässt sich überprüfen ob eine Bedingung im Code 'True' zurückgibt, wenn dies so ist, wird der Code weiter ausgeführt, wenn dies nicht der Fall ist, wird ein 'Assertion'-Error ausgegeben. In diesem Beispiel wird assert verwendet, um zu zeigen, dass Name und Beschreibung aller Instanzen gleich sind.

In [20]:
class Example:
    # Das sind Klassenvariablen
    name = 'Example class'
    description = 'Just an example of a simple class'

    def __init__(self, var1):
        # Das ist eine Instanzvariable
        self.instance_variable = var1

    def show_info(self):
        info = 'instance_variable: {}, name: {}, description: {}'.format(
            self.instance_variable, Example.name, Example.description)
        print(info)


inst1 = Example('foo')
inst2 = Example('bar')

# Name und Beschreibung sind für alle Instanzen gleich 
assert inst1.name == inst2.name == Example.name
assert inst1.description == inst2.description == Example.description

# Wenn der Wert der Klassenvariable geändert wird, verändert er sich für alle Instanzen
Example.name = 'Modified name'
inst1.show_info()
inst2.show_info()

instance_variable: foo, name: Modified name, description: Just an example of a simple class
instance_variable: bar, name: Modified name, description: Just an example of a simple class


### Klassenmethoden
Klassenmethoden werden dafür verwendet Informationen über eine Klasse zu erhalten oder festzulegen. Anders als bei Instanzmethoden, wird hier als erstes Argument cls übergeben (also die Klasse selbst). Eine Klassenmethode ist also an die Klasse gebunden und nicht an eine Instanz der Klasse. Nun können alle Informationen zu der Klasse ausgegeben werden. 

In [21]:
class Obst:
    name = 'Obstsorten'
    
    @classmethod
    def printname(cls):
        print('Der Name ist:', cls.name)

Obst.printname()

Der Name ist: Obstsorten


### Statische Methoden
Zuletzt gibt es noch Statische Methoden. Statische Methoden werden in Python nur selten gebraucht. Ihnen muss kein besonderer Parameter übergeben werden. Sie sind unabhängig von Instanzen, deswegen könnte stattdessen auch eine Funktion verwendet werden.

In [22]:
class rechner:

    # Erstelle die statische Methode 'addieren'
    @staticmethod
    def addieren(x, y):
        return x + y

rechner.addieren(15, 110)

125

### Public vs. privat
In Python gibt es eine strikte Trennung zwischen öffentlichen und privaten Methoden oder Instanzvariablen. Die Konvention ist, den Namen der Methode oder Instanzvariable mit einem Unterstrich zu beginnen, wenn sie als privat behandelt werden soll, alles andere wird als *public* gesehen. Privat bedeutet, dass nicht von außerhalb der Klasse auf sie zugegriffen werden soll. Nehmen wir zum Beispiel an, dass wir eine Klasse `Person` mit `Alter` als Instanzvariable haben. Wir wollen, dass auf `Alter` nicht direkt zugegriffen (z.B. bearbeitet) werden kann, nachdem die Instanz einmal erstellt wurde. In Python könnten wir das folgendermaßen umsetzen: 

In [23]:
class Person:
    def __init__(self, age):
        self._age = age
        
example_person = Person(age = 15)
# Funktioniert nicht:
print(example_person.age)
# Funtioniert ebenfalls nicht:
example_person.age = 16

AttributeError: 'Person' object has no attribute 'age'

Wenn `age` lesbar, aber nicht überschreibbar sein soll, kann `property` verwendet werden:

In [24]:
class Person:
    def __init__(self, age):
        self._age = age
        
    @property
    def age(self):
        return self._age
        
example_person = Person(age = 15)
# Jetzt funktioniert:
print(example_person.age)
# Aber weiterhin nicht:
# example_person.age = 16

15


Durch die Verwendung von @property kann also ein kontrollierter Zugriff auf die Instanzvariablen der Klasse erfolgen.

In [25]:
class Person:
    def __init__(self, age):
        self._age = age
        
    @property
    def age(self):
        return self._age
    
    def celebrate_birthday(self):
        self._age += 1
        print('Alles Gute zum {}. Geburtstag!'.format(self._age))
        
example_person = Person(age = 15)
example_person.celebrate_birthday()

Alles Gute zum 16. Geburtstag!


In [26]:
print(example_person.age) # Personen alter ändert sich nur (!) durch eigene Methode in Klasse

16


In [27]:
example_person.age = 17 # Hier keine Veränderung/Ueberschreibung möglich

AttributeError: can't set attribute 'age'

### Einführung in Vererbung 
In Python bedeutet Vererbung, dass die selben Methoden und Eigenschaften einer Elternklasse, an eine Kindklasse *vererbt* werden. Im nachfolgenden Beispiel ist 'Animal' die Elternklasse (parent class). So sieht man am Output beispielsweise, dass kein Gruß der Katze definiert wurde, und deswegen der allgemeine Gruß der Elternklasse von Python ausgegeben wird.

In [28]:
class Animal:
    def greet(self):
        print('Hello, I am an animal')

    @property
    def favorite_food(self):
        return 'beef'


class Dog(Animal):
    def greet(self):
        print('wof wof')


class Cat(Animal):
    @property
    def favorite_food(self):
        return 'fish'

In [29]:
dog = Dog()
dog.greet()
print("Dog's favorite food is {}".format(dog.favorite_food)) 



wof wof
Dog's favorite food is beef


In [30]:
cat = Cat()
cat.greet()
print("Cat's favorite food is {}".format(cat.favorite_food))

Hello, I am an animal
Cat's favorite food is fish


## for-Schleifen
Mit for-Schleifen lässt sich über Sequenzen iterieren.
So passiert für jedes Element, das in der ersten Zeile der for-Schleife angegeben wird, das Ereignis was in der Schleife definiert wird. Im nächsten Beispiel wird somit für jedes Element das Element als Output ausgegeben (print). In anderen Worten: Itereriere über jedes item in meiner Liste und führe dabei für jedes item die in der Schleife festgelegten Aufgaben aus.

### Schleifen über Listen

In [31]:
my_list = [1, 2, 3, 4, 'Python', 'ist', 'super', 9]
for item in my_list:
    print(item)

1
2
3
4
Python
ist
super
9


#### `break`
Ausführung der Schleife anhalten. 

In [32]:
for item in my_list:
    if item == 'Python':
        break
    print(item)

1
2
3
4


#### `continue`
Weiter zum nächsten Element, ohne die Zeilen nach `continue` innerhalb der Schleife auszuführen.

In [33]:
for item in my_list:
    if item == 1:
        continue
    print(item)

2
3
4
Python
ist
super
9


#### `enumerate()`
Für den Fall, dass der Index ersichtlich werden soll, kann `enumerate()` verwendet werden.

Mit `enumerate()` kann man über Objekte und deren Index iterieren und das genau dann jeweils nutzen wenn man es braucht. `enumerate()` kann man in einer Schleife fast genauso verwenden wie das ursprüngliche iterierbare Objekt, statt das Objekt direkt nach *in* in die for-Schleife zu schreiben, kommt es in die Klammern.

Die Funktion gibt einem zwei Werte zurück: die Zahl der Iteration und den Wert zu dieser Iteration. 

Durch enumerate ist es nicht mehr nötig selbst die Zahl der Iteration hinzuzufügen. Dies ermöglicht es die Schleifen nachzuvollziehen, und man muss nicht mehr am Ende der Schleife den Index erhöhen.

Es ist möglich enumerate() als Argument den Startpunkt der Iteration zu übergeben, dieser ist Standardmäßig als 0 festgelegt.


Achtung: Bei Python startet der Index beim ersten Element mit 0.

In [34]:
for idx, val in enumerate(my_list):
    print('idx: {}, value: {}'.format(idx, val))

idx: 0, value: 1
idx: 1, value: 2
idx: 2, value: 3
idx: 3, value: 4
idx: 4, value: Python
idx: 5, value: ist
idx: 6, value: super
idx: 7, value: 9


In [35]:
for idx, val in enumerate(my_list):
    print(idx, val)

0 1
1 2
2 3
3 4
4 Python
5 ist
6 super
7 9


### Schleifen über dictionaries

In [36]:
my_dict = {'hacker': True, 'age': 59, 'name': 'Kevin Mitnick'}
for val in my_dict:
    print(val)

hacker
age
name


In [37]:
for key, val in my_dict.items():
    print('{} = {}'.format(key, val))

hacker = True
age = 59
name = Kevin Mitnick


### `range()`

In [38]:
for number in range(5):
    print(number)

0
1
2
3
4


In [39]:
for number in range(2, 5):
    print(number)

2
3
4


In [40]:
for number in range(0, 30, 3):  # das letzte Argument definiert die Schrittlänge
    print(number)

0
3
6
9
12
15
18
21
24
27


## Bedingungen

### `if`

In [41]:
statement = True
if statement:
    print('statement is True')
    
if not statement:
    print('statement is not True')

statement is True


In [42]:
empty_list = []
# Bei if und elif ist die Umwandlung in Boolean implizit
if empty_list:
    print('empty list will not evaluate to True')  # wird nicht ausgeführt

In [43]:
val = 5
if 0 <= val < 1 or val == 5:
    print('Value is positive and less than one or value is five')

Value is positive and less than one or value is five


### `if-else`

In [44]:
my_dict = {}
if my_dict:
    print('there is something in my dict')
else:
    print('my dict is empty :(')

my dict is empty :(


### `if-elif-else`

In [45]:
val = 26
if val >= 100:
    print('value is equal or greater than 100')
elif val > 10:
    print('value is greater than 10 but less than 100')
else:
    print('value is equal or less than 10')

value is greater than 10 but less than 100


Es können so viele `elif`-Aussagen wie benötigt anneinander gereiht werden. `else` zum Abschluss ist nicht unbedingt notwendig. 

Good Practice Tipp:
`else` und `elif` kann fast immer vermieden werden, genau wie es in R meist unnötig ist. Das nachfolgende Beispiel zeigt dies, und zeigt, dass wenn alle if und elif Bedingungen nicht zutreffen, in diesem Beispiel der zuvor definierte Wert zurückgegeben wird.

In [46]:
greeting = 'Hallo friedliche Python-Leute!'
language = 'Italian'

if language == 'Finnish':
    greeting = 'Latua perkele!'
elif language == 'Spanish':
    greeting = 'Hola!'
elif language == 'German':
    greeting = 'Guten Tag!'
    
print(greeting)

Hallo friedliche Python-Leute!


Einen detaillierteren Überblick über Bedingungen bietet dieses [Tutorial von Real Python](https://realpython.com/python-conditional-statements/).

## Debugging mit [`pdb`](https://docs.python.org/3/library/pdb.html#module-pdb)
Programme verhalten sich nicht immer so, wie man es erwarten würde. Wenn der Ursprung des Fehlers unklar ist, ist Debugging in der Regel die effektivste Methode, um die Ursache für das unerwartete Verhalten zu finden. Die Python-Standardbibliothek verfügt über einen eingebauten Debugger, der ein leistungsstarkes Werkzeug für die Lösung aller Probleme im Zusammenhang mit Code ist.

### `import pdb; pdb.set_trace()`
Der klassische Debugging-Anwendungsfall ist, dass die Ausführung des Programms an einer bestimmten Stelle angehalten, und Variablenwerte oder die Programmausführung ab diesem Punkt überwacht werden sollen. Die Ausführung kann an der gewünschten Stelle angehalten werden, indem mittels `import pdb; pdb.set_trace()` (ab Pythonversion 3.7 existert hierfür der Shortcut `breakpoint()`) ein Haltepunkt im Code festgelegt wird. 

Das Programms wird dann beim Ausführen an diesem Punkt angehalten und eine interaktive Debugger-Sitzung gestartet. Es können beliebig viele Haltepunkte festgelegt werden. 

## Hilfreiche Befehle
Die komplette Liste kann [hier](https://docs.python.org/3/library/pdb.html#debugger-commands) abgerufen werden.

* `h` oder `help`: Gibt eine Liste aller verfügbaren Befehle aus. Wenn ein Argument mit angegeben wird, z.B. `help continue`, dann wird die Hilfeseite des `continue`-Befehls ausgegeben. 
* `l` oder `list`: Listet einen Code-Abschnitt um die aktuelle Position herum auf. 
* `n` oder `next`: Führt die nächste Zeile aus. 
* `s` oder `step`: Wie `next`, springt jedoch in die Funktion, die in der nächsten Zeile aufgerufen wird.
* `c` oder `continue`: Fortsetzen der Ausführung bis zum nächsten Haltepunkt. 
* `r` oder `return`: Fortsetzen der Ausführung bis zum Ausgabewert der aktuellen Funktion. 
* `q` oder `quit`: Beendet den Debugger und bricht die Programmausführung ab.

Während der Debugging-Sitzung kann man den Wert einer beliebigen Variablen einsehen, indem man den Variablennamen eingibt. Beliebiger Code kann währenddessen ebenfalls ausgeführt werden. 

### Anwendungsbeispiel
Kommentiere die `import pdb; pdb.set_trace()`-Zeilen aus und führe die Zelle aus. Führe das Programm Zeile für Zeile mithilfe der oben genannten Befehle aus. Probiere alle Befehle mindestens einmal aus. Achte dabei auf den Unterschied zwischen `n` und `s`.

In [47]:
class SuperGreeter:
    def __init__(self, people_to_greet):
        self.people = people_to_greet

    def greet(self):
        for person in self.people:
            if person.islower():
                self.__greet_street_style(person)
            elif len(person) > 7:
                self.__greet_french(person)
            else:
                self.__greet_polite(person)
            
    def __greet_polite(self, name):
        greeting = "G'day {}! How are you doing?".format(name)
        print(greeting)

    def __greet_street_style(self, name):
        # import pdb; pdb.set_trace()  # AUSKOMMENTIEREN
        name = name.upper()
        print('WASSUP {}!?'.format(name))

    def __greet_french(self, name):
        print('Bonjour {}!'.format(name))


def main():
    people = ['John Doe', 'Donald', 'Lisa', 'tobi']
    # import pdb; pdb.set_trace()  # AUSKOMMENTIEREN
    greeter = SuperGreeter(people)
    greeter.greet()


main()




Bonjour John Doe!
G'day Donald! How are you doing?
G'day Lisa! How are you doing?
WASSUP TOBI!?


### Einführung zu Regular Expressions in Python



Regular Expressions (auch bekannt als Regex) sind ein mächtiges Werkzeug zur Verarbeitung und Manipulation von Text in Python. Sie ermöglichen die Suche nach bestimmten Mustern in Zeichenketten und das Extrahieren von Daten basierend auf diesen Mustern. Python bietet eine eingebaute Bibliothek namens "re", die Funktionen und Methoden zur Verwendung regulärer Ausdrücke bereitstellt.



#### Grundlegende Konzepte



Bevor wir uns mit der Verwendung von Regular Expressions in Python befassen, sollten einige grundlegende Konzepte verstanden werden:



1. **Zeichenklassen**: Zeichenklassen definieren eine Gruppe von Zeichen, die in einem regulären Ausdruck zusammengefasst sind. Zum Beispiel steht der reguläre Ausdruck `[abc]` für jedes Vorkommen der Zeichen 'a', 'b' oder 'c'.



2. **Quantifier**: Quantifier geben an, wie oft ein vorhergehendes Zeichen oder eine vorhergehende Gruppe in einem regulären Ausdruck auftreten kann. Einige gängige Quantifier sind '*', '+', '?' und '{n,m}'. Zum Beispiel bedeutet der reguläre Ausdruck `a+` eine oder mehrere Wiederholungen des Zeichens 'a'.



3. **Anchors**: Anker definieren bestimmte Positionen in einem Text, an denen ein Muster gefunden werden soll. Zum Beispiel steht der Anker '^' am Anfang eines regulären Ausdrucks für den Beginn einer Zeile, während der Anker '$' das Ende einer Zeile darstellt.



#### Verwendung von Regular Expressions in Python



Um Regular Expressions in Python zu verwenden, muss zuerst das Modul "re" importiert werden. Hier ist ein einfaches Beispiel, das die Verwendung von Regular Expressions zeigt:



In [48]:
import re

# Eine Zeichenkette definieren
text = "Hallo, dies ist ein Beispieltext."

# Eine regular expression definieren
pattern = r"Beispiel" # angeben nach welchem Muster (hier Wort) gesucht werden soll, 
                      # r steht für raw-String -> String soll wortwörtlich genommen werden und enthält keine escape-sequenzen

# Die Suche nach dem Muster durchführen
match = re.search(pattern, text) # sucht nur nach dem ersten Vorkommen des Musters im Text

if match:
    print("Muster gefunden!")
else:
    print("Muster nicht gefunden.")

Muster gefunden!



In diesem Beispiel wird das "re"-Modul importiert und eine Zeichenkette namens "text" definiert. Dann wird der reguläre Ausdruck "pattern" als "Beispiel" definiert. Die Funktion `re.search()` wird verwendet, um nach dem Muster in der Zeichenkette zu suchen. Wenn das Muster gefunden wird, wird die Ausgabe "Muster gefunden!" angezeigt.


Das nächste Beispiel zeigt wie mit Regular Expressions Zahlen aus einer Zeichenkette extrahiert werden können


In [49]:
def extract_numbers(text):
    pattern = r'\d+' # \d steht für digit (Ziffer) und gibt an, dass nach Zahlen gesucht werden soll
                     # das + gibt an, dass die vorhergehende Zeichenklasse (hier Ziffern) ein oder mehrmals vorkommen kann
    numbers = re.findall(pattern, text) # alle Vorkommen des Musters sollen gefunden werden und im Objekt numbers gespeichert werden
    return numbers

input_text = 'abc321def'
numbers = extract_numbers(input_text)
print('Extrahierte Zahlen:', numbers)

Extrahierte Zahlen: ['321']


In dem nächsten Beispiel wird eine Funktion definiert, mit der geprüft werden kann ob mindestens eines von zwei Worten in einem String enthalten ist. Ist eines der beiden Worte enthalten, wird dieses durch ein drittes Wort ersetzt.

In [50]:

def replace_word(text, word1, word2, replacement):
    pattern = r'\b(' + re.escape(word1) + r'|' + re.escape(word2) + r')\b' # \b ist ein Anchor für Wortgrenzen und sorgt dafür, dass das Wort 
                                                                           # nicht Teil eines längeren Wortes ist -> keine partiellen Übereinstimmungen des Wortes,
                                                                           # durch re.escape() wird vermieden, dass Sonderzeichen die RegEx beeinflussen
                                                                           # und durch | wird festgelegt dass entweder das eine ODER das
                                                                           # andere Wort übereinstimmen muss
    replaced_text = re.sub(pattern, replacement, text) # mit re.sub werden alle Vorkommen des Musters durch das angegebene
                                                       # replacement ersetzt
    return replaced_text

input_text = 'Hallo, ich bin Maurer'
input_word1 = 'Maurer'
input_word2 = 'Tischler'
input_replacement = 'Handwerker'

replaced_text = replace_word(input_text, input_word1, input_word2, input_replacement)
print('Ersetzte Zeichenkette:', replaced_text)

input_text2 = 'Er ist Tischler und sein Bruder ist Maurer'
replaced_text2 = replace_word(input_text2, input_word1, input_word2, input_replacement)
print('Ersetzte Zeichenkette:', replaced_text2)

input_text3 = 'Sie arbeiten als Architekten'
replaced_text3 = replace_word(input_text3, input_word1, input_word2, input_replacement)
print('Ersetzte Zeichenkette:', replaced_text3)

input_text4 = 'Er ist Tischler und seine Tante ist auch Tischlerin'
replaced_text4 = replace_word(input_text4, input_word1, input_word2, input_replacement)
print('Ersetzte Zeichenkette:', replaced_text4)

Ersetzte Zeichenkette: Hallo, ich bin Handwerker
Ersetzte Zeichenkette: Er ist Handwerker und sein Bruder ist Handwerker
Ersetzte Zeichenkette: Sie arbeiten als Architekten
Ersetzte Zeichenkette: Er ist Handwerker und seine Tante ist auch Tischlerin


Dies waren nur einfache Beispiele, um den Einstieg in regular Expressions in Python zu erleichtern. Es gibt viele weitere Funktionen und Methoden in der "re"-Bibliothek, mit denen man komplexe Muster definieren und Text manipulieren kann.