# Einführung in das Programmieren mit Python

## Wiederholung: [Reguläre Ausdrücke](08_re.slides.html)

* Minisprache zur Beschreibung von Klassen von Strings
* Suchen, Ersetzen, Informationen extrahieren
* Ein **Pattern** **matcht** auf einen String, bzw. auf Teilstrings
* Entwickeln z.B. mit [pythex.org](http://pythex.org)

In [23]:
import re
re.findall("[0-9]+", "Jeden Mittwoch von 10 bis 12 lernen wir Python.")

['10', '12']

<h3>Special characters</h3>
<table>
    <tbody><tr>
            <td class="key_td"><code>\</code></td>
            <td>escape special characters</td>
        </tr>
        <tr>
            <td class="key_td"><code>.</code></td>
            <td>matches any character</td>
        </tr>
        <tr>
            <td class="key_td"><code>^</code></td>
            <td>matches beginning of string</td>
        </tr>
        <tr>
            <td class="key_td"><code>$</code></td>
            <td>matches end of string</td>
        </tr>
        <tr>
            <td class="key_td"><code>[5b-d]</code></td>
            <td>matches any chars '5', 'b', 'c' or 'd'</td>
        </tr>
        <tr>
            <td class="key_td"><code>[^a-c6]</code></td>
            <td>matches any char except 'a', 'b', 'c' or '6'</td>
        </tr>
        <tr>
            <td class="key_td"><code>R|S</code></td>
            <td>matches either regex <code>R</code> or regex <code>S</code></td>
        </tr>
        <tr>
            <td class="key_td"><code>()</code></td>
            <td>creates a capture group and indicates precedence</td>
        </tr>
    </tbody>
</table>
<h3>Quantifiers</h3>
<table>
    <tbody><tr>
            <td class="key_td"><code>*</code></td>
            <td>0 or more (append <code>?</code> for non-greedy)</td>
        </tr>
        <tr>
            <td class="key_td"><code>+</code></td>
            <td>1 or more (append <code>?</code> for non-greedy)</td>
        </tr>
        <tr>
            <td class="key_td"><code>?</code></td>
            <td>0 or 1 (append <code>?</code> for non-greedy)</td>
        </tr>
        <tr>
            <td class="key_td"><code>{m}</code></td>
            <td>exactly <code>m</code> occurrences</td>
        </tr>
        <tr>
            <td class="key_td"><code>{m, n}</code></td>
            <td>from <code>m</code> to <code>n</code>. <code>m</code> defaults to 0, <code>n</code> to infinity</td>
        </tr>
        <tr>
            <td class="key_td"><code>{m, n}?</code></td>
            <td>from <code>m</code> to <code>n</code>, as few as possible</td>
        </tr>
    </tbody>
</table>


<h3>Special sequences</h3>
<table>
    <tbody><tr>
            <td class="key_td"><code>\A</code></td>
            <td>start of string</td>
        </tr>
        <tr>
            <td class="key_td"><code>\b</code></td>
            <td>matches empty string at word boundary (between <code>\w</code> and <code>\W</code>)</td>
        </tr>
        <tr>
            <td class="key_td"><code>\B</code></td>
            <td>matches empty string not at word boundary</td>
        </tr>
        <tr>
            <td class="key_td"><code>\d</code></td>
            <td>digit</td>
        </tr>
        <tr>
            <td class="key_td"><code>\D</code></td>
            <td>non-digit</td>
        </tr>
        <tr>
            <td class="key_td"><code>\s</code></td>
            <td>whitespace: <code>[ \t\n\r\f\v]</code></td>
        </tr>
        <tr>
            <td class="key_td"><code>\S</code></td>
            <td>non-whitespace</td>
        </tr>
        <tr>
            <td class="key_td"><code>\w</code></td>
            <td>alphanumeric: <code>[0-9a-zA-Z_]</code></td>
        </tr>
        <tr>
            <td class="key_td"><code>\W</code></td>
            <td>non-alphanumeric</td>
        </tr>
        <tr>
            <td class="key_td"><code>\Z</code></td>
            <td>end of string</td>
        </tr>
        <tr>
            <td class="key_td">`\1`, `\2`, ...</td>
            <td>matches a previously defined group</td>
        </tr>
    </tbody>
</table>
<h3>Für Fortgeschrittene: Spezielle Sequenzen, siehe Doku</h3>
<table>
    <tbody><tr>
            <td class="key_td"><code>(?iLmsux)</code></td>
            <td>matches empty string, sets re.X flags</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?:...)</code></td>
            <td>non-capturing version of regular parentheses</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?P<name>...)</name></code></td>
            <td>matches whatever matched previously named group</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?P=<name>)</name></code></td>
            <td>digit</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?#...)</code></td>
            <td>a comment; ignored</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?=...)</code></td>
            <td>lookahead assertion: matches without consuming</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?!...)</code></td>
            <td>negative lookahead assertion</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?&lt;=...)</code></td>
            <td>lookbehind assertion: matches if preceded</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?&lt;!...)</code></td>
            <td>negative lookbehind assertion</td>
        </tr>
        <tr>
            <td class="key_td"><code>(?(id)yes|no)</code></td>
            <td>match 'yes' if group 'id' matched, else 'no'</td></tr></tbody>
</table>


### Reguläre Ausdrücke anwenden (2)

![Übersicht über das re-Modul](images/re-uebersicht.svg)

## Einführung in das Programmieren mit Python
# Objektorientiertes Programmieren in Python

### Objektorientierte Programmierung – Idee und Konzept

* zusammengehörige Daten werden in einen gemeinsamen Container zusammengefasst
* Operationen auf diesen Daten kommen ebenfalls in diesen Container
* Ergebnis: **Objekt**, das seine internen Daten kapselt und Operationen anbietet

In [27]:
"Hallo".lower()

'hallo'

### Begriffe

* **Objekt** oder **Instanz**  (z.B. `"Hallo"`)
   * in Python ist _alles_ ein Objekt
* **Attribute** oder **Eigenschaften** (oder **Felder**)
   * Zugriff per `objekt.feld`
   * les- und ggf. schreibbar
* **Methoden**
   * Funktionen, die teil eines Objekts sind und mit dem Objekt arbeiten

In [2]:
f = open("roman.txt")
print(f.encoding)
print(f.read())

UTF-8
Kurzer Roman.
Dies ist ein langer Roman. Er beginnt mit dem Auftritt des Heldens. 
Da es keine Helden gibt, unterbricht hier schon der Leser …



### Klassen

* Der _Datentyp_ eines Objekts ist seine **Klasse**
* Klasse = »Bauplan« für die Objekte, definiert die Methoden (und Eigenschaften)

In [4]:
print(type("Hallo"))

<class 'str'>


In [6]:
class Person:
    """
    Eine Person.
    """
    
    def __init__(self, name, email):
        """
        Erzeugt eine neue Person.
        """
        self.name = name
        self.email = email
        
    def formattedOutput(self):
        """
        Liefert einen String zurück, der diese Person beschreibt.
        """
        return self.name + ' <' + self.email + '>'
    
    def describe(self):
        """
        Beschreibt diese Person.
        """
        print(self.formattedOutput())
        
max = Person("Max Müller", "max.mueller@example.com")
max.describe()

Max Müller <max.mueller@example.com>


In [7]:
print(max.name)

Max Müller


In [8]:
print(type(max))

<class '__main__.Person'>


### Klassen im Detail
Eine _Klassendefinition_ erzeugt eine Klasse und weist sie einem Klassennamen zu:
```
class Person:
```
Dabei entsteht ein Block (durch Einrückung). In diesem Block stehen Eigenschaften (der Klasse! z.B. Docstring) und Methoden.

* Per Konvention beginnen Klassennamen mit einem Großbuchstaben (Ausnahme: Altlasten wie list)
* Eine Klasse kann als Funktion aufgerufen werden:
```
max = Person("Max Müller", "max.mueller@example.com")
```
* Dadurch wird ein _Objekt_ dieser Klasse erzeugt, so wie z.B. `list(1, 2, 3)` ein Objekt der Klasse `list` erzeugt
* `Person(...)` = __Konstruktoraufruf__
* die Argumente werden an die spezielle Methode `__init__` übergeben

### Methoden

* Eine Funktion, die in einer Klassendefinition erzeugt wird, heißt _Methode_.
* Methoden bekommen ein erstes Argument, das immer `self` heißen sollte
* darin wird der Methode das Objekt (= die Instanz) übergeben

In [35]:
class Beispiel:
    def whatami(self):
        print(type(self))
bsp = Beispiel()
bsp.whatami()

<class '__main__.Beispiel'>


### Initialisierung
* Es gibt Methoden mit Spezialbedeutung: Namenskonvention `__irgendwas__`
* Beispiel Initialisierung: `__init__`
* Wenn `__init__` definiert es, wird es unmittelbar nach der Instantiierung (= Objekterzeugung) mit den Argumenten des Konstruktoraufrufs aufgerufen.

```
max = Person("Max", "max@example.com")
```
1. Objekt der Klasse `Person` wird erzeugt
2. (implizit) Aufruf der Methode `__init__` der Objektklasse mit den Argumenten `self` (das Objekt), `"Max"` und `"max@example.com"`
3. das erzeugte und initialisierte Objekt wird der Variablen `max` zugewiesen

### Attribute

* __Attribute__ sind Eigenschaften eines Objekts
* Wie Variablen, aber an eine Objektinstanz gekoppelt (in jedem Objekt anders)
* Zugriff mit `objekt.attribut`, z.B. `max.name`
* Üblicherweise Initialisierung in der `__init__`-Methode

```
    def __init__(self, name, email):
        self.name = name
        self.email = email
```

### Unsere Personklasse (wdh)

In [6]:
class Person:
    """
    Eine Person.
    """
    
    def __init__(self, name, email):
        """
        Erzeugt eine neue Person.
        """
        self.name = name
        self.email = email
        
    def formattedOutput(self):
        """
        Liefert einen String zurück, der diese Person beschreibt.
        """
        return self.name + ' <' + self.email + '>'
    
    def describe(self):
        """
        Beschreibt diese Person.
        """
        print(self.formattedOutput())
        
max = Person("Max Müller", "max.mueller@example.com")
max.describe()

Max Müller <max.mueller@example.com>


In [1]:
class Person:
    def __init__(self, name, email):
        self.name = name
        self.email = email        
    def formattedOutput(self):
        return self.name + ' <' + self.email + '>'
    def describe(self):
        print(self.formattedOutput())
        
max = Person("Max Müller", "max.mueller@example.com")
max.describe()

Max Müller <max.mueller@example.com>


<h3 style="color:green">Aufgaben</h3>
1. Definieren Sie eine Klasse mit dem Namen `Text`, der beim Aufruf ein String übergeben wird, z.B.:<br/>
`t = Text("Dies ist ein kleiner Text. Nicht der Rede wert. Aber immerhin.")`
2. Definieren Sie eine Methode der Klasse, die die Länge des Textes zurückgibt.
3. Definieren Sie eine weitere Methode, die die Wörter in Form einer Liste zurückgibt.

In [2]:
class Text:
    def __init__(self, text):
        self.text = text
    def length(self):
        return len(self.text)
    def words(self):
        return self.text.split()
t = Text("Dies ist ein kleiner Text. Nicht der Rede wert. Aber immerhin.")
print("Länge:", t.length())
print("Wörter:", t.words())

Länge: 62
Wörter: ['Dies', 'ist', 'ein', 'kleiner', 'Text.', 'Nicht', 'der', 'Rede', 'wert.', 'Aber', 'immerhin.']


<h3 style='color: green'>Hausaufgabe</h3>

1. Definieren Sie eine Klasse `Obst`. Instanzen dieser Klasse sollen für jede Obstsorte den Namen speichern können sowie in welchen Monaten das Obst in unseren Breiten geerntet werden kann.
2. Fügen Sie der Klasse eine Methode `verfuegbar(monat)` hinzu, die als Argument ein Monatskürzel nimmt und zurückgibt, ob die Obstsorte in diesem Monat regional verfügbar ist.
3. Erzeugen Sie anhand der folgenden Tabelle ([Quelle: regional-saisonal](http://www.regional-saisonal.de/saisonkalender-obst)) Obst-Instanzen und fragen Sie sie beispielhaft, ob die Sorten im Juni und im August verfügbar sind.
<table border="1">
	<tr>
		<th class="td_zutat" width="38%">Zutat (Obst)</th>
		<th width="6%"><abbr title="Januar">Jan</abbr></th>
		<th width="6%"><abbr title="Februar">Feb</abbr></th>
		<th width="6%"><abbr title="März">Mär</abbr></th>
		<th width="6%"><abbr title="April">Apr</abbr></th>
		<th width="6%"><abbr title="Mai">Mai</abbr></th>
		<th width="6%"><abbr title="Juni">Jun</abbr></th>
		<th width="6%"><abbr title="Juli">Jul</abbr></th>
		<th width="6%"><abbr title="August">Aug</abbr></th>
		<th width="6%"><abbr title="September">Sep</abbr></th>
		<th width="6%"><abbr title="Oktober">Okt</abbr></th>
		<th width="6%"><abbr title="November">Nov</abbr></th>
		<th width="6%"><abbr title="Dezember">Dez</abbr></th>
	</tr>							
	<tr>
		<td class="td_zutat">Aprikosen</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>								
		<td>ja</td>
		<td>ja</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
	</tr>	
	<tr>
		<td class="td_zutat"><a href="http://www.regional-saisonal.de/rezept-zutaten/brombeeren" title="zu den Rezepten mit Brombeeren">Brombeeren</a></td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>ja</td>							
		<td>ja</td>
		<td>ja</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
	</tr>	
	<tr>
		<td class="td_zutat"><a href="http://www.regional-saisonal.de/rezept-zutaten/erdbeeren" title="zu den Rezepten mit Erdbeeren">Erdbeeren</a></td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>ja</td>													
		<td>ja</td>
		<td>ja</td>
		<td>nein</td>	
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
		<td>nein</td>
	</tr>
</table>						

![Vererbung](images/inheritance.png)

### Vererbung

In [16]:
# zur Erinnerung nochmal die Klasse 'Person':
class Person:
    """
    Eine Person.
    """
    
    def __init__(self, name, email):
        """
        Erzeugt eine neue Person.
        """
        self.name = name
        self.email = email
        
    def formattedOutput(self):
        """
        Liefert einen String zurück, der diese Person beschreibt.
        """
        return self.name + ' <' + self.email + '>'
    
    def describe(self):
        """
        Beschreibt diese Person.
        """
        print(self.formattedOutput())
        
max = Person("Max Müller", "max.mueller@example.com")
max.describe()

Max Müller <max.mueller@example.com>


### Vererbung

Eine Klasse kann eine _Superklasse_ (_Oberklasse_) haben, deren Eigenschaften sie erbt.

In [38]:
class Student(Person):    # in Klammern: Superklasse
    
    def __init__(self, name, email, matrikel):
        super().__init__(name, email)  # super() -> Oberklasse
        self.matrikel = matrikel
        
    def formattedOutput(self):
        return self.name + ' <' + self.email + '> (' + str(self.matrikel) + ')'        

In [33]:
moritz = Student("Moritz Maier", "moritz.maier@example.com", 4711)
moritz.describe()

Moritz Maier <moritz.maier@example.com> (4711)


In [34]:
for p in max, moritz:
    print(p.name, isinstance(p, Person), isinstance(p, Student))

Max Müller True False
Moritz Maier True True


### Vererbung im Detail

Wird eine Klasse definiert, so kann sie mit einer Oberklasse verknüpft werden, deren Eigenschaften sie _erbt_:

```
class Student(Person):
```
definiert die Klasse Student, deren Oberklasse Person ist.

* Objekte des Typs `Student` sind _auch_ vom Typ `Person`
* Objekte vom Typ `Person` sind aber nicht notwendigerweise vom Typ `Student`
* Alle `Student`en haben die Eigenschaften von `Person`en, die `Student`-Klasse kann Attribute und Methoden jedoch überschreiben

### Methoden überschreiben
* Wird in der Subklasse eine Methode definiert, so wird diese statt die der Oberklasse verwendet
* in einer Methode kann mit `super()` auf die Oberklasse zugegriffen werden

In [17]:
class Student(Person):    # in Klammern: Superklasse
    
    def __init__(self, name, email, matrikel):
        super().__init__(name, email)  # super() -> Oberklasse
        self.matrikel = matrikel


hier wird `__init__` von Person überschrieben und aus der überschreibenden Methode  mithilfe von `super()` aufgerufen

### Polymorphie

* Ein Objekt einer Subklasse kann wie das der Superklasse verwendet werden, es werden jedoch ggf. die Methoden der Subklasse verwendet.
* Beispiel: `Student.formattedOutput` wird aus `Person.describe` aufgerufen ...

In [18]:
class Student(Person):    # in Klammern: Superklasse
    
    def __init__(self, name, email, matrikel):
        super().__init__(name, email)  # super() -> Oberklasse
        self.matrikel = matrikel
        
    def formattedOutput(self):
        return self.name + ' <' + self.email + '> (' + str(self.matrikel) + ')'        

In [19]:
moritz = Student("Moritz Maier", "moritz.maier@example.com", 4711)
moritz.describe()

Moritz Maier <moritz.maier@example.com> (4711)


<h3 style="color:green;">Aufgabe</h3>

* Erzeugen Sie eine Subklasse `MarkedUpText` zu Ihrer `Text`-Klasse von oben. 
* Die Subklasse soll Strings mit Tags wie in `"Dies ist ein <hi rend="bold">wichtiger</bold> Text"` im Konstruktor akzeptieren
* die übrigen Methoden sollen funktionieren wie bei `Text`, aber sich nur auf den reinen Textinhalt ohne Tags beziehen. 
* Definieren Sie außerdem eine Methode `raw_length()`, die die Länge in Zeichen _mit_ Markup liefert

In [20]:
class Student(Person):                 # in Klammern: Superklasse
    
    def __init__(self, name, email, matrikel):
        super().__init__(name, email)  # super() -> Oberklasse
        self.matrikel = matrikel
        
    def formattedOutput(self):
        return self.name + ' <' + self.email + '> (' + str(self.matrikel) + ')'        

In [None]:
import re

class MarkedUpText(Text):
    
    def __init__(self, markedup_text):
        self.raw_text = markedup_text
        plain_text = re.sub('<[^>]+>', '', markedup_text)
        super().__init__(plain_text)
    
    def raw_length(self):
        return len(self.raw_text)

In [None]:
m = MarkedUpText('Dies ist ein <hi rend="bold">wichtiger</bold> Text')
print(m.text, m.length(), m.words(), m.raw_length(), sep="; ")

<h3 style='color:green'>Hausaufgabe (2)</h3>

1. Manche Obstsorten sind lagerfähig. Erzeugen Sie eine Subklasse `Lagerobst` zu ihrer Obstklasse, die die Monate, in denen eine Obstsorte aus Lagerbeständen verfügbar ist, als zusätzliches Attribut pflegt. Erzeugen Sie Instanzen für Äpfel (Erntezeit August bis November, lagerfähig Dezember bis Mai) und Birnen (Ernte August bis Oktober, lagerfähig bis Dezember)
2. Überschreiben Sie die `verfuegbar`-Methode, sodass sie bei Lagerobst auch in den Lagermonaten `True` zurückgibt
3. Fügen Sie dem Lagerobst eine Methode hinzu, mit der zwischen frisch und gelagert verfügbarem Obst unterschieden werden kann. Welche Implementierungsmöglichkeiten sind möglich? Diskutieren Sie Vor- und Nachteile.