# Übung: Reguläre Ausdrücke (Musterlösung)

**Aufgabe:** Extrahiere die Datumsangaben mit Hilfe von regulären Ausdrücken.

**Tipp:** Du darfst hierzu mehrere reguläre Ausdrücke verwenden, also beispielsweise:

```python
import re

re1 = re.compile("") # Regulärer Ausdruck für 01.05.2018 (Tag, Monat, Jahr)
re2 = re.compile("") # Regulärer Ausdruck für 2018/14/05 (Jahr / Tag / Monat)
re3 = re.compile("") # Regulärer Ausdruck für 05/2018 (Monat / Jahr)

```

Gehe also alle `sentences` durch, und extrahiere die Datumsangabe aus dem String. Du brauchst die Datumswerte nicht umzuwandeln.

In [11]:
import re

p = re.compile("a[0-9]{2}a")

print(p.search("Hallo a123a a12a"))

<_sre.SRE_Match object; span=(12, 16), match='a12a'>


In [9]:
import re

sentences = [
    "Am 05.06.2018 findet ein cooles Event statt",
    "Please follow our invitation and visit us on 2018/14/05",
    "Im Monat 05/2018 ist oft gutes Wetter",
    "Der Lottogewinn war 10.000.000€ groß. Er wurde am 04.06.2018 ausgeschüttet",
    "Im Monat 01/2018 war in Sofia heftiger Smog",
    "Dein Flug in den Urlaub geht am 06.07.2018",
]

re1 = re.compile("[0-9]{2}\.[0-9]{2}\.[0-9]{4}")
re2 = re.compile("[0-9]{4}/[0-9]{2}/[0-9]{2}")
re3 = re.compile("[0-9]{2}/[0-9]{4}")

for sentence in sentences:
    
    match1 = re1.search(sentence)
    match2 = re2.search(sentence)
    match3 = re3.search(sentence)
    
    if match1: 
        print(match1[0])
    elif match2: 
        print(match2[0])
    elif match3: 
        print(match3[0])
    


05.06.2018
2018/14/05
05/2018
04.06.2018
01/2018
06.07.2018


**Gewünschte Ausgabe:**

```
05.06.2018
2018/14/05
05/2018
04.06.2018
01/2018
06.07.2018
```

**Bonusaufgabe:** Wandel zudem auch alle Datumsangaben in ein einheitliches Format um. Wenn nur ein Monat angegeben ist, setze den Tag auf den Monatsersten. 

**Bonusaufgabe - Schwere Lösung:** Schau dir dazu auf jeden Fall das Datetime-Modul an (`from datetime import datetime`), und dazu die `strptime` - Funktion. Damit kannst du einen Datumswert nach Python einlesen (https://docs.python.org/3/library/datetime.html). Hierzu solltest du dir dann auch die `strftime` - Funktion anschauen. 

Idee wäre hier also: Du liest das Datum über `strptime` ein, dann hast du ein Python-Datums-Objekt, und dieses wandelst du dann über `strftime` wieder zurück in das deutsche Datumsformat um. Vorteil davon ist, dass du Python-Datums-Objekte gut weiterverarbeiten kannst - Nachteil, dass diese Lösung etwas aufwendiger ist.

**Bonusaufgabe - Einfachere Lösung:** Alternativ kannst du auchb einfach nur mit einem `"2018/14/05".split("/")`, etc. arbeiten, die Liste dann verändern, und zum Beispiel mit einem `".".join(liste)` wieder zusammenführen - das geht auch. 

**Bonusaufgabe - gewünschte Ausgabe:**

```
05.06.2018
14.05.2018
01.05.2017
04.06.2018
01.01.2018
06.07.2018
```

In [16]:
from datetime import datetime

re1 = re.compile("[0-9]{2}\.[0-9]{2}\.[0-9]{4}")
re2 = re.compile("[0-9]{4}/[0-9]{2}/[0-9]{2}")
re3 = re.compile("[0-9]{2}/[0-9]{4}")

dates = []
for sentence in sentences:
    
    match1 = re1.search(sentence)
    match2 = re2.search(sentence)
    match3 = re3.search(sentence)
    
    if match1: 
        dates.append(datetime.strptime(match1[0], "%d.%m.%Y"))
    elif match2: 
        dates.append(datetime.strptime(match2[0], "%Y/%d/%m"))
    elif match3: 
        dates.append(datetime.strptime(match3[0], "%m/%Y"))
        
for d in dates:
    print(d.strftime("%d.%m.%Y"))

05.06.2018
14.05.2018
01.05.2018
04.06.2018
01.01.2018
06.07.2018
