# 10.2 re Modul- und die Funktion `fullmatch`

<font size="3.5">

**`re.fullmatch(pattern, string, flags=0) --> re.Match obj | None`** 
* Prüft, ob die **ganze** Zeichenkette `string` mit dem **Pattern** (regulärer Ausdruck) übereinstimmt;
* Gibt entweder ein `re.Match object`, das den übereinstimmenden Text enthält, oder `None` zurück;
* Das optionale flags-Schlüsselwortargument kann verwendet werden, um die Suche näher zu spezifizieren. Zum Beispiel `flags=re.I` ignoriert die Gross-/Kleinschreibung.


* Ein regulärer Ausdruck kann aus Folgendem bestehen:
    * normalen Zeichenketten (Literalen);
    * Metazeichen;
    * Vordefinierten Zeichenklassen;
    * Benutzerdefinierten Zeichenklassen, und
    * Quantifizierer.

</font>

In [2]:
import re


## Vergleichen von Literalen

In [None]:
pattern = '02215'


In [None]:
print(re.fullmatch(pattern, '02215'))


In [None]:
print(re.fullmatch(pattern, '022156'))


In [None]:
'Match' if re.fullmatch(pattern, '02215') else 'No match'


In [None]:
'Match' if re.fullmatch(pattern, '51220') else 'No match'


In [None]:
'Match' if re.fullmatch(pattern, '022150') else 'No match'


## Metazeichen, Zeichenklassen und Quantifizierer

### Metazeichen


<font size="3.5">

| Metazeichen für reguläre Ausdrücke
| --------
| `[]  `  `{}  `  `()  `  `\  `  `*  `  `+  `  `^  `  `$  `  `?  `  `.  `  `\|`

</font>


<font size="3.5">

* **`[]` Metazeichen** werden für benuzterdefinierte Zeichenklassen verwendet, die ein einzelnes Zeichen aus einer Menge von Möglichkeiten representieren;
* **`{}` Metazeichen** werden für **Quantifizierer** verwendet;
* **`()` Metazeichen** werden für Gruppierung verwendet;
* Das **`\` Metazeichen** wird als Escape-Zeichen verwendet. Es beginnt z.B. jede vordefinierte **Zeichenklasse**. Oder es stellt sicher, dass ein Metazeichen innerhalb eines Patterns als **literaler Wert** interpretiert wird, wie z.B. Backslash (`\\`), oder Dollar Zeichen (`\$`).
* Das **`*` Metazeichen** steht für 0..n Vorkommen eines Zeichens;
* Das **`+` Metazeichen** steht für 1..n Vorkommen eines Zeichens;
* Das **`^` Metazeichen** ist kontextbezogen. Es bedeutet entweder ein Anfang-String-Anker, oder `not`, wenn es innerhalb einer benutzerdefinierten Zeichnenklasse verwendet wird;
* Das **`$` Metazeichen** ist ein Ende-String-Anker;
* Das **`?` Metazeichen** steht für 0, oder 1 Vorkommen eines Zeichens;
* Das **`.` Metazeichen** steht für genau 1 Vorkommen eines Zeichens;
* Das **`|` Metazeichen** wird für entweder/oder Patterns verwendet.

</font>

### Vordefinierte Zeichenklassen

<font size="3.5">

Eine Zeichenklasse ist eine regulärer Ausdruck, der mit **genau einem** definierten Zeichen übereinstimmt. Zum Beispiel ist **`\d`** eine Zeichenklasse, die eine Ziffer (0-9) darstellt. 

</font>

<font size="3.5">


| Zeichenklasse	| Übereinstimmung
| ------------	| ------------
| `\d`	| Beliebige Ziffer (0-9).
| `\D`	| Jedes Zeichen, das _nicht_ eine Ziffer ist.
| `\s`	| Jedes beliebige Whitespace-Zeichen (wie z.B. Leerzeichen, Tabulatoren und Zeilenumbrüche).
| `\S`	| Jedes Zeichen, das _nicht_ ein Whitespace-Zeichen ist.
| `\w`	| Jedes **Wortzeichen** (auch als **alphanumerisches Zeichen** bezeichnet), d.h. jeder Gross- oder Kleinbuchstabe, jede Ziffer oder ein Unterstrich
| `\W`	| Jedes Zeichen, das _nicht_ ein Wortzeichen ist.

</font>

### Quantifizierer

<font size="3.5">

* Quantifizierer beziehen sich immer auf das vorangehende Zeichen (oder Zeichenklasse).
* Neben den oben genannten Metazeichen `*`, `+`, `?` und `.` gibt es noch folgende Variante:
    * `{n}` - genau n aufeinanderfolgende Zeichen;
    * `{n, }` - mindestens n Vorkommen eines Zeichens
    * `{n, m}` - mindestens n, max. m folgende Zeichen

    </font>

In [None]:
'Valid' if re.fullmatch(r'\d{5}', '02215') else 'Invalid'


In [None]:
'Valid' if re.fullmatch(r'\d{5}', '9876') else 'Invalid'


### Benutzerdefinierte Zeichenklassen  `[]`

<font size="3.5">

* Eckige Klammern, `[]`, definieren eine **benutzerdefinierte Zeichenklasse**, die einem **einzelnen** Zeichen entspricht
* `[aeiou]` entspricht einem Kleinbuchstaben-Vokal
* `[A-Z]` entspricht einem Grossbuchstaben
* `[a-z]` entspricht einem Kleinbuchstaben 
* `[a-zA-Z]` passt zu jedem Klein- oder Großbuchstaben

</font>

In [None]:
'Match' if re.fullmatch('[*+$]', '*') else 'No match'


In [None]:
'Match' if re.fullmatch('[*+$]', '!') else 'No match'


### Der `*` Quantifizierer

<font size="3.5">

Der `*` Quantifizierer steht für null oder mehrere Vorkommen eines Zeichens überein.

</font>

In [None]:
'Valid' if re.fullmatch('[A-Z][a-z]*', 'Wally') else 'Invalid'


In [None]:
'Valid' if re.fullmatch('[A-Z][a-z]*', 'eva') else 'Invalid'


### Das `^` Metazeichen innerhalb einer benutzerdefinierten Zeichenklasse

<font size="3.5">

Innerhalb einer benutzerdefinierten Zeichenklasse angewendet, hat das `^` Zeichen die Bedeutung einer Negation (`not`).

</font>

In [None]:
'Match' if re.fullmatch('[^a-z]', 'A') else 'No match'


In [None]:
'Match' if re.fullmatch('[^a-z]', 'a') else 'No match'


### Der `+` Quantifizierer

<font size="3.5">

Der `+` Quantifizierer stimmt mit **einem oder mehreren** Vorkommen eines Zeichens überein.

</font>

In [None]:
'Valid' if re.fullmatch('[A-Z][a-z]+', 'Wally') else 'Invalid'


In [None]:
'Valid' if re.fullmatch('[A-Z][a-z]+', 'E') else 'Invalid'


### Der `?` Quantifizierer

<font size="3.5">

Der `?` Quantifizierer stimmt mit **null oder einem Vorkommen** eines Zeichens überein.

</font>

In [None]:
'Match' if re.fullmatch('labell?ed', 'labeled') else 'No match'


In [None]:
'Match' if re.fullmatch('labell?ed', 'labelled') else 'No match'


In [None]:
'Match' if re.fullmatch('labell?ed', 'labellled') else 'No match'



<font size="3.5">

* `labell?ed` stimmt mit `labelled` (der englischen Rechtschreibung) und `labeled` (der englischen Rechtschreibung der USA) überein, aber nicht mit dem falsch geschriebenen Wort `labellled`.
* `l?` zeigt an, dass entweder **kein oder ein einziges l** vorkommen darf.

</font>

### Genua n Vorkommen eines Zeichens `{n}`

<font size="3.5">

Sie können **genua _n_ Vorkommen** eines Teilausdrucks mit dem **`{n}` Quantifizierer** überprüfen.

</font>

In [3]:
'Match' if re.fullmatch(r'\d{5}', '12345') else 'No match'


'Match'

In [4]:
'Match' if re.fullmatch(r'\d{5}', '1234') else 'No match'


'No match'

In [5]:
'Match' if re.fullmatch(r'\d{5}', '123456') else 'No match'


'No match'

### Mindestens n Vorkommen eines Zeichens `{n, }`

<font size="3.5">

Sie können **mindestens _n_ Vorkommen** eines Teilausdrucks mit dem **`{n,}` Quantifizierer** überprüfen.

</font>

In [None]:
'Match' if re.fullmatch(r'\d{3,}', '123') else 'No match'


In [None]:
'Match' if re.fullmatch(r'\d{3,}', '1234567890') else 'No match'


In [None]:
'Match' if re.fullmatch(r'\d{3,}', '12') else 'No match'


### Mindestens n, max. m Vorkommen eines Zeichens `{n, m}`

<font size="3.5">

Sie können **zwischen _n_ und _m_ (inklusive) Vorkommen** eines Teilausdrucks mit dem **`{n,m}` Quantifizierer** überprüfen.

</font>

In [None]:
'Match' if re.fullmatch(r'\d{3,6}', '123') else 'No match'


In [None]:
'Match' if re.fullmatch(r'\d{3,6}', '123456') else 'No match'


In [None]:
'Match' if re.fullmatch(r'\d{3,6}', '1234567') else 'No match'


In [None]:
'Match' if re.fullmatch(r'\d{3,6}', '12') else 'No match'
