# 10.4 Weitere Suchfunktionen; Zugriff auf Treffer

## Funktion `search` - Finden der ersten Übereinstimmung irgendwo in einer Zeichenfolge

<font size="3.5">

**`re.search(pattern, string, flags=0) --> re.Match obj | None`**
* **`search`** sucht in einer Zeichenkette nach dem **ersten** Vorkommen einer Teilzeichenkette, die mit einem regulären Ausdruck übereinstimmt, und gibt ein **Match-Objekt** zurück, falls die übereinstimmende Teilzeichenkette enthalten ist, andernfalls **None**.
* Die **`group`**-Methode des Match-Objekts gibt die Teilzeichenkette zurück.

</font>

In [None]:
import re


In [None]:
result = re.search('Python', 'Python is fun')


In [None]:
result.group() if result else 'not found'


<br>

<font size="3.5">

`search` gibt `None` zurück, wenn die Zeichenkette das Muster _nicht_ enthält.

</font>

In [None]:
result2 = re.search('fun!', 'Python is fun')


In [None]:
result2.group() if result2 else 'not found'


### Ignorieren der Gross-/Kleinschreibung mit dem optionalen `flags`-Schlüsselwortargument

<font size="3.5">

**`re.search(pattern, string, flags=0) --> re.Match obj | None`**
* Viele `re` Modulfunktionen erhalten ein optionales `flags`-Schlüsselwortargument.
* Mit `flags` kann spezifiziert werden, wie reguläre Ausdrücke abgeglichen werden sollen.


</font>

In [None]:
result3 = re.search('Sam', 'SAM WHITE', flags=re.IGNORECASE)


In [None]:
result3.group() if result3 else 'not found'



<font size="3.5">

`flags=re.I` ist die Kurzschreibweise für `flags=re.IGNORECASE`

</font>

In [None]:
result4 = re.search('Anna', 'ANNAN WHITE', flags=re.I)
result4.group()


### Metazeichen, die Übereinstimmungen auf den Anfang oder das Ende einer Zeichenfolge beschränken

<font size="3.5">

**`^` Metazeichen** am Anfang eines regulären Ausdrucks (und nicht innerhalb eckiger Klammern) ist ein **Anker**. Das bewirkt, dass der reguläre Ausdruck nur mit dem _Anfang_ einer Zeichenkette verglichen wird. 

</font>

In [None]:
result = re.search('^Python', 'Python is fun')


In [None]:
result.group() if result else 'not found'


In [None]:
result = re.search('^fun', 'Python is fun')


In [None]:
result.group() if result else 'not found'


<br>

<font size="3.5">

Das **`$` Metazeichen** am Ende eines regulären Ausdrucks ist ein **Anker**, der anzeigt, dass der reguläre Ausdruck nur mit dem _Ende_ einer Zeichenkette verglichen wird.

</font>

In [None]:
result = re.search('Python$', 'Python is fun')


In [None]:
result.group() if result else 'not found'


In [None]:
result = re.search('fun$', 'Python is fun')


In [None]:
result.group() if result else 'not found'


## Funktion `findall` und `finditer` - Alle Übereinstimmungen in einer Zeichenfolge finden

<font size="3.5">

**`findall(pattern, string, flags=0) --> list`**
* **`findall`** findet **jede** passende Teilzeichenkette in einer Zeichenkette;
* Gibt eine Liste der übereinstimmenden Teilzeichenketten zurück.

</font>

In [None]:
contact = 'Wally White, Home: 555-555-1234, Work: 555-555-4321'


In [None]:
re.findall(r'\d{3}-\d{3}-\d{4}', contact)


<br>

<font size="3.5">

**`finditer(pattern, string, flags=0) --> iterator`**
* **`finditer`** funktioniert wie `findall`, gibt aber ein **Iterator** von Match-Objekten zurück

</font>

In [None]:
iterator = re.finditer(r'\d{3}-\d{3}-\d{4}', contact)


In [None]:
iterator


In [None]:
for phone in iterator:
    print(phone.group())


## Erfassen von Substrings in einer Übereinstimmung

<font size="3.5">

Verwenden Sie **Klammer-Metazeichen**`(` und`)`, um Teilzeichenketten in einer Übereinstimmung zu erfassen.

</font>

In [None]:
text = 'Charlie Peterson, e-mail: charlie@peterson.com'


In [None]:
pattern = r'([A-Z][a-z]+ [A-Z][a-z]+), e-mail: (\w+@\w+\.\w{2,3})'


In [None]:
result = re.search(pattern, text)
print(result)


<font size="3.5">

* Der reguläre Ausdruck gibt zwei zu erfassende Teilzeichenketten an, die jeweils durch die Metazeichen `(` und `)` gekennzeichnet sind.
* `(` und `)` haben _keinen_ Einfluss darauf, ob das `Muster` in der Zeichenkette `text` gefunden wird.
* Die Funktion `Match` gibt ein Match-Objekt _nur_ dann zurück, wenn das _ganze_ `Muster` in der Zeichenkette `text` gefunden wird.
Die Methode  **`groups`** des Match-Objekts gibt ein **Tupel** der erfassten Teilzeichenketten zurück.

</font>

In [None]:
result.groups()


<font size="3.5">

* Die **"group"**-Methode des `match"-Objekts gibt die _gesamte_ Übereinstimmung als eine einzige Zeichenkette zurück

</font>

In [None]:
result.group()



<font size="3.5">

* Greifen Sie auf jede erfasste Teilzeichenkette zu, indem Sie eine ganze Zahl an die `Gruppe`-Methode übergeben

</font>

In [None]:
result.group(1)


In [None]:
result.group(2)
