# Manipulation von Zeichenketten

pandas bietet die Möglichkeit, String- und reguläre Ausdrücke prägnant auf ganze Arrays von Daten anzuwenden.

## String-Objekt-Methoden

In vielen String-Munging- und Skripting-Anwendungen sind die eingebauten String-Methoden ausreichend. Zum Beispiel kann eine durch Komma getrennte Zeichenkette mit [split](https://docs.python.org/3/library/stdtypes.html#str.split) in Teile zerlegt werden:

In [1]:
str = """
      Jupyter tutorial, PyViz tutorial, Python basics,
      Jupyter tutorial, Python basics
      """

chunks = str.split(',')

print(chunks)

['\n      Jupyter tutorial', ' PyViz tutorial', ' Python basics', '\n      Jupyter tutorial', ' Python basics\n      ']


`split` wird oft mit [str.strip](https://docs.python.org/3/library/stdtypes.html#str.strip) kombiniert, um Leerzeichen un Zeilenumbrüche zu entfernen:

In [2]:
chunks = [x.strip() for x in str.split(',')]

chunks

['Jupyter tutorial',
 'PyViz tutorial',
 'Python basics',
 'Jupyter tutorial',
 'Python basics']

Eine schnelle Methode zur Übergabe einer Liste oder eines Tupels an eine Zeichenkette ist die [str.join](https://docs.python.org/3/library/stdtypes.html#str.join)-Methode:

In [3]:
';'.join(chunks)

'Jupyter tutorial;PyViz tutorial;Python basics;Jupyter tutorial;Python basics'

Mit der Verwendung des Python-Schlüsselworts `in` kann einfach überprüft werden, ob eine bestimmte Zeichenkette vorhanden ist:

In [4]:
'Python basics' in chunks

True

Mit [str.count](https://docs.python.org/3/library/stdtypes.html#str.count) lässt sich die Anzahl der Zeichenketten ermitteln:

In [5]:
str.count('Python basics')

2

Mit der [str.replace](https://docs.python.org/3/library/stdtypes.html#str.replace)-Methode lässt sich das Vorkommen eines Musters durch ein anderes ersetzen. Sie wird häufig auch zum Löschen von Mustern verwendet, indem eine leere Zeichenkette übergeben wird:

In [6]:
str.replace(', ', ';')

'\n      Jupyter tutorial;PyViz tutorial;Python basics,\n      Jupyter tutorial;Python basics\n      '

In [7]:
str.replace('\n', '')

'      Jupyter tutorial, PyViz tutorial, Python basics,      Jupyter tutorial, Python basics      '

In [8]:
import re

chunks = re.split(',+', str)

print(chunks)

['\n      Jupyter tutorial', ' PyViz tutorial', ' Python basics', '\n      Jupyter tutorial', ' Python basics\n      ']


In Python eingebaute String-Methoden:

Methode | Beschreibung
:------ | :-----------
`count` | gibt die Anzahl der sich nicht überschneidenden Vorkommen der Zeichenkette zurück.
`endswith` | gibt `True` zurück, wenn die Zeichenkette mit dem Suffix endet
`startswith` | gibt `True` zurück, wenn die Zeichenkette mit dem Präfix beginnt
`join` | verwendet die Zeichenkette als Begrenzer für die Verkettung einer Folge anderer Zeichenketten
`index` | gibt die Position des ersten Zeichens in der Zeichenkette zurück, wenn es in der Zeichenkette gefunden wurde; löst einen `ValueError` aus, wenn es nicht gefunden wurde
`find` | gibt die Position des ersten Zeichens des ersten Vorkommens der Teilzeichenkette in der Zeichenkette zurück; wie `index`, gibt aber `-1` zurück, wenn nichts gefunden wurde
`rfind` | Rückgabe der Position des ersten Zeichens des letzten Vorkommens der Teilzeichenkette in der Zeichenkette; gibt `-1` zurück, wenn nichts gefunden wurde
`replace` | ersetzt Vorkommen einer Zeichenkette durch eine andere Zeichenkette
`strip`, `rstrip`, `lstrip` | schneiden Leerzeichen ab, einschließlich Zeilenumbrüchen
`split ` |zerlegt eine Zeichenkette in eine Liste von Teilzeichenketten unter Verwendung des übergebenen Trennzeichens
`lower` | konvertiert alphabetische Zeichen in Kleinbuchstaben
`upper` | konvertiert alphabetische Zeichen in Großbuchstaben
`casefold` | konvertiert Zeichen in Kleinbuchstaben und konvertiert alle regionsspezifischen variablen Zeichenkombinationen in eine gemeinsame vergleichbare Form
`ljust`, `rjust` | linksbündig bzw. rechtsbündig; füllt die gegenüberliegende Seite der Zeichenkette mit Leerzeichen (oder einem anderen Füllzeichen) auf, um eine Zeichenkette mit einer Mindestbreite zu erhalten