# 5.2 Zeichenketten
Eine uns bekannte Art von Sequenz die für die Verarbeitung von Text entworfen wurde sind Zeichenketten ([_str_](https://docs.python.org/3/library/stdtypes.html#textseq)). Zeichenketten erlauben bereits den Zugriff auf einzelne Elemente durch einen Index.

Operationen:
+ `[]` _Index_-Operator ( oder _Subscript_-Operator )
+ `len()` - Funktion, zur Bestimmung der Anzahl Elemente

### Erstellen einer Zeichenkette

In [1]:
s = "Ich sehe einen Hund graben, dass muss doch einen Grund haben."

In [2]:
s

'Ich sehe einen Hund graben, dass muss doch einen Grund haben.'

In [3]:
print(s)

Ich sehe einen Hund graben, dass muss doch einen Grund haben.


### Bestimmen der Länge einer Liste 

In [8]:
len(s)

61

### Zugriff auf Elemente einer Sequenz mittels Index
Zugriff mittels dem **Subscript operator** (auch **Index-Operator** genannt).<br>
Ein Subscript Operator besteht aus dem Namen der Liste, gefolgt von dem in `[]` eingeschlossenen **Index** des Elements.
> Achtung! Sequenzen beginnen mit `0` als Index auf das _erste_ Element.

![Diagram of a list named c labeled with its element names](ch05images/AAEMYRO0.png "Diagram of a list named c labeled with its element names")

In [4]:
# Auslesen des ersten Buchstabens der Zeichenkette (s)
s[0]

'I'

In [6]:
# Auslesen des dritten Buchstabens der Zeichenkette (s)
s[4]

's'

### Zugriff auf Elemente vom Ende einer Sequenz mit negativen Indizes
Auf die Sequenzen kann einfach auch vom Ende her zugegriffen werden, indem _negative Indizes_ verwendet werden:
![Diagram of the list c labeled with its negative indices](ch05images/AAEMYRO0_2.png "Diagram of the list c labeled with its negative indices")

In [10]:
# Auslesen des letzten Buchstabens der Zeichenkette (s)
s[-1]

'.'

In [12]:
# Auslesen des fünftletzten Buchstabens der Zeichenkette (s)
s[-5]

'a'

### Indizes müssen ganze Zahlen oder ganzzahlige Ausdrücke sein

In [14]:
a = 1

In [15]:
b = 2

In [16]:
s[a + b]  # Index (a+b) ist ein ganzzahliger Ausdruck

' '

In [17]:
b = 1.5

In [32]:
# Uncomment to raise error:
#s[b]                     # --> TypeError: string indices must be integers

### Versuch, auf ein nicht existierendes Element zuzugreifen
Indexwerte müssen im zulässigen Bereich liegen und dürfen nicht über das Ende der Zeichenkette hinaus auf Elemente zugreifen.

In [53]:
s

'Ich sehe einen Hund graben, dass muss doch einen Grund haben.'

In [54]:
# Uncomment to raise error:
#s[111] = 'i'                # --> IndexError: string index out of range

### Zeichenketten sind unveränderlich

In [22]:
# Auslesen des ersten Buchstabens der Zeichenkette (s) funktioniert problemlos
s[0]

'I'

In [30]:
# Aber der erste Buchstabe kann nicht einfach verändert werden:

# Uncomment to raise error:
#s[0] = 'i'                # --> TypeError: 'str' object does not support item assignment

#### Workaround: Statt Zeichenkette verädern einfach neue Zeichenkette erstellen
Da Zeichenketten, wie auch einige andere Sequenzen unveränderlich sind, werden einfach neue Sequenzen erstellt. Sie können aus einer Kombination von Sequenzen bestehen, wie hier im Beispiel mit Zeichenketten gezeigt.
> Der Syntax `[1:]` ist ein Schnitt (_slice_) und wird getrennt und detailliert eingeführt. Zum Verständnis des Beispiels: mit `[1:len(s)]` werden alle Buchstaben vom zweiten bis zum letzten zusammengefasst.

In [55]:
print(s)

s_new = s[0].lower() + '_' + s[1:]

print(s_new)

Ich sehe einen Hund graben, dass muss doch einen Grund haben.
i_ch sehe einen Hund graben, dass muss doch einen Grund haben.


### Vergleichsoperatoren
* Zeichenketten können Element für Element verglichen werden.
* Zwei Zeichenketten sind "gleich", wenn sie die gleichen Elemente in derselben Reihenfolge haben.

In [1]:
a = "alpha"

In [2]:
b = "alpha"

In [3]:
c = "alpha!"

In [4]:
a == b   # Wahr: die entsprechenden Elemente sind gleich


True

In [5]:
a == c   # Falsch: unterschiedliche Längen

False

In [6]:
a < c  # True, a hat weniger Elemente

True

In [7]:
c >= b  # Wahr: Elemente mit Index 0-2 sind gleich, aber c hat mehr Elemente

True

In [12]:
d = 'alm'

In [13]:
d < a

True