# Strings

Nachdem die skalaren Datentypen in Python ausführlich behandelt wurden, kommen wir nun zu einer neuen Klasse von Datentypen, den Container-Typen, von denen die Strings sich als Beispiel für die ganze Klasse gut benutzen lassen.

## Definition

Was sind Strings in Python? Ein String oder Zeichenkette ist eine Folge von keinem oder mehreren Zeichen! 

In [47]:
s = 'Dies ist ein String!'       # oder
t = "Dies ist auch ein String!"  # Mischung beider Quotes ist nicht erlaubt!
c = 'a'                          # ein String mit nur einem Zeichen
l = ''                           # ein leerer String
print(s)
print(t)
print(c)
print(l)

Dies ist ein String!
Dies ist auch ein String!
a



Die Größe eines Strings ist nur vom vorhandenen Arbeitsspeicher begrenzt!

Strings können auch spezielle Zeichen enthalten, die durch eine sog. Escape-Squenze `\` eingeleitet werden:

In [None]:
s = '\"'    # quote "
s = '\''    # quote '
s = '\n'    # einen Zeilenumbruch
s = '\t'    # Tabulator

Mit der Zeit wurden weitere spezielle Strings eingeführt:

In [48]:
s = u'Dies ist ein Unicode-String: \U0001F606'
print(s)

i = 1234

s = f'Dies ist ein formatierter String: {i}'
print(s)

s = r'Dies ist ein String für Labels beim Plotten'
print(s)

Dies ist ein Unicode-String: 😆
Dies ist ein formatierter String: 1234
Dies ist ein String für Labels beim Plotten


## Umwandlungen

Strings lassen sich auch umwandeln, z.B. in Zahlen und umgekehrt:

In [49]:
s = '1234'
print(int(s))
i = 5678
print(str(i))  # die Umwandlungsfunktion ist str(...) für die Strings

1234
5678


## "Mathematik" mit Strings

Was auf den ersten Blick etwas *komisch* anmutet, ist aber bei näheren Betrachtung logisch und einfach nachzvollziehen. Für die Strings sind in Python tatsächlich die mathematischen Operationen `+` und `*` definiert.

Mit dem Operator `+` lassen sich Strings zusammensetzen:

In [50]:
s = 'Oliver' + ' Cordes'
print(s)

i = 0
s = ''
while i < 10:        # zähl von 0 bis 9
    s = s + str(i)   # den String um ein Zeichen ergänzen
    i = i + 1
print(s)

Oliver Cordes
0123456789


Mit dem Operator `*` lässt sich ein String *duplizieren* ... . Die Anzahl sollte mit einer positiven Ganzzahl gegeben werden (negative Zahlen sind kein Fehler, aber machen keinen Sinn!):

In [51]:
s = 'Oliver' * 2
print(s)
s = 'Hallo' * -2
print(s)

OliverOliver



## Container

Unter Container-Typen kann man sich folgendes vorstellen, eine endliche Ansammlung von einzelnen *Teilen*, die man durchnummerieren kann. 

Bei den Strings ist das die Sammlung von einzelnen Zeichen. Eine erste wichtige Operation, die man auf Container anwenden kann, ist die Bestimmung der Anzahl der Teile oder Elemente. Dazu nutzt man die Funktion `len(...)`:

In [46]:
s = 'Hallo'
print(len(s))   # gibt die Anzahl der Zeichen im String zurück

5


Auf einzelne Elemente kann man mit dem `[...]`-Operator zugreifen:

In [55]:
s = 'Hallo'
print(s[0])      # das erste Element
print(s[4])      # das 5. Element
print(s[-1])     # das letzte Element
print(s[-6])     # ausserhalb des Bereiches

H
o
o


IndexError: string index out of range

Der Index bestimmt die Nummer des Elementes und gehen von `0` bis `len(...)-1` für positive Indices.  Negative Indices zählen mit `-1` für das letzte Element bis `-len(...)` für das erste Element. 

Einfacher kann man die Umrechnung von negative Indices in positive Indices mittels des Restoperators vornehmen:

In [56]:
s = 'Hallo'

i = -1
print(s[i])
j = i % len(s)    # Restoperator! 
print(j)
print(s[j])

o
4
o


## Loops über Container

Eine wichtige Eigenschaft von Containern ist, dass man einfach alle Elemente eines Container durchgehen kann. Dazu gibt es die sog. `for`-Loop, die Sie auch von der bash her kennen. Dort ist das Prinzip ähnlich, wobei in der Bash zum Beispiel der Container eine Liste von Dateinamen ist. 

Anwendungen sind vielfältig, hier ein Beispiel:

In [57]:
s = 'Oliver Cordes'

for c in s:     # gehe durch alle Zeichen des Strings und speicher das aktuelle Zeichen in c
    print(c)

O
l
i
v
e
r
 
C
o
r
d
e
s


Der generelle Aufbau einer `for`-Loop ist:

```Python
for <variable> in container:
    Anweisungsblock
```

Natürlich lässt sich diese Schleife in eine `while`-Schleife umwandeln, aber die `for`-Schleife bietet diese Vorteile:
 * keine Schleifenabbruchbedingung
 * keine zusätzliche Zählvariable
 * nicht so Fehleranfällig wie `while`

## Änderungen von Strings

In anderen Sprachen lassen sich Strings zeichenweise verändern. Man würde folgendes ausführen:

In [58]:
s = 'hallo'   # das h soll durch ein H ersetzt werden
s[0] = 'H'

TypeError: 'str' object does not support item assignment

Das ist bei anderen Containern möglich, aber Strings gehören zu den sog. `immutable` Typen, d.h. die Elemente des Containers können **nicht** mehr verändert werden. 

Eine Lösung des obigen Problems wäre mit dem sog. Slicing zu erledigen, was Thema des nächsten Videos sein wird.

## Vergleiche mit Strings

Im Vergleich mit anderen Programmiersprachen kann man in Python *nativ* Strings miteinander vergleichen:

In [59]:
s = 'Hallo'

print(s == 'Hallo')  # identisch
print(s == 'HALLO')  # muss absolut identisch sein!
print(s == 'Hall')   # muss gleich lang sein!

True
False
False


Spannend werden die Vergleiche mit `<` und `>`:

In [60]:
s = 'Hallo'

print(s > 'Hall')      
print(s < 'Hall')  
print(s < 'Halloo')
print(s < 'hallo')
print(s > '1')

True
False
True
True
True


Zum Verständnis muss man die alphabetische Sortierung im Computer verstehen. Dazu muss man die sog. ASCII-Tabellen nehmen, die noch aus den Anfängen der Computer stammen. 

Wenn man einzelne Zeichen miteinander vergleicht, so kommen grob erst die Zahlen, dann die großen und dann die kleinen Buchstaben. Darstellen kann man das, wenn man ein Zeichen mit der `ord`-Funktion in eine ASCII-Nummer konvertiert:

In [61]:
print(ord('5'))
print(ord('A'))
print(ord('a'))

53
65
97


Damit sieht man, wie im Prinzip ein Vergleich durchgeführt wird. 

Verglichen werden die Zeichen vom Anfang der Strings und bei Gleichheit dann weiter zu den nächsten Strings.
Kürzere Strings sind immer **kleiner** als die längeren Strings, wenn man an die kürzeren Strings Zeichen anfügt!