# Strings

Strings sind in Python ein eigener Datentyp. Das heisst, in Python existieren vordefinierte Regeln, wie ein String aufgebaut ist und was man damit tun kann. Daneben gibt es weitere Datentypen wie Ganzzahlen/Integers (int), Fliesskommazahlen/Floats (float) oder auch Wahrheitswerte/Booleans (bool).
Um herauszufinden zu welchem Datentyp ein bestimmtes Objekt gehört, können Sie wie folgt vorgehen:

In [2]:
type('haus')

str

In [3]:
type(2)

int

Wenn Sie innerhalb einer Bedingung sicherstellen wollen, dass ein Objekt zu einem bestimmten Datentyp gehört, können Sie beispielsweise folgendes machen

In [4]:
if type('haus') == str:
    print("'haus' ist ein String")

'haus' ist ein String


Eleganter ist es jedoch, wenn Sie fragen, ob 'haus' eine Instanz der Klasse String ist. Was genau Klassen sind, werden wir später anschauen. Es genügt zu wissen, dass alle Datentypen in Python je eine Klasse bilden.

In [5]:
if isinstance('haus',str):
    print("'haus' ist ein String")

'haus' ist ein String


Ein String ist eine Folge von Zeichen. Auf die einzelnen Zeichen könen Sie mit dem Klammer-Operator zugreifen:

In [1]:
frucht = 'banane'
zeichen = frucht[1]
print(zeichen)

a


Die zweite Anweisung wählt ein Zeichen aus *frucht* und weist es der Variable *zeichen* zu.

Den Ausdruck in eckigen Klammern nennt man **Index**. Der Index gibt an, welches Zeichen Sie aus der Folge auslesen möchten (quasi wie ein Name).

Unter Umständen erhalten Sie nicht, was Sie erwarten:

In [2]:
frucht = 'banane'
zeichen = frucht[1]
print(zeichen)

a


Der Index beginnt stets bei 0. Der erste Buchstabe hat daher Index 0, der vierte Buchstabe entsprechend den Index 3 usw.

## Indices 

Sie können beliebige Ausdrücke als Index verwenden, einschliesslich Variablen und Operatoren. Der Indexwert muss aber ein Integer sein.

In [3]:
frucht = "apfel"
zeichen = frucht[1+2]
print(zeichen)

e


Folgendes Programm gibt Ihnen ein Wort Zeichenweise aus:

In [8]:
wort = input('Geben Sie ein Wort ein: ')
for i in range(len(wort)):
    print(wort[i])

I
n
f
o
r
m
a
t
i
k


Hier erhält der Index i für ein Wort der Länge n nacheinander die Werte von 0 bis n-1 zugewiesen.

## Traversierung

Einen Vorgang, bei dem man einen String Zeichen für Zeichen einzeln auswählt und verarbeitet, nennt man **Traversierung**. 
Das Beispiel vorher sollte illustrieren, wie man Indices aus Variablen nutzen kann. Die selbe Aufgabe kann aber wesentlich einfacher mit folgender for-Schlaufe erledigt werden:

In [9]:
wort = input('Geben Sie ein Wort ein: ')
for i in wort:
    print(i)

I
n
f
o


Diese Vorgehensweise ist möglich, weil ein String eine besondere Datenstruktur ist.

## Index und Wortlängen

Wie Sie aus dem Beispiel von vorher und den Übungen bereits wissen, können Sie mit *len(wort)* die Länge (Anzahl Zeichen) eines Wortes bestimmen. 

 Beachten Sie aber, dass

In [10]:
zeichen = wort[len(wort)]
print(zeichen)

IndexError: string index out of range

in jedem Fall einen Fehler ausgibt. Warum denn?

Wenn Sie den letzten Buchstaben ausgeben wollen, können Sie das entweder mit

In [11]:
letzterBuchstabe = wort[len(wort)-1]
print(letzterBuchstabe)

o


oder wesentlich einfacher mit dem negativen Index -1 machen:

In [13]:
letzterBuchstabe = wort[-2]
print(letzterBuchstabe)

f


Bei negativen Indices wird das Wort quasi von hinten her gelesen.

Aufgaben 1 und 2

## Operatoren für Strings

Bereits vor einiger Zeit haben Sie die Operatoren * und + kennen gelernt und auch erfahren, dass diese auf Strings angewendet werden können. 

Zur Erinnerung:
Mit dem +-Operator können zwei Strings aneinandergehängt (konkateniert) werden:

In [4]:
wort='haus'+'dach'
print(wort)

hausdach


Mit dem *-Operator können Strings x-fach kopiert werden. 

In [5]:
a = 'wort'*3
print(a)

wortwortwort


## String-Teile - Slices

Ein Segment eines Strings nennt man **Slice**. Die Auswahl eines Slices ist der Auswahl eines Zeichens recht ähnlich:

In [8]:
s='Monty Python'
print('Erste 5 Zeichen:',s[:5])
print('letzte 6 Zeichen:',s[6:])

Erste 5 Zeichen: Monty Python
letzte 6 Zeichen: Python


Der Operator [n:m] gibt den Teil des Strings vom n-ten bis zum m-ten Zeichen zurück, **einschliesslich des ersten**, aber **ausschliesslich des Letzten Zeichens**.

Wenn Sie den ersten Index (vor dem Doppelpunkt) weglassen, beginnt das Slice am Anfang des Strings. Lassen Sie den zweiten Index weg, reicht das Slice bis zum Ende des Strings:

In [9]:
frucht = 'banane'
frucht[:3]

'ban'

In [10]:
frucht[3:]

'ane'

Ist der erste Index grösser oder gleich dem zweiten Index, erhalten Sie als Ergebnis einen **Leerstring**, der durch zwei Apostrophe gekennzeichnet wird.

In [11]:
frucht[3:3]

''

In [12]:
frucht[6:2]

''

## Strings sind unveränderbar

Die Versuchung ist gross, einen String zu verändern, indem man einem einzelnen Zeichen einen neuen Wert zuordnet:

In [13]:
gruss='Hallo Welt!'
gruss[1]='e'

TypeError: 'str' object does not support item assignment

Offenbar können Strings so nicht verändert werden. Ganz generell sind Strings sogenannte unveränderbare **Objekte**. 

Strings können Sie also nicht verändern, aber sie können sie kopieren und neue Strings erzeugen. Dafür gibt es verschiedene Varianten.

Beispielsweise kann man Anfangsslices oder Endslices bequem ersetzen:

In [14]:
gruss = 'W'+gruss[1:]
print(gruss)

Wallo Welt!


Man kann aber auch Methoden der Klasse String verwenden.

## Die Klasse String

Strings sind Objekte der Klasse **String**. In Klassen werden Objekte definiert. Das heisst, man definiert, was für Eigenschaften (mittels sogenannter Instanzvariablen) und Fähigkeiten (mittels Methoden) ein bestimmtes Objekt hat. 

Wir werden die Details dazu später genau anschauen und wir werden auch sehen, wie man selbst neue Klassen definieren kann.
Für den Moment genügt es, wenn Sie wissen, dass Strings zur Klasse String (bzw str) gehören und daher einige Methoden mit sich bringen.

## Beispiele:

In [16]:
gruss = 'Hallo Welt'
gruss_gross = gruss.upper()
print(gruss_gross)
print("es".upper())

HALLO WELT
ES


In [17]:
gruss_klein = gruss.lower()
print(gruss_klein)

hallo welt


In [21]:
gruss =gruss.replace('H','p')
print(gruss)

pallo Welt


Sie werden in den Übungen noch viele weitere Methoden der Klasse String kennenlernen

Aufgaben 3, 4

# Standardverfahren auf Strings

Die Klasse String kommt mit vielen nützlichen Methoden daher. Trotzdem lohnt es sich zu schauen, wie man einige dieser Methoden selbst in Form von Funktionen definieren kann.

An welcher Stelle im Wort kommt ein bestimmter Buchstabe das erste Mal vor?

In [None]:
def suche(wort, zeichen):
    index = 0 
    while index < len(wort):
        if wort[index] == zeichen:
            return index
        index +=1
    return -1

print(suche('hamsterrad','r'))

Wie häufig kommt ein Buchstabe im Wort vor?

In [None]:
def zeichen_in_wort(wort, zeichen):
    anzahl = 0
    for buchstabe in wort:
        if buchstabe == zeichen:
            anzahl +=1
    return anzahl

print(zeichen_in_wort('hamsterrad','r'))

Aufgabe 5

## Der in-Operator


Sie haben bereits den Booleschen Operator $is$ kennengelernt (z.B. bei if type('haus') is str). Einen ähnlichen Operator gibt es auch auf Strings. Mit dem $in$ Operator können sie prüfen, ob ein bestimmtes Zeichen innerhalb eines Strings vorkommt.

In [None]:
print('a' in 'banane')

## Strings vergleichen

Die Vergleichsoperatoren ==, <, > können dazu verwendet werden, Strings zu vergleichen.

* == testet auf Gleichheit der Strings (nicht der Objekte) und berücksichtigt Gross-Kleinschreibung (ist also case-sensitiv). 
* < und > beziehen sich auf die alphabetische Ordnung

In [None]:
print('banane'<'Birne')

## Strings kopieren oder umdrehen

Sie werden in den Aufgaben viele Methoden der Klasse String kennenlernen. Eine sei hier aber noch besonders erwähnt: Mit der Hilfe von einem speziellen Slice können Sie einen String erzeugen, der die Reihenfolge der Buchstaben eines Wortes umdreht.

In [None]:
wort = 'banane'
trow = wort[::-1]
print(trow)

Aufgaben 6, 7, 8

## Formatierte Ausgaben

Wenn Sie in der Konsole oder sonst in einem Ausgabefenster einen Text ausgeben wollen, nutzen Sie die Funktion print(). Dabei können Sie grundsätzlich so vorgehen, dass Sie der Funktion eine Menge an Strings oder andere Objekte, die durch Kommas separiert werden, übergeben:

In [None]:
for i in [1, 100, 1000]:
    print("eine Gleichung:", i,'+',2,'=',i+2)

Eine andere und etwas schöner anmutende Variante ist es, dass Sie den auszugebenden String formatieren. Es gibt mehrere Varianten dazu, wir schauen uns die Variante mit *str.format()* an.
Ein erstes Beispiel:

In [None]:
print("Hallo {}, kennst Du schon {}?".format('Heidi', 'Peter'))

Im String stehen Platzhalter {}. Diese werden durch die Argumente von format() nacheinander ersetzt. 
Will man eine andere Ersetzungsreihenfolge haben, so geht das ganz einfach:

In [None]:
print("Hallo {1}, kennst Du schon {0}?".format('Heidi', 'Peter'))

Man kann diese String-Methode auch nutzen, um mehrere Ausgaben zu erzeugen, die aus Listen entstehen:

In [None]:
for i in [1, 100, 1000]:
    print("eine Gleichung: {}+2={}".format(i,i+2))

Zusätzlich kann man bestimmen, wie die Ersetzungen dargestellt werden sollen. In folgendem Beispiel soll jede Zahl der Liste mit einer Breite von 4 Ziffern dargestellt werden. Die Reihenfolge ist dabei umgestellt. Zuerst soll die zweite Zahl der Klammer und dann erst die erste Zahl der Klammer ausgegeben werden. 

In [None]:
for i in [1, 100, 1000]:
    print("eine Gleichung: {1:4d}+2={0:4d}".format(i+2,i))

Weiteres
- Hat es weniger Elemente in der Klammer als Klammern im String, wird ein Fehler ausgegeben. 

- Innerhalb des Strings gibt es weitere Sonderzeichen. Die wichtigsten sind:
   - \n: neue Zeile
   - \\\\: Backslash
   - \\' bzw \\": entsprechende Anführungstriche
   - \t: horizontaler Tabulator

Aufgabe 9