# Strings

## Strings sind Sequenzen von Zeichen

*Strings* oder *Zeichenketten* bestehen aus einzelnen Zeichen in einer bestimmten Abfolge. 
Python kennt eine Reihe solcher Datentypen, bei denen mehrere Elemente in einer bestimmten Abfolge gespeichert werden. Solche Datentypen werden als  *Sequenztypen* bezeichnet und können in Python alle auf ähnliche Weise verwenden werden. Viele Funktionen und Methoden, die wir in Zusammenhang mit Strings kennen lernen werden, lassen sich später auch auf andere Sequenztypen übertragen. Diese sind:

* Strings
* Bytes
* Bytearrays
* Listen
* Tupel

Manches ist aber auch auf andere Datenstrukturen wie Dictionaries oder Sets anwendbar.

Beginnen wir aber mit einem ersten Sequenztyp: den Strings.

Strings sind Zeichenketten, also geordnete Abfolgen von Zeichen. 

![string1.png](img/string1.png)

Ein String wird erzeugt, indem wir einen Wert in Anführungszeichen setzen (egal ob einfache oder doppelte):

~~~
name = "Hudri Wudri"
name = 'Hudri Wudri'
~~~

Das und weitere Grundlagen zu Strings haben wir ja bereits im Notebook zu den Datentypen kennen gelernt.

### Die Länge der Sequenz ermitteln
Die Zahl der Element in der Sequenz (also die Zahl der Zeichen im String) kann mit der Funktion `len()` ermittelt werden:

In [None]:
sentence = 'Ein String ist eine Zeichenkette.'
len(sentence)

### Adressierung einzelner Elemente
Jedes Element in der Sequenz kann einzeln über seine Position addressiert werden:

![String2.png](img/string2.png)

Dabei ist zu beachten, dass das erste Element der Sequenz den Index 0 hat!

In [None]:
# Für die folgenden Beispiele ist ein kurzer String übersichtlicher
sentence = "Ein String"
sentence[0]

<div class="alert alert-block alert-info">
<b>Übung Str-1</b>
    
Versuchen Sie in der Code-Zelle oben weitere Zeichen aus dem String zu adressieren. Lassen Sie sich z.B. das Element mit dem Index 3 ausgeben. Sie werden sehen, dass ein Leerzeichen ein ganz normales Zeichen im String ist.
</div>

<div class="alert alert-block alert-info">
<b>Übung Str-2</b>
    
Was passiert, wenn ich auf `sentence[10]`, also auf ein nicht existierendes Zeichen zugreife?
</div>

### Negative Index-Zahlen
Python hat ein nettes Feature, das inzwischen auch von anderen Sprachen übernommen wurde: Man kann mit negativen Index-Zahlen sich in der Sequenz von rechts nach links bewegen. `-1` ist dabei das letzte Element,
`-2` das vorletzte usw.

![String2.png](img/string3.png)

In [None]:
sentence[-1]

Ohne die negative Indizierung müssten wir immer zuerst die Länge des Strings ermitteln und von diesem Wert ausgehend den Index des letzten Elements berechnen:

In [None]:
sentence[len(sentence)-1]

Sie werden mir vermutlich zustimmen, dass ``sentence[-1]`` einfacher zu verwenden ist.

<div class="alert alert-block alert-info">
<b>Übung Str-3</b>
<p>
Experimentieren Sie mit verschiendenen Index-Werten
</p>
</div>

### Slicing: Herausschneiden eines Substrings
Durch Angabe zweier, durch einen Doppelpunkt getrennter Werte (Index des ersten herauszuschneidenden und des ersten nicht mehr herauszuschneidenden Elements) kann man aus einem String einen Teilstring extrahieren:

![string4.png](img/string4.png)

In [None]:
sentence[0:3]

Ist der erste Wert `0`, kann dieser weggelassen werden:

In [None]:
sentence[:3]

Wird der zweite Wert weggelassen, ist das gleichbedeutend mit "bis zum Ende des Strings":

In [None]:
sentence[3:]

<div class="alert alert-block alert-info">
<b>Übung Str-4</b>
    
<p>
Slicen Sie <tt>sentence</tt> so, dass als Ergebnis <tt>Stri</tt> herauskommt.
</p>
</div>

Slicing funktioniert auch mit negativen Index-Werten:

In [None]:
sentence[-4:-1]

In [None]:
sentence[-4:]

<div class="alert alert-block alert-info">
<b>Übung Str-5</b>
    
<p>Slicen Sie <tt>sentence</tt> so, dass als Ergebnis <tt>Stri</tt> herauskommt. Verwenden Sie dazu negative Index-Werte.</p>
</div>

Innerhalb der eckigen Klammern kann noch ein dritter numerischer Wert stehen, der die Schrittweite festlegt:

In [None]:
print(sentence)
sentence[0:8:2]

Steht der dritte Wert auf `2`, so wir nur jedes zweite Zeichen berücksichtigt, bei `3` nur jedes dritte Zeichen usw.

Dieser dritte Wert kann auch negativ sein, wodurch die Richtung umgedreht wird. Damit kann man sehr einfach einen String "umdrehen":

In [None]:
sentence[::-1]

## Strings sind unveränderbar

Im Gegensatz zu anderen Datentypen, die wir etwas später kennenlernen werden, kann man einen einmal erzeugten String nachträglich nicht mehr verändern. Jeder Veränderung führt zu einem neuen String-Objekt mit einer neuen Id.

In [None]:
mystring = 'foo'
print(id(mystring))
mystring = 'bar'
print(id(mystring))

Auch das Hinzufügen z.B. eines Zeichens führt zu einem neuen Objekt:

In [None]:
mystring = 'foo'
print(id(mystring))
mystring = mystring + 'x'
print(id(mystring))

## Stringmethoden

Der Datentyp String (``str``) stellt eine Reihe von Methoden (also Funktionalitäten, die auf den String angewendet werden können) zur Verfügung. Wie wir im Abschnitt zur Objektorientierung noch lernen werden, sind Methoden an ein Objekt gebundene Funktionen. Vorerst müssen wir nur wissen wie man Methoden aufruft: Man hängt -- durch einen Punkt getrennt -- den Namen der Funktion an den Wert (oder die auf den Wert verweisende Variable). Hier ein simples Beispiel:

In [None]:
'abc'.upper()

### upper() und lower()

Diese beiden Methoden erzeugen einen neuen String, bei dem alle Zeichen des ursprünglichen Strings in Groß- bzw. Kleinbuchstaben umgewandelt sind.

In [None]:
sentence = 'Ich bin ein String'
print(sentence.upper())
print(sentence.lower())

### replace()

Die `replace`-Methode eines String-Objekts ersetzt alle Vorkommen eines Zeichens (oder eines Substrings) durch ein anderes Zeichen (oder einen anderen Substring). Dazu wird zuerst der zu ersetzende Teilstring angegeben, und dann die Ersetzung: 

In [None]:
sentence = 'Ich bin ein String'
sentence.replace('i', 'y')

In [None]:
'Ich bin ein String'.replace('ein String', 'eine Zeichenkette')

### find()

Die Methode find()  liefert die Position (Index) des ersten gefundenen Vorkommens des gesuchten Zeichens im String.

In [None]:
sentence = 'Ich bin ein String'
sentence.find('I')

`find()` funktioniert auch mit mehr als einem Zeichen:

In [None]:
sentence.find('bin')

Wir das gesuchte Zeichen oder die gesuchte Zeichenkette nicht gefunden, liefert `find()` `-1` zurück:

In [None]:
sentence.find('y')

Der Datentyp `str` kennt noch viele weitere Methoden, die wir nach und nach kennen lernen werden.

## String Formatting / String Templates
Bis jetzt haben wir, wenn wir mehr als einen Wert ausgeben wollten, die beiden Werte durch ein Komma getrennt in die `print()`-Funktion geschrieben:

~~~
print('foo', 'bar')
~~~

Das ist ein ziemlich mieser Trick (wir haben in Wirklichkeit ein Tupel erzeugt und dieses ausgegeben). Normalerweise sollte man für solche Fälle eine der im Folgenden vorgestellten Methoden verwenden.

Python kennt mehrere Arten, Variablen oder Ausdrücke in einen String einzubauen.

### f-Strings
Eine relativ neue, aber empfohlene Art, Strings zu formatieren, stellen seit Python 3.6 so genannte f-Strings (*formatted string literals*) dar. (Die Beispiele funktionieren deshalb nur, wenn Sie mindestens Python Version 3.6 installiert haben.) Die große Neuerung dabei ist, dass die Variablen oder Ausdrücke direkt an Ort und Stelle in die geschweiften Klammern geschrieben werden können. f-Strings werden durch ein vorangestelltes `f` gekennzeichnet.

In [None]:
name = input('Gib deinen Namen ein: ')
age = int(input('Gib dein Alter ein: '))
print(f'Hallo {name}. Du bist ca. {age * 365.25} Tage alt.')

Die Ausgabe kann bis zu einem gewissen Grad formatiert werden:

In [None]:
print(f'Hallo {name}. Du bist ca. {age * 365.25:.2f} Tage alt.')

Eine sehr genauer Beschreibung von f-Strings finden sie unter https://docs.python.org/3/reference/lexical_analysis.html#f-strings. Da diese aber für Anfänger möglicherweise zu formal gehalten ist, sollten Sie nach 'python f-string' googlen. Sie werden eine Reihe einfache Einführungen finden.

### format()
Eine etwas ältere, aber dennoch viel verwendete Art des String Formattings ist die String-Methode `format()`. Sie wird seit Python 3.2 unterstützt. Dabei werden in der einfachsten Form jedes Paar geschwungener Klammern durch einen Wert in der Reihenfolge der Argumente von `format()` ersetzt:

Die Parameter der ``format()``-Methode können sein:

* Literale: ``"=> {}".format("Hudri Wudri")``  # Literale machen hier nicht wirklich Sinn
* Variable: ``"=> {}".format(name)``
* Ausdrücke: ``"=> {}".format(age * 365.25)``

Die Ausgabe kann auch formatiert werden, hier etwa legen wir fest, dass die Fließkommazahl mit zwei Kommastellen ausgegeben werden soll:

In [None]:
print("Hallo {}! Du bist ca. {:.2f} Tage alt.".format(name, age * 365.25))

Bei Bedarf finden sie alle Formatierungsmöglichkeiten hier: https://docs.python.org/3/library/string.html#formatstrings

### Formatierung über den %-Operator

Die älteste Art des String Formatting funktioniert, wie in anderen Sprachen auch, über den `%`-Operator. Diese Art ist noch weit verbreitet, wird aber nicht mehr empfohlen.
`%s` steht dabei als Platzhalter für einen String, `%d` als Platzhalter für einen Integer und `%f` für einen Float:

In [None]:
print('Hallo %s! Du bist ca. %f Tage alt!' % (name, age * 365.25))

<div class="alert alert-block alert-info">    
<b>Übung Str-6</b>    

<p>Schreiben Sie ein Programm, das
<ol>
<li>Zur Eingabe eines Namens auffordert</li>
<li>Diese Eingabe einer Variable zuweist</li>
<li>Folgende Ausgabe produziert:
<pre>
Dein Name ist XYZ und besteht aus n Zeichen. 
Er beginnt mit X und endet mit Z. 
Von hinten gelesen lautet er ZYX.
</pre>
</p>
</div>

## Vertiefende Literatur
Ich empfehle ausdrücklich, mindestens eine der folgenden Ressourcen zur Vertiefung zu lesen!

  * Python Standard Library: Kapitel 4.7.1
	(https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str).
  * Kein, Kurs: 
    (https://python-kurs.eu/python3_sequentielle_datentypen.php).
  * Sweigart: https://automatetheboringstuff.com/2e/chapter1/; vertiefend https://automatetheboringstuff.com/2e/chapter6/  
    
    
  * Klein, Buch: Kapitel 17.  
  * Kofler: Kapitel 5.
  * Weigend: Kapitel 13.1 und 13.3.
  * Pilgrim: Kapitel 4 (v.a. 4.4. und 4.5.)
	(http://www.diveintopython3.net/strings.html).
  * Downey: Kapitel 8.8
    (http://www.greenteapress.com/thinkpython/html/thinkpython009.html\#toc93).
  * Sweigart: Kapitel 6

## Lizenz

This notebook ist part of the course [Grundlagen der Programmierung](https://github.com/gvasold/gdp) held by [Gunter Vasold](https://online.uni-graz.at/kfu_online/wbForschungsportal.cbShowPortal?pPersonNr=51488) at Graz University 2017&thinsp;ff. 

<p>
    It is licensed under <a href="https://creativecommons.org/licenses/by-nc-sa/4.0">CC BY-NC-SA 4.0</a>
</p>

<table>
    <tr>
    <td>
        <img style="height:22px" 
             src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1"/></li>
    </td>
    <td>
    <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/nc.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
             src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" /></li>
    </td>
</tr>
</table>