# Datentypen

Programmieren ist nichts anderes als das Bearbeiten (Einlesen, Verarbeiten, Ausgeben) von Daten.

Daten werden in einem Programm als einzelne *Werte* betrachtet. Werden Sie etwa von einem Programm aufgefordert, eine Zahl (oder eine Namen, eine E-Mailadresse oder was auch immer)  einzugeben, liest Ihr Programm die Tastatureingabe aus und legt das Eingegebene als *Wert* im Hauptspeicher (RAM) ab. Mit einem entsprechenden Befehl können Sie die Eingabe z.B. am Bildschirm ausgeben.

Führen Sie die nächste Code-Zelle (etwa durch Click auf das Run-Symbol in der Toolbar) aus. Keine Angst: Sie müssen jetzt noch nicht verstehen, was da genau passiert, das Beispiel dient nur zur Demonstration von Eingabe (Wie alt bist du?) -> Verarbeitung (Multipliziere die Jahre mit 365,25) -> Ausgabe (print) von Daten.

In [None]:
age_years = int(input("Wie alt bist du (Jahre)? "))  # input
age_days = age_years * 365.25                        # computation
print("Du bist ca. {} Tage alt.".format(age_days))   # output

## Jeder Wert hat einen Datentyp

Jeder Wert in Python hat einen bestimmten Datentyp wie z.B. Zahl, Zeichenkette (Text) oder Uhrzeit. Der Datentyp wird davon bestimmt, wie der Wert eingegeben (bzw. verarbeitet) wurde. In Python ist es im Unterschied zu anderen Sprachen nicht nötig, den Typ explizit zu deklarieren, sondern Python erkennt den Typ automatisch.

~~~
1              # Datentyp int
3.14           # Datentyp float
'Hudri Wudri'  # Datentyp str
True           # Datentyp bool
~~~

Die für den Einstieg wichtigsten Typen sind: `int`, `float`, `bool` und `str`.

Wir können den Datentyp eines Wertes durch Aufruf der Funktion `type()` ermitteln. Führen Sie dazu die
folgenden Codezellen aus:

In [None]:
type(1)

In [None]:
type(3.14)

In [None]:
type('Hudri Wudri')

In [None]:
type(True)

Vorgriff: Da Python im Kern eine objektorientierte Sprache ist (alles ist ein Objekt im Sinne der objektorientierten Programmierung) gibt es potentiell beliebig viele Typen, weil selbstgeschriebene Klassen eigene Typen darstellen.

## Die numerischen Datentypen `int` und `float`

Der Datentyp `int` (Integer) repräsentiert eine Ganzzahl, der Datentyp `float` eine Kommazahl (Gleitkommazahl: Float).
Beiden Typen können im Prinzip beliebig groß werden, ihre Größe ist nur durch den vorhanden Hauptspeicher begrenzt.

In [None]:
type(12345)

In [None]:
type(3.14)

In Python gibt es mit `complex` einen dritten numerischen Datentyp für komplexe Zahlen. Da dieser in den Geisteswissenschaften normalerweise nicht benötigt wird, hier nur ein kurzes Beispiel, für Interessierte. Der Imaginärteil wird dabei durch ein angehängtes `j` gekennzeichnet.

In [None]:
type(7 + 0.77j)

## Der Datentyp `bool` (Boolean, Wahrheitswert)
Dieser Datentyp kennt nur zwei Werte: `True` oder `False` (Achtung: Der Großbuchstabe am Beginn ist wichtig!)

In [None]:
type(True), type(False)

## Der Datentyp `str` (String, Zeichenkette)

Ein String ist eine Sequenz von einzelnen Zeichen. Wir werden später noch ausführlich auf diesen Datentyp eingehen. Deshalb hier nur in aller Kürze. String-Werte müssen in Anführungszeichen stehen (in Python ist es egal ob Sie einfache oder doppelte Anführungszeichen verwenden).

In [None]:
type('abc'), type("abc")

Da Strings entweder durch einfache oder doppelte Anführungszeichen begrenzt werden, kann man die jeweils anderen als normale Zeichen im String verwenden:

In [None]:
print('"Das ist praktisch", sagte er, "weil man im String das jeweils andere Anführungszeichen verwenden kann."')

### Lange Strings

Manchmal muss man lange Strings erzeugen, die auch über mehrere Zeilen reichen können. Python bietet hier zwei elegante Möglchkeiten. Entweder man verwendet als Stringbegrenzer drei Anführungszeichen (egal ob doppelte oder einfache)

In [None]:
"""Das ist ein ziemlicher langer String, der 
über mehrere Zeilen reicht."""

oder man klammert mehrere einzelne Strings:

In [None]:
('Das ist eine ziemlich langer String, der '
 'über mehrere Zeilen reicht.')

Strings haben keine Längenbegrenzung, d.h. ihre maxiale Länge ist nur durch den verfügbaren Hauptspeicher begrenzt. Es ist durchaus üblich, ganze Romane in einen String einzulesen.

### Escape-Sequenzen in Strings

In Strings dient der Backslash (\\) als Escape-Zeichen, das die Bedeutung des unmittelbar darauf folgenden Zeichens verändert. Es gibt eine Reihe solcher Escape-Sequenzen, hier nur ein paar Beispiele:

#### Die Escape-Sequenzen \\' und \\"

`\'` und `\"` können dazu verwendet werden, Anführungszeichen im String zu verwenden, wenn das entsprechende Anfürungszeichen bereits bereits zur Begrenzung des Strings verwendet wurde:

In [None]:
print("Sie sagte: \"Escape-Sequenzen sind manchmal recht nützlich\"")

#### Die Escape-Sequenz \\n

Haben Sie jemals darüber nachgedacht, woher Ihr Computer weiß, dass in einem Text an einer bestimmten Stelle eine neue Zeile begonnen werden muss? Die Anwort ist simpel: Es gibt ein bestimmtes (normalerweise nicht dargestelltes) Zeichen, das nichts anderes bedeutet als: "Mache hier einen Zeilenumbruch". Dieses Zeichen (Linefeed, Codepoint 10) wird in Python (und vielen anderen Programmiersprachen) als `\n` eingegeben. 

In [None]:
print("Zeile 1\nZeile 2")

Kleiner Exkurs: Windows verwendet als Zeilentrenner 2 Zeichen: ``\n`` (linefeed; codepoint 10) und ``\r`` (carriage return; codepoint 13).
Ein Zeilenende unter Windows sieht daher typischerweise so aus:

```
Zeile1\n\rZeile2
```
Python 3 sorgt normalerweise -- abhängig vom Betriebssystem -- automatisch dafür, dass Zeilenumbrüche korrekt kodiert werden. Man wird also nicht mit diesem Unterschied behelligt. Wenn man ganz sicher gehen will, kann man ``os.linesep`` verwenden. 

#### Die Escape-Sequent \\t
`\t` steht für ein Tabulatorzeichen:

In [None]:
print('abd\tefg')

#### Den Backslash (\\) in einem String escapen
Da das Backslash-Zeichen (`\`) normalerweise eine Escape-Sequenz einleitet, muss man, wenn man in einem String das Backslash-Zeichen braucht, dieses durch ein zweites Backslash-Zeichen escapen:

In [None]:
print('Die Escape-Sequenz \\t steht für einen Tabulator')

#### Direkte Eingabe eines Zeichens über seinen Unicode-Codepoint

Zeichen, die nicht auf dem Keyboard vorhanden sind, können über ihren Unicode-Codepoint eingegeben werden (im Beispiel unten in Hexadezimalnotation). Die Codepoints finden Sie in den Unicode-Codetabellen, z.b. hier: https://home.unicode.org/ oder hier: https://codepoints.net/

In [None]:
print('Ein Sigma sieht so aus: \u03A3')

### Hinweise für erfahrene Programmierer
* Python kennt keine Primitives
* Sogar ganz einfache Typen wie `bool` oder `int` sind von Klassen abgeleitete Objekte
* Typen sind in Python also nicht anderes als Klassen

## Warum sind Typen wichtig?

Der Datentyp legt fest, wie ein Wert intern repräsentiert wird.

Aus ProgrammiererInnensicht am wichtigsten ist, was man mit bestimmten Datentypen machen kann und was nicht.
Die Methode `upper()` des String-Typs z.B. wandelt alle Zeichen in Großbuchstaben um. 

In [None]:
'abc'.upper()

`upper()` in Zusammenhang mit Integern macht dagegen keinen Sinn und führt zu einem Error:

In [None]:
123.upper()

Auch Operatoren (diese werden erst im nächsten Abschnitt behandelt, aber die Beispiele sollten dennoch nachvollziehbar sein) bewirken für unterschiedliche Datentypen Unterschiedliches:

In [None]:
1 + 1

In [None]:
'1' + '1' 

In [None]:
'1' + 1 # führt zu TypeError

## Typumwandlungen (Casts)
Im letzten Beispiel haben wir gesehen, dass die Addition eines Strings mit einem Integer zu einem Fehler führt. Das können wir bei Bedarf umgehen, indem wir Python anweisen, eine Typumwandlung durchzuführen.


In [None]:
'1' + str(1)

In diesem Beispiel haben wir Python angewiesen, den zweiten Wert (`1`) vom Datentyp `int` in einen String (`str`) umzuwandeln. Da dies vor Anwendung des Operators passiert, ist das Ergebnis `'11'`.

In [None]:
int('1') + 1

In diesem Beispiel haben wir Python angewiesen, den ersten Wert (`'1'`) zu einem Integer umzuwandeln. Der `+` Operator hat nun zwei Integer addiert: das Ergebnis ist `2`.

Natürlich kann man nicht beliebige Umwandlungen vornehmen. Einen nicht als Zahl interpretierbaren String in einen Integer umzuwandeln scheitert deshalb:

In [None]:
int('abc')

Das gilt übrigens auch für Zahlwörter:

In [None]:
int('eins')

## Vertiefende Literatur
Ich empfehle ausdrücklich, mindestens eine der folgenden Ressourcen zur Vertiefung zu lesen. Da Datentypen, Variable und Operatoren oft zusammen abgehandelt werden, beziehen sich die Literaturhinweise teilweise auf alle drei dieser Themen.

  * Python Tutorial: Kapitel 3 (3.1.1 und 3.2.1)
    (http://docs.python.org/3/tutorial/introduction.html)
  * Klein, Kurs:
    * Datentypen und Variablen (http://python-kurs.eu/python3_variablen.php)
  * Sweigart: https://automatetheboringstuff.com/2e/chapter1/    
  
  
  * Klein, Buch: Kapitel 4
  * Kofler: Kapitel 2.2
  * Weigend: Kapitel 4 (4.1-4.9)
  * Pilgrim: Kapitel 2 (2.1, 2.2, 2.3, 2.8) 
    (https://www.diveinto.org/python3/native-datatypes.html)
  * Downey: Kapitel 2 (http://greenteapress.com/thinkpython/html/thinkpython003.html)

## Lizenz

This notebook ist part of the course [Grundlagen der Programmierung](https://github.com/gvasold/gdp) held by [Gunter Vasold](https://online.uni-graz.at/kfu_online/wbForschungsportal.cbShowPortal?pPersonNr=51488) at Graz University 2017&thinsp;ff. 

<p>
    It is licensed under <a href="https://creativecommons.org/licenses/by-nc-sa/4.0">CC BY-NC-SA 4.0</a>
</p>

<table>
    <tr>
    <td>
        <img style="height:22px" 
             src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1"/></li>
    </td>
    <td>
    <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
         src="https://mirrors.creativecommons.org/presskit/icons/nc.svg?ref=chooser-v1" /></li>
    </td>
    <td>
        <img style="height:22px;"
             src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" /></li>
    </td>
</tr>
</table>

