**Seminar 'Einführung in die prozedurale und objektorientierte Programmierung mit Python'**

![Figure progr](https://www.dh-lehre.gwi.uni-muenchen.de/wp-content/uploads/img/python1819/icons8-buch-48.png)

# Thema 2: Listen, Listenoperationen & Dateiverarbeitung
> Die dritte Sitzung widmet sich dem Thema der zusammengesetzten Datentypen insbesondere **Listen**. Zusätzlich beschäftigt sich die Stunde mit dem Einlesen und Schreiben von Dateien.

## Listen (Arrays)

- Bei Listen handelt es sich um einen zusammengesetzten Datentyp, der eine Sammlung von Elementen darstellt.
- Oft werden Listen als *Felder* oder engl. *Arrays* bezeichnet.
- In der Korpuslinguistik eignen sich Listen zur Darstellung von tokenisierten Texten, wobei jedes Wort einem Element entspricht.

### Listen (im engeren Sinne)

Folgende Syntax wird zur Erstellung von Listen eingesetzt:

`[Wert1, Wert2, Wert3,...]`

Das folgende Beispiel zeigt die Zuweisung einer Namensliste zur Variable `namen` und die Erstellung einer gemischen Liste `gemischte_liste`:

In [4]:
namen = ["Anna", "Peter", "Teresa", "Johannes"]

gemischte_liste = ["Annika", 25, 50.2, True]

Listen können also Elemente beherbergen, auch wenn die einzelnen Elemente unterschiedliche Datentypen besetzen.

#### Der Index Operator: [index] 

Die Werte in der Liste sind mit einem Index versehen, der bei **0** beginnt und sich pro Listenelement um 1 erhöht. Will man aus einer bestehenden Liste einen Wert lesen, funktioniert dies unter Angabe des Index-Wertes `[i]` in eckigen Klammern:

In [5]:
# Ausgeben der Elemente aus der Namensliste:
print(namen[0])
print(namen[1])
print(namen[2])
print(namen[3])

# Ausgeben der Elemente aus der gemischten Liste:
print(gemischte_liste[0])
print(gemischte_liste[1])
print(gemischte_liste[2])
print(gemischte_liste[3])

Anna
Peter
Teresa
Johannes
Annika
25
50.2
True


**Achtung:** Das erste Element wird nicht mit `1` sondern mit `0` angesprochen, im Beispiel der Namensliste lässt sich der letzte- bzw. der vierte Eintrag demnach nicht mit dem Index `4` sondern mit `3` auswählen.

Wird ein Index verwendet, der zu groß ist, wirft der Python Interpreter beim Ausführen des Programms einen Fehler: `IndexError: list index out of range`, da er das angesprochene Elemente nicht finden kann.

#### Die Länge von Listen

Die Länge einer Liste ergibt sich aus der **Anzahl der Elemente**, die sie enhält. Beide Beispiellisten haben somit die Länge 4.
Um die Länge einer Liste zu ermitteln, kann die Funktion `len()` benutzt werden:


In [6]:
print(len(namen))
print(len(gemischte_liste))

4
4


#### Negative Indizes

Listenelemente können durch Angabe negativer Index-Werte `[-i]` auch vom Listenende her angesteuert werden:

In [7]:
print(namen[-1]) # entspricht namen[4-1]
print(namen[-3]) # entsprichte namen[4-3]

Johannes
Peter


Das Anprechen von Listenelementen mittels `[-i]` ist eine abkürzende Schreibweise für: `["Länge der Liste"-i]`.  

#### Indexbereiche

Ebenfalls möglich ist das Auslesen mehrerer Listenelemente, in eckigen Klammern muss dazu ein Indexbereich angegeben werden. Der Startwert ist inklusiv, der Endwert exklusiv:

In [12]:
print(namen[1:3]) # gibt  die Elemente an Indizes 1 und 2 aus.
print(gemischte_liste[2:4]) # gibt die Elemente an Indizes 2 und 3 aus.

['Lara', 'Johannes']
[50.2, True]


Wird nur entweder die obere oder die untere Grenze besetzt, können alle Listenelemente bis zu einem, bzw. ab einem bestimmten Index angesprochen werden. Bei zu großen Werten ensteht hierbei kein Fehler:

In [13]:
print(namen[:2]) #gibt alle Elemente bis zu Index 2 aus.
print(gemischte_liste[2:]) #gibt alle Elemente ab Index 2 aus.
print(namen[:200]) # gibt alle Werte aus, obwohl die Liste nur die Länge 4 hat. 

['Anna', 'Lara']
[50.2, True]
['Anna', 'Lara', 'Johannes']


### Operationen auf Listen
Python erlaubt es, Listen auf vielfältige Art und Weise zu verändern, zu erweitern, und Informationen aus ihnen auszugeben. Für die folgenden Beispiele werden zunächst zwei Listen erstellt:

In [14]:
namen = ["Anna", "Peter", "Teresa", "Johannes"]
numbers = [1, 4, 7, 9, 15, 375]

**Änderungen an einzelnen Listeneinträgen** können durch Angabe der Ersetzungsposition und Überschreiben des Wertes vorgenommen werden:

In [15]:
namen[2] = "Lara"
numbers[4] = 700

print(namen)
print(numbers)

['Anna', 'Peter', 'Lara', 'Johannes']
[1, 4, 7, 9, 700, 375]


Listeneinträge werden mit Hilfe von `del` unter Angabe der gewünschten Indexposition **entfernt**:

In [16]:
del namen[1] # entfernt das zweite Element (Index 1)
del numbers[-1] # entfernt das letzte Element (Index 5)

print(namen)
print(numbers)

['Anna', 'Lara', 'Johannes']
[1, 4, 7, 9, 700]


Wollen Sie wissen, wie viele Elemente eine spezifische Liste enthält, so ermitteln sie die **Zahl der Elemente** mithilfe der Funktion `len()`:

In [17]:
print(len(namen))
print(len(numbers))

3
5


Zur Ermittlung des **niedrigsten Listenwertes** verwenden Sie die Funktion `min()`, zur Ermittlung des **höchsten Listenwertes** die Funktion `max()`:

In [18]:
print(max(numbers))
print(max(namen))
# ANMERKUNG: Bei Strings wird der höchste Buchstabe im Alphabet ermittelt.
#Für gemischte Listen ist diese Operation nicht zulässig.


print(min(numbers))
print(min(namen))
# ANMERKUNG: Bei Strings wird der niedrigste Buchstabe im Alphabet ermittelt.
#Für gemischte Listen ist diese Operation nicht zulässig.

700
Lara
1
Anna


Mit Hilfe des `+`-Operators können Listen **vereinigt** (konkateniert) werden:

In [4]:
mixed = namen + numbers

print(mixed)

mixed.extend(numbers)
print(mixed)

['Anna', 'Peter', 'Lara', 'Johannes', 1, 4, 7, 9, 700, 375]
['Anna', 'Peter', 'Lara', 'Johannes', 1, 4, 7, 9, 700, 375, 1, 4, 7, 9, 700, 375]


# Methoden auf Listen

Neben den bisher beschriebenen Operationen existieren auch eine Reihe sogenannter Methoden, die auf Listen anwendbar sind:


| Methode | Erklärung | Beispiel |
| :---| :---| :---|
| `append(WERT)` | Hängt ein Element an das Ende der Liste an. | `numbers.append(42)`  |
| `extend(WERT)` | Hängt die Werte einer anderen Liste an das Ende der ersten Liste an. | `numbers.append(namen)`  |
| `insert(INDEX,WERT)` | Fügt ein Element an einer Indexposition in die Liste ein. | `namen.insert(1,"Hannelore")`  |
| `count(WERT)` | Zählt, wie häufig ein Listenelement in der Liste vorkommt. | `numbers.count(7)`  |
| `reverse()` | Kehrt die Reihenfolge der Listenelemente um. | `namen.reverse()`  |
| `sort()` | Sortiert die Elemente der Liste aufsteigend. Wenn absteigend sortiert werden soll, kann .sort(reverse=true) verwendet werden. | `numbers.sort()`  |
| `index(WERT)` | Liefert den Index, an dem ein bestimmtes Element zum ersten Mal in der Liste auftritt. | `namen.index("Anna")`  |
| `remove(WERT)` | Entfernt ein bestimmtes Element beim ersten Vorkommen aus der Liste. | `namen.remove("Anna")` |
| `pop(INDEX)` | Entfernt ein Element an dem angegebenen Index und liefert den Wert des entfernten Elements zurück. Wird pop ohne Parameter aufgerufen, wird das letzte Element entfernt.  | `numbers.pop(2)` | 
 

Methoden werden mittels des Punkt-Operators (`.`) auf Variablen bestimmten Datentyps angewendet. 

In den folgenden Code-Zellen werden die Listenmethoden an drei Listen (`numbers`,`numbers2` und `namen`) gezeigt:

In [1]:
# Erstellung von drei Variablen, die jeweils eine Liste enthalten:

namen = ["Anna", "Peter"]
numbers = [1, 4, 7, 7]
numbers2 = [20,30,40]

print(namen)
print(numbers)
print(numbers2)

['Anna', 'Peter']
[1, 4, 7, 7]
[20, 30, 40]


Die Listenmethode `append(WERT)`

In [2]:
namen.append('Mathilda') 
numbers.append(42) 

print(namen)
print(numbers)

['Anna', 'Peter', 'Mathilda']
[1, 4, 7, 7, 42]


Die Listenmethode `extend(WERT)`

In [3]:
numbers.extend(numbers2) 

print(numbers)

[1, 4, 7, 7, 42, 20, 30, 40]


Die Listenmethode `insert(INDEX,WERT)`

In [4]:
namen.insert(1,"Hannelore")
numbers.insert(1,42)

# ANMERKUNG: Alle weiteren Werte werden um eine Indexposition nach rechts verschoben.
print(namen)
print(numbers)

['Anna', 'Hannelore', 'Peter', 'Mathilda']
[1, 42, 4, 7, 7, 42, 20, 30, 40]


Die Listenmethode `count(WERT)`

In [None]:
print(namen.count("Anna"))
print(numbers.count(7)) 

Die Listenmethode `index(WERT)`

In [5]:
print(namen.index("Anna"))
print(numbers.index(7))

0
2


Die Listenmethode `reverse()`

In [6]:
namen.reverse()
numbers.reverse()

print(namen)
print(numbers)

['Johannes', 'Lara', 'Peter', 'Anna']
[375, 700, 9, 7, 4, 1]


Die Listenmethode `sort()`

In [7]:
namen.sort()
numbers.sort() 

print(namen)
print(numbers)

['Anna', 'Johannes', 'Lara', 'Peter']
[1, 4, 7, 9, 375, 700]


Die Listenmethode `remove(WERT)`

In [8]:
namen.remove("Anna") 
numbers.remove(42)

print(namen)
print(numbers)

ValueError: list.remove(x): x not in list

Die Listenmethode `pop(WERT)`

In [9]:
last_elem = namen.pop()

print(namen)
print("Ausgabe des entfernten Elements:",last_elem)

['Johannes', 'Lara']
Ausgabe des entfernten Elements: Peter


### Mehrdimensionale Listen

Listen dürfen wie eingangs erwähnt Elemente beliebiger Datentypen enhalten, wobei diese sogar gemischt werden dürfen. Somit kann eine Liste auch selbst wieder eine Liste als Element enthalten. Das folgende Beispiel soll dies verdeutlichen: 

In [10]:
erste_liste = [1,2,3]
zweite_liste = [3,4,5]

erste_liste.append(zweite_liste)

print(erste_liste)

[1, 2, 3, [3, 4, 5]]


Im Gegensatz zur vorhin gesehenen Methode `extend()` wird nun die komplette Liste 2 als **ein Element** an die erste Liste gehängt. Die Länge der ersten Liste beträgt nun nicht 6 sondern **4**, da sie als letztes Element nun selbst wieder eine Liste enthält:

In [None]:
print("Das vierte Element der ersten Liste:",erste_liste[3])
print("Länge der Liste:",len(erste_liste))

Soll nun ein spezifisches Element aus der der zweiten Liste angesprochen werden, die nun aber in der ersten Liste enthalten ist, kann Folgendes geschrieben werden:

In [None]:
print(erste_liste[3][0])

`print(erste_liste[3][0])` spricht das erste Elemente des vierten Elements der ersten Liste. Also das erste Element der verschachtelten Liste. Beispielsweise kann so eine **zweidimensonale Liste** oder **Matrix** erzeugt werden:

In [None]:
matrix = [[1,2,3],[4,5,6],[7,8,9]]

Um nun etwa die "5", also das zweite Element aus der zweiten Liste, anzusprechen, kann wieder der Index-Operator doppelt hintereinander genutzt werden: 

In [None]:
print(matrix[1][1])

Bei der Verschachtelung von Listen sind keine Grenzen gesetzt, anbei ein Beispiel einer 5-dimensionalen Liste:

In [None]:
multi_list = [
    [
        [
            [
                ["Apfel",
                 "Birne",
                 "Orange"
                ]
                
            ]
        ]
    ],
     [
        [
            [
                ["Auto",
                 "Zug",
                 "Fahrrad"
                ]
                
            ]
        ]
    ]
]

print("Birne:",multi_list[0][0][0][0][1]) 
print("Fahrrad",multi_list[1][0][0][0][2])

## Strings als zusammengesetzter Datentyp

Obwohl eine Zeichenkette nur ein Objekt darstellt, sind Zeichenketten genau genommen aber gar keine elementaren Datentypen sondern wie Listen zusammengesetzte Datentypen.

Somit sieht die korrigierte Übersicht über die Datentypen folgendermaßen aus:

### Elementare Datentypen

 | Datentyp  | Beispiele  | Erklärung |  Einsatzzweck | 
 | :--- | :---  | :--- |  :--- | 
 | Numerisch  | 125, -98,124.0  | Ganzzahlen, Gleitkommazahlen,komplexe Zahlen.  | Werden für Berechnungen aller Art verwendet.   | 
 | Boolean  | True, False  | Logisch wahr oder falsch.  | Wird für logische Entscheidungen benötigt.  | 


### Zusammengesetzte Datentypen

 | Datentyp  | Beispiele  | Erklärung |  Einsatzzweck | 
 | :--- | :---  | :--- |  :--- | 
 | Listen  | [1,2], ["Katze",'Hund',2]  | Geordnete Sammlungen von Werten, die mit Komma getrennt innerhalb von `[]` stehen.  | Häufigstes Format, wenn Datensammlungen bearbeitet werden.   | 
 | Zeichenketten (Strings) | "LMU", "Kapitel 5" | Eine Zeichenkette von alphanumerischen Zeichen, gerahmt durch `"..."`.  | In der Sprachwissenschaft häufigstes Format.  | 
 | Tupel  | ("Montag","Dienstag",2015)  | Geordnete Sammlungen von Werten, die mit Komma getrennt innerhalb von `()` stehen.  | Unveränderbare Gruppen von Werten, etwa (x,y) - Koordinatenpaare.   | 
 | Mengen (Sets)  | {1,2,3,4,5},{"Apfel","Birne","Orange"}  | Ungeordnete Sammlung von Werten ohne doppelte Elemente, die mit Komma getrennt innerhalb von `{}` stehen.  | Typischer Einsatzbereich sind mathematische Mengenoperation wie etwa Vereinigung und Durchschnitt .  | 
 | Dictionaries  | {"Apfel":2,"Birne":4,"Orange":5}  | Ungeordnete Menge von Schlüssel-Wert-Paaren, die mit `:` getrennt innerhalb von `{}`stehen  .  | Werden in der Sprachwissenschaft z.B. dazu verwendet um Wörterbücher bzw. Konkordanzen zu bilden  | 


Strings können deshalb ebenfalls mit Hilfe des Index-Operators angesteuert werden. Wenn etwa ein einzelnes Zeichen eines Strings angesprochen werden soll, kann Folgendes geschrieben werden:

In [1]:
text = "Der Apfel ist grün"
print(text[0])
print(text[1])
print(text[2])
print(text[3])
print(text[4])
print(text[5])

D
e
r
 
A
p


Sowohl die Ausgabe der Länge, als auch das Angeben bestimmter Bereiche funktioniert auf Strings genau wie zuvor auf den Listen.

In [2]:
print(text[-1])  # gibt das letzte Zeichen aus.
print(text[0:3]) # gibt  die Zeichen an Indizes 1 und 2 aus.
print(text[:20]) # gibt  die Zeichen an Indizes 1 und 2 aus.
print(len(text)) # gibt die Länge der Zeichenkette aus.

n
Der
Der Apfel ist grün
18


## Tupel

Tupel verhalten sich wie Listen mit dem Unterschied, dass sie unveränderlich sind. Es ist also nicht möglich, Elemente zu ändern oder Einträge anzuhängen. Tupel sollen an dieser Stelle nur der Vollständigkeit halber erwähnt werden, sie werden in der Linguistik in der Regel nicht eingesetzt. Die Syntax zur Erstellung von Tupeln ist wie folgt:

`(Wert1, Wert2, Wert3,...)`

Das folgende Beispiel zeigt ein Namenstupel , das der Variable `namen` zugewiesen wird:

In [None]:
namen = ("Anna", "Peter", "Teresa", "Johannes")

Einzelne Elemente im Tupel werden wie Listenelemente angesteuert:

In [None]:
print(namen[0])
print(namen[1])

## Mengen (Sets)

Mengen sind ebenfalls ähnlich wie Listen oder Tupel Sammlungen von Elementen. In einer Menge darf ein bestimmtes Element jedoch nur jeweils ein einziges Mal auftreten. Hierdurch kann es oft sinnvoll sein, Mengen zu benutzen, etwa wenn schnell das Vokabular eines Textes ermittelt werden soll. Die Syntax zur Erstellung von Mengen lautet wie folgt:

`{Wert1, Wert2, Wert3,...}`

Nachfolgend ein Beispiel einer Menge `zahlen`:

In [None]:
zahlen = {1,2,3,4,5,6}

Mengen können auch durch die Funktionen `set()` und `frozenset()` erzeugt werden. Wird frozenset() benutzt, kann die Menge gleich den Tupeln nicht mehr nachträglich verändert werden. Als Parameter kann jeder andere zusammengesetzte Datentyp verwendet werden, etwa eine Liste:

In [3]:
liste = ["der","Hahn","der","Hund","der","Fuchs"] 

menge = set(liste)
statische_menge = frozenset(liste)

print(menge)
print(statische_menge)

{'Hahn', 'der', 'Hund', 'Fuchs'}
frozenset({'Hahn', 'der', 'Hund', 'Fuchs'})


## Dictionaries
Ein Dictionary ist eine Sammlung von Schlüssel-Wert-Paaren. In anderen Worten verhalten sich Dictionaries wie Listen, nur dass zum Auslesen oder Einfügen eines Wertes keine Index-Zahl sondern ein Schlüssel verwendet wird. Schlüssel sind üblicherweise von Typ String.

`{Schlüssel1:Wert1, Schlüssel2:Wert2, Schlüssel3:Wert3, ...}`

Die Ansteuerung der einzelnen Werte erfolgt wie bei Listen und Tupeln über die Angabe des Schlüssels in eckigen Klammern:

In [None]:
# Zuweisung eines Wohnort-Dictionary:
wohnort = {"Peter": "München", "Teresa": "Wien"}

# Auswahl eines Wertes über den Schlüssel:
print(wohnort["Peter"])
print(wohnort["Teresa"])

Die Werte eines Dictionaries können von einem beliebigen Datentyp sein, also Integer, String etc., aber auch Listen und wiederum Dictionaries. Im Fall von Dictionaries mit Listen als Werten sieht das folgendermaßen aus:

`{Schlüssel1: [Wert1,Wert2...], Schlüssel2: [Wert1,Wert2...]...}`

Das Anwählen einzelner Einträge erfolgt nun einerseits über den Schlüssel und zusätzlich über die Position innerhalb der eingebetteten Liste:

In [11]:
# Ein Dictionary mit zwei eingebetteten Listen:
hobbies = {"Peter": ["Lesen", "Häkeln"], "Anna": ["Fußball"]}

# Auswahl der eingebetteten Listen:
print(hobbies["Peter"])
print(hobbies["Anna"])

# Die Auswahl spezifischer Werte:
print(hobbies["Peter"][0])
print(hobbies["Peter"][1])

print(hobbies["Anna"][0])
#print(hobbies["Anna"][1]) # Fehler: Listenwert nicht vorhanden (out of range)!

['Lesen', 'Häkeln']
['Fußball']
Lesen
Häkeln
Fußball


## Dateiverarbeitung

In der Regel werden Sie keine Texte verarbeiten, die Sie zuvor manuell eingegeben haben. Vielmehr werden Sie Textdateien einlesen, den Inhalt verwerten und im Anschluss in neuer Form ausgeben wollen. Der Größe der zu verarbeitenden Textdateien wird dabei lediglich durch den Arbeitsspeicher und die Python-Version (32- oder 64-Bit) Grenzen gesetzt: Je nach Konfiguration liegt die maximale Größe eines eingelesenen Textes bei 32-Bit Python im Rahmen von 2 bis 3 Gigabyte, bei 64-Bit Python setzt nur die Größe des Arbeitsspeichers eine Limitierung. Sie können also so große Textdateien verarbeiten, die sich mit keinem Texteditor mehr ohne Absturz öffnen lassen.

### Öffnen von Dateien und Öffnungsmodus

Um eine Textdatei zu öffnen, ist es notwendig, zuerst einen Pointer auf die Datei zu setzten, aus der Sie lesen wollen. Der Pointer enthält zwei Informationen, den Namen der zu öffnenden Datei bzw. den Dateipfad sowie den Modus, in dem die Datei geöffnet wird. Die Syntax der Pointer-Funktion lautet:

`open(Dateiname,Modus)`

Das Ergebnis dieses Funktion muss direkt in eine Variable geschrieben werden, auf die später die tatsächliche Leseoperation zugreifen kann. Im Folgenden wird davon ausgegangen, dass sich eine Datei mit dem Namen `lesetest.txt` im Ordner Dokumente von jupyter befindet. Ein Lese-Pointer auf die Datei wird folgendermaßen gesetzt:

In [None]:
r_pointer = open("../Dokumente/lesetest.txt", "r")

Das Problem dieser Leseoperation liegt darin, dass sie Sonderzeichen (ä,ö,ü,ß etc.) nicht korrekt kodiert und an dieser Stelle Fehlermeldungen ausgibt. Um diese Problematik zu umgehen, müssen Sie ein sogenanntes **Modul** importieren. Module dienen dazu, die Grundfunktionen von Python über ebendiese hinaus zu erweitern. Um die Kodierung korrekt auszuführen, importieren Sie das Modul io zu Beginn Ihres Skripts, auch die open-Funktion muss angepasst werden: Sie erhält ein io-Präfix (einen Namensraum) und die Kodierung ist explizit anzugeben (wählen Sie in der Regel utf8):

In [None]:
import io

r_pointer = io.open("../Dokumente/lesetest.txt", "r", encoding="utf8")

Folgende Modi existieren für das Öffnen von Dateien:

| Modus  | Beschreibung |
| :------------- | :------------ | 
| r  | Öffnet eine Datei zum Auslesen des Inhaltes (read only). Die Datei wird von Anfang an gelesen.  |
| r+  | Öffnet eine Datei zum Lesen und Schreiben. Die Datei wird von Anfang an gelesen. **Vermeiden Sie diesen Modus aus Sicherheitsgründen.**  |
| w  | Öffnet eine Datei im Schreibmodus (write). Löscht dabei den gesamten Inhalt einer Datei bzw. erzeugt die Datei wenn sie nicht existiert.  |
| w+  | Öffnet eine Datei zum Lesen und Schreiben. Löscht dabei den gesamten Inhalt einer Datei bzw. erzeugt die Datei wenn sie nicht existiert. **Wenden Sie diesen Modus nicht an, er kann leicht Dateien ungewollt zerstören!**  |
| a  | Öffnet eine Datei im Schreibmodus 'anhängen' (append). Wenn die Datei nicht existiert, wird sie erzeugt. Löscht nicht den Inhalt der Datei, sondern schreibt immer an das jeweilige Ende der Datei.  |
| a+  | Öffnet die Datei im Lese- und Schreibmodus 'anhängen'. Wenn die Datei nicht existiert, wird sie erzeugt. Löscht nicht den Inhalt der Datei, sondern schreibt immer an das jeweilige Ende der Datei. **Vermeiden Sie diesen Modus aus Sicherheitsgründen.**  |

Nach dem Setzen des Pointers kann das eigentliche Auslesen des Dateiinhaltes erfolgen. Hierzu verwenden sie eine von drei Auslesemethoden, die alle folgende Syntax aufweisen:

`Pointername.Auslesemodus()`

Das Ergebnis ist der eingelesene Text, den Sie in eine Variable speichern, um ihn nach dem Ausleseprozess nicht wieder zu verlieren. Es gibt drei Lesemethoden:

**Auslesen des gesamten Dateiinhaltes in eine Variable:** `read()`

In [None]:
r_pointer = io.open("../Dokumente/lesetest.txt", "r", encoding="utf8")
textinhalt = r_pointer.read()

print(textinhalt)

**Auslesen des Dateiinhaltes Zeile für Zeile:** `readline()`

Die Methode `readline()` liest das Dokument Zeile für Zeile aus, wobei jeder erneute Aufruf der Methode eine Zeile nach vorne springt. Diese Methode kann genutzt werden, wenn sehr große Dateien erwartet werden, deren vollständiges Einlesen den Arbeitsspeicher überfordern würde.

In [None]:
r_pointer = io.open("../Dokumente/lesetest.txt", "r", encoding="utf8")

# Zeile 1:
textinhalt = r_pointer.readline()
print(textinhalt)

# Zeile 2:
textinhalt = r_pointer.readline()
print(textinhalt)

**Auslesen des gesamten Dateiinhaltes als Liste:** `readlines()`

Alle Zeilen werden als separate Elemente einer Liste gespeichert.

In [None]:
r_pointer = io.open("../Dokumente/lesetest.txt", "r", encoding="utf8")

textinhalt = r_pointer.readlines()

print("Zeile 1: " + textinhalt[0])
print("Zeile 2: " + textinhalt[1])
print("Zeile 3: " + textinhalt[2])

Am Ende des Ausleseprozesses schließen Sie den Pointer wieder `Pointername.close()`.

In [None]:
r_pointer.close()

### Schreiben in Dateien

Um in eine Textdatei zu schreiben, gehen Sie vor wie beim Auslesen einer Datei, verwenden Sie statt eines Lesemodus wie `r` aber einen Schreibmodus. Das Schreiben selbst erfolgt über die Methode `write()`:

`Pointername.write(Schreibinhalt)`

Existiert die Datei mit dem angegebenen Dateinamen nicht, so wird sie neu angelegt. Am Ende des Schreibprozesses schließen Sie den Pointer (`Pointername.close()`).

In [None]:
import io
r_pointer = io.open("../Dokumente/schreibtest.txt", "w", encoding="utf8")

r_pointer.write("Das hier wollen wir in eine Datei schreiben.\nEs wäre schön, wenn es funktioniert.")

r_pointer.close()

### Absolute und relative Dateipfade

Zum Auslesen oder Schreiben von Dateien oder zum Einbinden von externen Skript-Bestandteilen ist es erforderlich, auf Dateien zu verweisen. Verweise erfolgen über die Angabe des Pfades zum Ort, an dem die Zieldatei liegt. Grundsätzlich existieren zwei Arten von Pfadangaben:

#### Absolute Pfadangaben

Absolute Pfadangaben gehen von einem Laufwerk, einer Festplatte oder einem anderen Datenträger aus und durchlaufen hierarchisch die Ordnerstrukturen des Datenträgers bis zur Zieldatei, z.B.:

`C:/Dokumente/Python/Projekt_1/lesetest.txt`

Wird beispielsweise der Ordner Python verschoben, so läuft der Verweis ins Leere.


#### Relative Pfadangaben

Bei relativen Pfadangaben wird nicht von einem Laufwerk ausgegangen, Ausgangspunkt ist in diesem Fall das jeweilige Python-Skript. Die Pfadangabe erfolgt relativ zu diesem Skript:

Liegen Skript und Zieldatei im gleichen Verzeichnis, so genügt für den korrekten Verweis die Nennung des Dateinamens:

`lesetest.txt`

Soll vom Skript aus ein oder mehrere Verzeichnisse nach unten gegangen werden, so werden Slashes verwendet wie bei der absoluten Pfadangabe:

`Projekt_1/lesetest.txt`

Das Skript liegt im Ordner `Python`, `lesetest.txt` im Unterordner `Projekt_1`.


`Python/Projekt_1/lesetest.txt`

Das Skript liegt im Ordner `Dokumente`, `lesetest.txt` im Unterordner `Projekt_1`.


Soll in höhere Verzeichnisse gesprungen werden, so wird `../` verwendet, um jeweils ein Verzeichnis nach oben zu springen:

`../lesetest.txt`

Das Skript liegt im Ordner `Projekt_1`, `lesetest.txt` im übergeordneten Verzeichnis `Python`.


`../../lesetest.txt`

Das Skript liegt im Ordner `Projekt_1`, `lesetest.txt` im übergeordneten Verzeichnis `Dokumente`.