# 11.2.2 Lesen von Daten aus einer Textdatei
Sequentielles lesen die Datei `accounts.txt`, also Lesen von Anfang bis Ende.

In [2]:
with open('accounts.txt', mode='r') as accounts:
    print(f'{"Account":<10}{"Name":<10}{"Balance":>10}')
    for record in accounts:
        account, name, balance = record.split()
        print(f'{account:<10}{name:<10}{balance:>10}')

Account   Name         Balance
100       Jones          24.98
200       Doe           345.67
300       White           0.00
400       Stone         -42.16
500       Rich          224.62


* Wenn der Inhalt einer Datei nicht geändert werden soll, öffnen Sie die Datei nur zum Lesen (`'r'`). Dadurch wird verhindert, dass das Programm die Datei versehentlich verändert.
* Wir iterieren durch das Dateiobjekt, lesen Zeile für Zeile aus der Datei und geben sie als Zeichenkette zurück.
* Für jede Zeile (*record*, oder Eintrag) in der Datei gibt die String-Methode `split` die Tokens als Liste zurück.
* Die Token jeder Zeile werden für die weitere Verwendung in die Variablen `account`, `name` und `balance` entpackt.

### Datei-Methode: *read*

In [8]:
with open('accounts.txt', mode='r') as accounts:
    str = accounts.read()
print(str)

100 Jones 24.98
200 Doe 345.67
300 White 0.00
400 Stone -42.16
500 Rich 224.62



In [7]:
str

'100 Jones 24.98\n200 Doe 345.67\n300 White 0.00\n400 Stone -42.16\n500 Rich 224.62\n'

* Die Methode **`read`** list die _gesamte_ Textdatei und gibt einen String zurück.
* Dies funktioniert bei kleinen Dateien gut, sollte aber bei grossen Dateien vermieden werden. Dann ist es effizienter Zeile für Zeile einzulesen, wie oben gezeigt.

### Datei-Methode *readlines* 

In [17]:
with open('accounts.txt', 'r') as accounts:
    content = accounts.readlines()

content

['100 Jones 24.98\n',
 '200 Doe 345.67\n',
 '300 White 0.00\n',
 '400 Stone -42.16\n',
 '500 Rich 224.62\n']

In [18]:
content[0]

'100 Jones 24.98\n'

* Die Methode **`readlines`** kann zum **Lesen einer _gesamten_ Textdatei** verwendet werden. Sie gibt jede Zeile in einer **Liste von Strings** zurück.
* `readlines` sollte nur für kleine Dateien angewendet werden. Für grosse Dateien ist die Iteration über die Zeilen in einem Dateiobjekt vorzuziehen.

### Datei-Methode *seek* 

> Statt 0, 1, 2 bietet das `os`-Model die Konstanten `os.SEEK_SET` (0, *absolute file positioning*), `os.SEEK_CUR` (1, *seek relative to the current position*) und `os.SEEK_END` (2, *relative to the file’s end*) an.

In [23]:
with open('accounts.txt') as accounts:
    print(accounts.readlines())
    print()
    
    # To process the content again, set the
    # file position pointer to the beginning of the file
    accounts.seek(0)
    
    for record in accounts:
        print(record, end='')
        print(record.split())
        print()

['100 Jones 24.98\n', '200 Doe 345.67\n', '300 White 0.00\n', '400 Stone -42.16\n', '500 Rich 224.62\n']

100 Jones 24.98
['100', 'Jones', '24.98']

200 Doe 345.67
['200', 'Doe', '345.67']

300 White 0.00
['300', 'White', '0.00']

400 Stone -42.16
['400', 'Stone', '-42.16']

500 Rich 224.62
['500', 'Rich', '224.62']



In [19]:
record

'500 Rich 224.62\n'

* Beim Durchlesen einer Datei verwaltet das System einen **Datei-Positionszeiger**, der die Position des nächsten zu lesenden Zeichens angibt.
* Um eine Datei während der Ausführung eines Programms _mehrmals_ von Anfang an sequentiell zu verarbeiten, müssen Sie den Datei-Positionszeiger an den Anfang der Datei setzen.
    * Das kann durch Schliessen und erneutes Öffnen der Datei geschehen, oder 
    * durch Aufruf der **`seek`**-Methode des Dateiobjekts, wie in 
        >```Python
        file_object.seek(0)
        ```
* Der letztere Ansatz ist schneller.