### Arbeiten mit Textfiles

Ein Textfile enthält Zeilen (Strings). Der Newline-Charater  `\n` markiert dabei das Zeilenende.

- Werden Zeilen in ein Textfile geschreiben, sollte jede Zeile mit `\n` enden.
  Andernfalls ist der geschriebene String Teil einer längeren Zeile.
- Wird eine Zeile gelesen, so ist das letzte Zeichen ein `\n` (ausser ev. bei der letzten Zeile).




Python stellt folgendes Konstrukt zur Bearbeitung von Files zur Verfügung:

```python
with open(<filename>, mode = <mode>) as f:
    <Anweisungen>
```
**Erläuterungen**:  `with  open(<filename>, mode = <mode>) as f:`  
öffnet/erstellt ein File und kreiert ein Fileobjekt, welches in der Variable  `f` gespeichert wird. **In jedem Fall**, nach Abarbeitung der `<Anweisungen>` 
oder falls  eines der `<Anweisungen>` einen Fehler verursacht,
wird das **File wieder geschlossen**.
    
- `<mode>`: `'r'`, `'w'` oder `'a'` (write, read, append, bez. Lesen, Überschreiben, Anhängen).
  
Das Fileobjekt `f` hat u.a. folgende Methoden:
  - `f.read() -> str`:
     gibt Inhalt des Files als String zurück
  - `f.readlines() -> list[str]`: 
    liest File zeilenweise, gibt Liste der Zeilen zurück
  - `f.write(text: str)`:
     schreibt `text` ins File
  - `f.writelines(lines: list[str])`:
    Schreibt alle Stings (Zeilen) aus `lines` ins File.
    Jeder Zeile sollte mit `\n` enden. Gleicher Effekt wie  
    ```python
    for line in lines:
        f.write(line)
    ```
 
Wurde ein File mit 
> `with open('some_file.txt', mode='r') as f:` 

zum Lesen geöffnet, so kann man wie folgt über die Zeilen iterieren.

```python
for line in f:
    <Anweisungen>

# gleicher Effekt wie
for line in f.readlines():
    <Anweisungen>
```
Code zum Lesen der Zeilen eines Files. Whitespace am rechten Ende der Zeile wird entfernt,
insbes. `'\n'`.
```python
with open('test.txt', mode='r') as f:
    lines = [line.rstrip() for line in f]
```

In [None]:
# Zeilen ohne \n am Ende
lines = ['1. Zeile', '2. Zeile']
print(''.join(lines))

In [None]:
# File schreiben, File hat nur eine Zeile
with open('text.txt', 'w') as f:
    f.writelines(lines)

In [None]:
lines_with_newlines = [line + '\n' for line in lines]
print(''.join(lines_with_newlines))

In [None]:
# File schreiben, File hat 2 Zeilen
with open('text.txt', 'w') as f:
    f.writelines(lines_with_newlines)

***
**Lesen/Schreiben**: Alles auf einmal 
***

In [None]:
# File erstellen/ueberschreiben
text = '''\
1. Zeile
2. Zeile
'''
with open('test.txt', mode='w') as f:
    f.write(text)

In [None]:
# an File anhaengen
more_text = '''\
3. blabla
4. blabla
'''

with open('test.txt', mode='a') as f:
    f.write(more_text)

In [None]:
# File lesen
with open('test.txt', mode='r') as f:
    text = f.read()
print(text)

***
**Zeilenweise lesen/schreiben**: 
***

In [None]:
lines = (text + more_text).splitlines(keepends=True)
lines

In [None]:
with open('test.txt', mode='w') as f:
    f.writelines(lines)

In [None]:
with open('test.txt', mode='r') as f:
    lines = f.readlines()
lines

In [None]:
with open('test.txt', mode='w') as f:
    for line in lines:
        f.write(line)

In [None]:
with open('test.txt', mode='r') as f:
    lines = f.readlines()
lines

In [None]:
lines = []
with open('test.txt', mode='r') as f:
    for line in f:
        lines.append(line.rstrip())  # entferne '\n'
lines

***
**Meistens die richtige Wahl**:
***

In [None]:
with open('test.txt', mode='r') as f:
    lines = [line.rstrip() for line in f]

### Anwendungsbeispiel
Das File `superleague21_22.txt` enthält die Abschlusstabelle der Fussball Super League 2021/2022.

- Zeilen die mit `#` sind Kommentare.
- Die anderen Zeilen bestehen aus Komma-separierten Werten,
  umgebender Space gehört nicht zum Wert.
- Die erste Zeile, die kein Kommentar ist, enthält die Spaltenheaders.

Ziel ist es, die Abschlusstabelle aus dem File zu lesen und formatiert auszugeben.

**Lesen und putzen der Daten**:
- File im *read-mode* öffnen.
- Über die Zeilen des Files iterieren, dabei mit `#` beginnende Zeilen   ignorieren. Die anderen Zeilen beim Komma in eine Liste trennen und die Strings in der Liste von umgebendem Space befreien.  
  
**Formatiertes Ausgeben der Daten**:

- Hilfsfunktion `max_colwidth(table, i)` bereitstellen, die
  die maximale Länge der Einträge in der `i`-ten Spalte zurückgibt.
- Spalteneinträge zu links- bez. rechtsbündigen Strings passender Länge machen. Benutze die String-Methoden `ljust` und `rjust`.

In [None]:
fn = 'superleague21_22.txt'
sep = ','
comment = '#'


with open(fn, mode='r') as f:
    lines = [line.rstrip() for line in f]

lines[:3]

In [None]:
table = []
for line in lines:
    if line.startswith(comment):
        continue
    row = line.split(sep)
    row = [item.strip() for item in row]
    table.append(row)
table

In [None]:
def max_colwidth(table, i):
    return max(len(row[i]) for row in table)

In [None]:
n_cols = len(table[0])  # Anzahl Spalten
col_widths = [max_colwidth(table, i) for i in range(n_cols)]
col_widths

In [None]:
alignments = 'lrrrrrrr'

for row in table:
    line = ''
    for text, aligment, width in zip(row, alignments, col_widths):
        width = width + 1
        if aligment == 'l':
            text = text.ljust(width)
        elif aligment == 'r':
            text = text.rjust(width)
        line = line + text
    print(line)

### Aufgaben  
Importiere das Tuple `names` aus dem Modul `examples`.
1. Schreibe alle Namen aus `names` in ein File mit einer einzigen Zeile.
Die Namen sollen nur mit einem Komma getrennt sein.
2. Lies nun alle Namen aus diesem Files in eine Liste. Verwandle die Liste in ein Tuple und
   prüfe, dass das Tuple gleich dem ursprünglichen Tuple `names` ist.
3. Schreibe nun alle Namen aus `names` in ein anderes File, diesmal mit genau einem Namen pro Zeile.
4. Lies wieder alle Namen aus diesem Files in ein Tuple und
   prüfe, dass das Tuple gleich dem ursprünglichen Tuple `names` ist.

In [None]:
from examples import names


type(names), len(names)