### Arbeiten mit Textfiles

Ein Textfile enth&auml;lt Zeilen (Strings). Der Newline-Charater  `\n` markiert dabei das Zeilenende.

- Werden Zeilen in ein Textfile geschreiben, sollte jede Zeile mit `\n` enden.
  Andernfalls ist der geschriebene String Teil einer l&auml;ngeren Zeile.
- Wird eine Zeile gelesen, so ist das letzte Zeichen ein `\n` (ausser ev. bei der letzten Zeile).




Python stellt folgendes Konstrukt zur Bearbeitung von Files zur Verf&uuml;gung:

```python
with open(<filename>, mode = <mode>) as f:
    <Anweisungen>
```
**Erl&auml;uterungen**:  `with  open(<filename>, mode = <mode>) as f:`  
&ouml;ffnet/erstellt ein File und kreiert ein Fileobjekt, welches in der Variable  `f` gespeichert wird. **In jedem Fall**, nach Abarbeitung der `<Anweisungen>` 
oder falls  eines der `<Anweisungen>` einen Fehler verursacht,
wird das **File wieder geschlossen**.
    
- `<mode>`: **'w'**, **'r'** oder **'a'** (write, read, append)  
i.e. ((&uuml;ber)schreiben, lesen, anh&auml;ngen)
  
Das Fileobjekt `f` hat u.a. folgende Methoden:
  - `f.read() -> str`:
     gibt Inhalt des Files als String zur&uuml;ck
  - `f.readlines() -> list[str]`: 
    liest File zeilenweise
  - `f.write(text: str)`:
     schreibt `text` in File
  - `f.writelines(lines: list[str])`:
    jeder String in `lines` sollte mit `\n` enden. Gleicher Effekt wie  
    ```python
    for line in lines:
        f.write(line)
    ```
 
Wurde ein File mit 
> `with open('some_file.txt', mode='r') as f:` 

zum Lesen ge&ouml;ffnet, so kann man ie folgt 
&uuml;ber die Zeilen (Strings) des Fileobjekts `f` iterieren.

```python
for line in f:
    <Anweisungen>

# gleicher Effekt wie
for line in f.readlines():
    <Anweisungen>
```

In [None]:
# Zeilen ohne \n am Ende
lines = ['1. Zeile', '2.Zeile']
len(lines), lines

In [None]:
# File schreiben
with open('text.txt', 'w') as f:
    f.writelines(lines)

In [None]:
# File enthaelt nur 1 Zeile
with open('text.txt', 'r') as f:
    lines = f.readlines()
len(lines), lines

***
**Lesen/Schreiben**: Alles auf einmal 
***

In [None]:
# File erstellen/ueberschreiben
text = '''\
1. Zeile
2. Zeile\
'''
with open('test.txt', mode='w') as f:
    f.write(text)

In [None]:
# an File anhaengen
more_text = '''\
blabla
blabla
'''

with open('test.txt', mode='a') as f:
    f.write(more_text)

In [None]:
# File lesen
with open('test.txt', mode='r') as f:
    content = f.read()
content

***
**Zeilenweise Lesen/Schreiben**: 
***

In [None]:
lines = (text + more_text).split('\n')
lines = [line + '\n' for line in lines]
with open('test.txt', mode='w') as f:
    f.writelines(lines)

In [None]:
with open('test.txt', mode='r') as f:
    lines = f.readlines()
lines

***
**&uuml;ber Zeilen des Files iterieren**: 
***

In [None]:
with open('test.txt', mode='r') as f:
    lines = []
    for line in f:
        lines.append(line.strip())
lines

### Anwendungsbeispiel
Das File `superleague21_22.txt` enth&auml;lt die Abschlusstabelle der Fussball Super League 2021/2022.

- Zeilen die mit `#` sind Kommentare.
- Die anderen Zeilen bestehen aus Komma-separierten Strings,
  umgebender Space geh&ouml;rt nicht zum String.
- Die erste Zeile, die kein Kommentar ist, enth&auml;lt die Spaltenheaders.

Ziel ist es, die Abschlusstabelle aus dem File zu lesen und formatiert auszugeben.

**Lesen und putzen der Daten**:
- File im *read-mode* &ouml;ffnen.
- &Uuml;ber die Zeilen des Files iterieren, dabei mit `#` beginnende Zeilen   ignorieren. Die anderen Zeilen beim Komma in eine Liste trennen und die Strings in der Liste von umgebendem Space befreien.  
  
**Formatiertes Ausgeben der Daten**:

- Hilfsfunktion `max_colwidth(rows, col)` bereitstellen, die
  die maximale L&auml;nge der Strings in der Spalte `col` zur&uuml;ckgibt.
- Platzhalterstring mit Formatierung erstellen.
  Die ersten beiden Spalten sollen linksb&uuml;ndig, die andern rechstb&uuml;ndig
  ausgegeben werden. Aus
  ```python
  
  alignments = '<<>>>>>>'
  col_widths = [10, 3, 2, 2, 2, 5, 5, 3]  # berechnet mit max_colwidth
  ```
  <br>
  
  erstellen wir dann den Platzhalterstring  
  `'{:<11}{:<4}{:>3}{:>3}{:>3}{:>6}{:>6}{:>4}'`,  
  den wir zur Ausgabe der Zeilen nutzen.

In [None]:
path = '/home/studi/work/data/'
fn = path + 'superleague21_22.txt'
sep = ','
comment = '#'

with open(fn, mode='r') as f:
    rows = []
    for line in f:
        if line.startswith(comment):
            continue
        row = line.split(sep)
        row = [item.strip() for item in row]
        rows.append(row)
rows

In [None]:
def max_colwidth(rows, col):
    return max(len(row[col]) for row in rows)

In [None]:
ncols = len(rows[0])  # Anzahl Spalten
col_widths = [max_colwidth(rows, i) for i in range(ncols)]
col_widths

In [None]:
alignments = '<<>>>>>>'
fstring = ''
for i, a in zip(col_widths, alignments):
    fstring += '{:' + a + str(i+1) + '}'
fstring

In [None]:
for row in rows:
    print(fstring.format(*row))

### Aufgaben  
1. Schreibe mit `writelines` Zeilen in ein File. Manche Zeilen enden mit `\n`, manche nicht. Inspiziere das geschriebene File. Lies dann die Zeilen dieses Files mit `readlines`. Wieviele Zeilen werden gelesen? Wieviele geschreiben? Wie h&auml;ngt das mit den Zeilenenden zusammen?
2. Schreibe die Zeilen `lines = ['1.Zeile', '2.Zeile']` in ein File, so dass
   das File tats&auml;chlich 2 Zeilen enth&auml;lt.