### Programmieren mit Python

## Datei-Ein- und Ausgabe

#### Path

### Path – repräsentiert Pfade / Dateinamen

`Path` aus dem Modul `pathlib` ist die empfohlene Methode, Datei- und Verzeichnisnamen zu repräsentieren:

In [15]:
from pathlib import Path
roman = Path('roman.txt')    # Datei "Roman.txt" im aktuellen Verzeichnis
roman, roman.absolute()

(PosixPath('roman.txt'),
 PosixPath('/home/tv/Documents/OwnCloud/Uni/Lehre/Python1-neu/roman.txt'))

In [16]:
Path.cwd(), Path.home()  # das Current Working Directory / aktuelle Verzeichnis; Homeverzeichnis

(PosixPath('/home/tv/Documents/OwnCloud/Uni/Lehre/Python1-neu'),
 PosixPath('/home/tv'))

Path hat viele Attribute und Methoden, die Informationen über den Pfad oder die dahinterstehende Datei zurückgeben:

In [33]:
fullpath = roman.absolute()
print(fullpath.parent, fullpath.name, fullpath.stem, fullpath.suffix)

/home/tv/Documents/OwnCloud/Uni/Lehre/Python1-neu roman.txt roman .txt


In [40]:
print(roman.exists(), roman.stat())

True os.stat_result(st_mode=33188, st_ino=37372253, st_dev=66306, st_nlink=1, st_uid=1000, st_gid=1000, st_size=145, st_atime=1574950466, st_mtime=1573552879, st_ctime=1573552879)


`Path` hat unterschiedliche, betriebssystemübergreifende Methoden, Pfade zusammenzusetzen:

In [10]:
output = output_folder / 'blubb.txt'
output

PosixPath('output/blubb.txt')

In [45]:
Path('foo', 'bar', 'baz.txt')

PosixPath('foo/bar/baz.txt')

In [47]:
output_folder.joinpath('blubb.txt')

PosixPath('output/blubb.txt')

In [48]:
roman.with_suffix('.csv')

PosixPath('roman.csv')

`Path` macht auf jedem Betriebssystem das richtige. Setzen Sie Pfade __nie__ mit `ordner + "\\" + name` oder so zusammen, das geht nur auf Windows!

Um in eine Datei zu schreiben oder daraus zu lesen, muss man sie öffnen. Auch das unterstützt `Path`:

In [42]:
with roman.open('rt', encoding='utf-8') as file:
    print(file)         #   file ist ein Dateiobjekt, über das iteriert werden kann
    for line in file:
        print('| ', line[:-1])

<_io.TextIOWrapper name='roman.txt' mode='rt' encoding='utf-8'>
|  Kurzer Roman.
|  Dies ist ein langer Roman. Er beginnt mit dem Auftritt des Heldens. 
|  Da es keine Helden gibt, unterbricht hier schon der Leser …


Eine mit `open` bzw. `Path.open` geöffnete Datei muss immer geschlossen werden. `with` macht das automatisch am Blockende, sonst `file.close()` aufrufen.

### Programmieren mit Python

## Funktionen

Vertiefung / Wiederholung

### Funktionen: Funktion

* Don’t repeat yourself: Mehrfach benutzten Code nur einmal schreiben
* Strukturierung von Programmen
* Klar getrennte Funktionalität

### Funktionen: Beispiel

Die `sum`-Funktion implementiert eine Summe ($\sum$). Schreiben wir dasselbe für ein Produkt.

In [49]:
help(sum)

Help on built-in function sum in module builtins:

sum(iterable, start=0, /)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.



In [50]:
# Schlüsselwort 'def'
# |     ,-- Funktionsname
# ↓    ↓      ,-- Parameter ,-- Standardwert, falls Parameter fehlt
def product(iterable, start=1):
    """
    Returns the product of a 'start' value (default: 1) and an iterable of numbers.
    """
    result = start
    for factor in iterable:
        result = result * factor
    return result

In [51]:
prod = product([5, 6, 7, 8])
print(prod)

1680


### Übung

Zerlegen Sie den folgenden Code (auch in WueCampus als Python-Datei) sinnvoll in Funktionen. Die Funktionen sollten einen Wert berechnen, schreiben Sie davon getrennt eine Funktion `main()`, die die Textausgaben enthält und die Funktionen aufruft.

Tip: PyCharm-Refactoring-Funktionen _rename_ und _extract method_

In [52]:
s = "Herr Mustermann kommt ins Haus und trifft dort Frau Musterfrau"
sum_wordlength = 0
for w in s.split():
    sum_wordlength += len(w)
avg_wordlength = sum_wordlength / len(s.split())
print("Durchschnittliche Wortlänge: ", avg_wordlength )
list_vowels = []
for w in s.lower().split():
    word_vowels = 0
    for c in w:
        if c in "aeiou":
            word_vowels += 1
    list_vowels.append(word_vowels)
print("Durchschnittliche Vokalanzahl: ", sum(list_vowels) / len(list_vowels))
list_consonants = []
for w in s.lower().split():
    word_cons = 0
    for c in w:
        if c in "bcdfghjklmnpqrstvwxyz":
            word_cons += 1
    list_consonants.append(word_cons)
print("Durchschnittliche Konsonantenanzahl: ", sum(list_consonants) / len(list_consonants))

Durchschnittliche Wortlänge:  5.3
Durchschnittliche Vokalanzahl:  1.7
Durchschnittliche Konsonantenanzahl:  3.6


### Globale und lokale Variablen

### Lokale Variablen

Variablen, die in Funktionen definiert werden, sind nur innerhalb der Funktion sichtbar:

In [53]:
def number_of_words(text):
    words = text.split()
    return len(words)

print(number_of_words("Ein Test"))
print(words)

2


NameError: name 'words' is not defined

### Globale Variablen

Funktionen außerhalb der Funktionen sind auch innerhalb der Funktionen sichtbar:

In [54]:
debugging = True

def number_of_words(text):
    words = text.split()
    if debugging:
        print("DEBUG:", words)
    return len(words)

print(number_of_words('Ein kleiner Test'))

DEBUG: ['Ein', 'kleiner', 'Test']
3


### ACHTUNG: _irgendwo_ in der Funktion zugewiesen → lokale Variable

In [55]:
debugging = True

def number_of_words(text):
    words = text.split()
    if debugging:
        print("DEBUG:", words)
        debugging = False       # ← macht debugging zu einer lokalen Variable!
    return len(words)

print(number_of_words('Ein kleiner Test'))

UnboundLocalError: local variable 'debugging' referenced before assignment

### Achtung – Übergabe _by reference_

In [56]:
def upper_all(items):
    for i in range(len(items)):
        items[i] = items[i].upper()
    return items

In [57]:
tokens = 'Hallo Welt!'.split()
upcased = upper_all(tokens)
print(upcased)

['HALLO', 'WELT!']


In [58]:
print(tokens)

['HALLO', 'WELT!']


### Aufruf per Keyword-Parameter

Bei einer normalen Funktion kann man die Parameter über ihre Position oder über ihren Namen übergeben:

In [59]:
def product(iterable, start=1):
    result = start
    for factor in iterable:
        result = result * factor
    return result

In [63]:
print(product([1,2,3], 0.1))                       # 2× positional
print(product([1,2,3], start=0.1))                 # positional, keyword (positionale immer zuerst!)
print(product(iterable=[1,2,3], start=0.1))        # 2× keyword
print(product(start=0.1, iterable=[1,2,3]))        # keyword: Reihenfolge egal
print(product(iterable=[1,2,3]))                   # Defaultwerte kann man weglassen

0.6000000000000001
0.6000000000000001
0.6000000000000001
0.6000000000000001
6


#### Exkurs: Positional- und Keyword Only

In [64]:
help(sum)

Help on built-in function sum in module builtins:

sum(iterable, start=0, /)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.



In [65]:
sum([1,2,3], start=5)

TypeError: sum() takes no keyword arguments

Ab Python 3.8 geht das auch für eigene Funktionen:

```python
#        --nur pos.-- -wahlfrei--  --nur keyword--
def demo(pos1, pos2, /, egal=0, *, keyword='only'):
    print(pos1, pos2, egal, keyword)
```

### Variable Parameterlisten

* `print` z.B. nimmt beliebig viele positionale Parameter
* manche Funktionen erlauben beliebige Keyword-Parameter, oder solche, die sie nur weiterreichen

In [68]:
def log(label, *args, extra_out=None, **kwargs):.
    print(label, *args, **kwargs)
    if extra_out:
        extra_out.write(label + ":" + " ".join([str(arg) for arg in args]))

In [69]:
with open("log.txt", "wt") as logfile:
    log('INFO', 'Ein mal eins ist', 1*1, sep='=', extra_out=logfile)

INFO=Ein mal eins ist=1


* `*args` → `args` ist eine Liste
* `**kwargs` → `kwargs` ist ein Dictionary

Das geht auch umgekehrt:

In [75]:
breadcrumbs = Path.cwd().parts
print(breadcrumbs)                 # ein Tupel, könnte irgendein Iterable sein
print(*breadcrumbs, sep=' 〉 ')     # *breadcrumbs = jedes Element von breadcrumbs sei ein Parameter

('/', 'home', 'tv', 'Documents', 'OwnCloud', 'Uni', 'Lehre', 'Python1-neu')
/ 〉 home 〉 tv 〉 Documents 〉 OwnCloud 〉 Uni 〉 Lehre 〉 Python1-neu


### Funktionen als Objekte erster Klasse

* Die Funktionsklammern dienen dem Aufruf: `print()` ruft die Funktion auf.
* _Ohne_ Funktionsklammern bekommt man die Funktion als Objekt in die Hand:

In [76]:
print

<function print>

In [78]:
print.__doc__     # Attribut aufrufen

"print(value, ..., sep=' ', end='\\n', file=sys.stdout, flush=False)\n\nPrints the values to a stream, or to sys.stdout by default.\nOptional keyword arguments:\nfile:  a file-like object (stream); defaults to the current sys.stdout.\nsep:   string inserted between values, default a space.\nend:   string appended after the last value, default a newline.\nflush: whether to forcibly flush the stream."

* Manchmal will man Funktionen andere Funktionen übergeben:

In [79]:
help(sorted)

Help on built-in function sorted in module builtins:

sorted(iterable, /, *, key=None, reverse=False)
    Return a new list containing all items from the iterable in ascending order.
    
    A custom key function can be supplied to customize the sort order, and the
    reverse flag can be set to request the result in descending order.



In [83]:
namen = ['Scheuer', 'Seehofer', 'Leutheuser-Schnarrenberger', 'Roth', 'Dağdelen', 'Alt']
print(sorted(namen, key=len))
#                        `---- Name der Funktion len – ohne Aufrufklammern! → Funktion übergeben

['Alt', 'Roth', 'Scheuer', 'Seehofer', 'Dağdelen', 'Leutheuser-Schnarrenberger']


### Übung

Sortieren Sie die ersten 100 Wörter von Effi Briest nach der Anzahl der Vokale.