### Einführung in das Programmieren mit Python
## Semesterabschluss

* Begriff "Keyword-Argument"
* Globale und lokale <del>Parameter</del><ins>Variablen</ins>
* Einlesen von Dateipfaden?
* Kommandozeile & Modulsuchpfad
* Installieren externer Module

### Funktionsparameter

* Funktionen haben Parameter / Argumente:

In [25]:
def read_words(filename, encoding):
    with open(filename, "r", encoding=encoding) as file:
        return file.read().split()

Diese Funktion hat zwei normale, verpflichtende Parameter. Jeder dieser Parameter hat einen __Namen__ und eine __Position__: 
* 0: filename
* 1: encoding

Wird die Funktion aufgerufen, so werden konkrete Werte für diese Parameter übergeben, die innerhalb der Funktion über Variablennamen zugegriffen werden können. Welcher Wert an welchen Parameter gebunden wird, hängt normalerweise von der Position ab:

```python
# def read_words(filename,    encoding)
      read_words("roman.txt", "UTF-8")
```

Man kann das aber auch explizit machen, indem man die Namen der Parameter angibt. Man spricht dann von __Keyword-Argumenten__, die Parameternamen sind die Keywords, und die Reihenfolge dann egal:

```python
read_words(encoding="UTF-8", filename="roman.txt")
```

#### Default-Argumente

Man kann bei der Definition einer Funktion Argumenten default-Werte mitgeben:

In [26]:
def read_words(filename, sep=" ", encoding="UTF-8"):
    with open(filename, "rt", encoding=encoding) as file:
        return file.read().split(sep)

Beim Aufruf können alle Parameter, die Defaultwerte haben, weggelassen werden. Alle folgenden Zeilen sind gültige Aufrufe der o.a. Funktion:

```python
read_words("roman.txt")
read_words("roman.txt", "\n")
read_words("roman.txt", "\n", "cp1252")
read_words("roman.txt", encoding="cp1252")
read_words("roman.txt", encoding="cp1252", sep="\n")
read_words(sep="\n", filename="roman.txt")
```

#### Flexible Argumentlisten

Es ist möglich, flexible Argumentlisten zu verwenden, sowohl für _positionale_ als auch für _keyword_-Argumente. Ein Beispiel ist die Ihnen bekannte `print`-Funktion:

In [27]:
import sys
def print(*args, sep=' ', end='\n', file=sys.stdout, flush=False):
    strings = []
    __builtin__.print(args)
    for arg in args:
        strings.append(str(arg))
    file.write(sep.join(strings) + end)
    if flush:
        file.flush()
        
# Aufruf z.B.:
print("Hallo", 42)

('Hallo', 42)
Hallo 42


In [28]:
print("Bla", 43.0, True, "Blubb")

('Bla', 43.0, True, 'Blubb')
Bla 43.0 True Blubb


Da durch das `*args` beliebig viele positionale Parameter möglich sind (die in der Funktion im Tupel `args` zur Verfügung stehen), _müssen_ alle weiteren Parameter beim Aufruf als Keyword-Parameter angegeben werden!

#### Flexible Keyword-Parameter

In [29]:
def write_with_header(body, file=sys.stdout, **kwargs):
    print(kwargs)
    for key in kwargs:
        file.write(key + ": " + kwargs[key] + "\n")
    file.write("\n")
    file.write(body)
    
write_with_header("Hallo Alice,\n\nbitte schick mir doch das Kirschkuchenrezept.",
                 From="Holly", From='Bob', To='Alice', Subject='Mjam')

SyntaxError: keyword argument repeated (<ipython-input-29-70aa38fa10a8>, line 9)

Analog zu `*args` ist auch `**kwargs` möglich. Dahinein werden alle per Keyword angegebenen Parameter gesammelt, die _nicht_ in der Funktionsdefinition (`def`) deklariert worden sind.

`**` ist syntax, `kwargs` Konvention, die Funktion oben hätte auch definiert sein können als

```python
def write_with_header(body, file=sys.stdout, **header)
```

Mit Verwendung derselben Syntax kann man Argumentlisten auch weitergeben:

In [30]:
def print_happy(*args, **kwargs):
    """Wie Print, nur fröhlich. Selbe Argumente verwenden."""
    print("☺", *args, **kwargs)

In [31]:
print_happy("Hallo", 23, end="!!!\n")

('☺', 'Hallo', 23)
☺ Hallo 23!!!


### Globale und Lokale Variablen

Variablen können prinzipiell an zwei Stellen erzeugt werden:
* in einer Funktion → lokale Variablen → nur in der Funktion sichtbar
* außerhalb einer Funktion → globale Variablen → überall sichtbar

Funktionsparameter verhalten sich wie lokale Variablen.

Entscheidend ist, wo die Variable _zugewiesen_ wird. Beispiele:

In [32]:
def concat(*args):
    s = ""
    for arg in args:
        s = s + arg
    return s

concat("Foo", "Bar")
print(s)

NameError: name 's' is not defined

In [33]:
options = { 'verbose': True, 'write_to_file': 'foo.txt'}

def add(n1, n2):
    if options['verbose']:
        print("Ich soll jetzt ", n1, " und ", n2, "addieren")
    return n1 + n2

add(23, 42)
options

('Ich soll jetzt ', 23, ' und ', 42, 'addieren')
Ich soll jetzt  23  und  42 addieren


{'verbose': True, 'write_to_file': 'foo.txt'}

In [34]:
x = 4
def f(x):
    x = x+1
    return x
f(x+1)
print(x)

(4,)
4


In [35]:
x = 4
def f(y):
    y = x+y
    return y
print(f(2))

(6,)
6


In [36]:
def f(y):
    global x
    x = x+y
    return x
print(f(x))

(8,)
8


In [37]:
def f(x):
    def g(y):
        return x*y
    return g(x+1)

f(5)

30

In [38]:
x

8

### Einlesen von Verzeichnisstrukturen

Die Standardbibliothek hält zahlreiche Funktionen für den Umgang mit Dateien und Verzeichnissen bereit:

* Modul [os](https://docs.python.org/3/library/os.html) für typische Betriebssystemfunktionen
* Modul [os.path](https://docs.python.org/3/library/os.path.html) für den Umgang mit Datei- und Verzeichnisnamen
* Modul [shutil](https://docs.python.org/3/library/shutil.html) für Dateioperationen auf höherer Abstraktionsebene, z.B. Kopieren
* Modul [glob](https://docs.python.org/3/library/glob.html) zum Evalueren von _shell glob patterns_ wie z.B. `*.txt`

In [39]:
import os

os.getcwd()

'/home/tv/git/python_intro_2016'

`os.listdir(path)` listet die Namen aller Einträge des durch `path` angegebenen Verzeichnisses auf:

In [40]:
print(os.listdir('images'))

(['anweisung.png', 'assign1.svg', 'assign2.svg', 'assign3.svg', 'dh_titel.png', 'dict1.png', 'for_loop_simple.png', 'ide1.png', 'ide2.png', 'ide3.png', 'ide4.png', 'ide5.png', 'ide6.png', 'if_else.png', 'if_simple.png', 'indent.svg', 'inheritance-task.png', 'inheritance.png', 'liste1.png', 'liste2.png', 'loop.png', 'modules.png', 'print-anweisung.svg', 're-uebersicht.svg', 'reference.png', 'scope.png', 'spyder-argv.png', 'spyder_debugging.png', 'tkinter_grid.png', 'utf-8_file.png', 'zuweisung-detail.svg', 'pythontutor-list.png', 'functioncall.svg'],)
['anweisung.png', 'assign1.svg', 'assign2.svg', 'assign3.svg', 'dh_titel.png', 'dict1.png', 'for_loop_simple.png', 'ide1.png', 'ide2.png', 'ide3.png', 'ide4.png', 'ide5.png', 'ide6.png', 'if_else.png', 'if_simple.png', 'indent.svg', 'inheritance-task.png', 'inheritance.png', 'liste1.png', 'liste2.png', 'loop.png', 'modules.png', 'print-anweisung.svg', 're-uebersicht.svg', 'reference.png', 'scope.png', 'spyder-argv.png', 'spyder_debugging.p

Wenn man damit was machen will, muss man `path` mit jedem Eintrag zusammenkleben. Das geht z.B. mit os.path.join(…)

In [41]:
os.path.sep

'/'

In [42]:
os.path.join(os.getcwd(), 'bla', 'fasel', 'blubb')

'/home/tv/git/python_intro_2016/bla/fasel/blubb'

In [43]:
folder = 'tg1'
for file in os.listdir(folder):
    fullpath = os.path.join(folder, file)
    if os.path.isdir(fullpath):
        filetype = '[FOLDER]'
    else:
        filetype = '[FILE]  '
    print(filetype, file, fullpath, sep='\t')

FileNotFoundError: [Errno 2] No such file or directory: 'tg1'

Will man alle Unterverzeichnisse behandeln, so steigt man rekursiv ab.

```
tg1
├── tg2.txt
├── tg3
│   ├── tg134
│   │   ├── tg135.txt
│   │   ├── tg136.txt
.   .   .   ...
│   │   ├── tg172.txt
│   │   ├── tg173
│   │   │   ├── tg174.txt
│   │   │   ├── tg175.txt
│   │   │   ├── tg176.txt
│   │   │   ├── tg177.txt
│   │   │   ├── tg178.txt
│   │   │   └── tg179.txt
.   .   .   .............

```

In [44]:
def list_recursively(folder, level=0):
    for file in os.listdir(folder):
        fullpath = os.path.join(folder, file)
        if os.path.isdir(fullpath):
            print(' '*level + '[FOLDER]', file, fullpath, sep='\t')
            list_recursively(fullpath, level+1)  #### <===
        else:
            print(' '*level + '[FILE]  ', file, fullpath, sep='\t')
list_recursively('tg1')

FileNotFoundError: [Errno 2] No such file or directory: 'tg1'

In [45]:
import re
m = re.match(r'(\S+): (.*)', 'Title: Mein Lebensabend')
m.group(2)

'Mein Lebensabend'

In [46]:
from glob import glob
glob('images/*.svg')

['images/assign1.svg',
 'images/assign2.svg',
 'images/assign3.svg',
 'images/indent.svg',
 'images/print-anweisung.svg',
 'images/re-uebersicht.svg',
 'images/zuweisung-detail.svg',
 'images/functioncall.svg']

### Kommandozeile

* Computer-Grundkompetenz für DH-Studierende

* es gibt immer ein aktuelles Verzeichnis. 
    * Linux/MacOS: Anzeigen mit `pwd`, wechseln mit `cd neuer/pfad`
    * Windows: Anzeigen mit `cd`, wechseln mit `cd neuer\pfad`
* __Kommandos__ bestehen aus einem oder mehreren Wörtern, durch Leerzeichen getrennt, ggf. mit " " umschlossen.
* Erstes Wort: Befehl, z.B. Programm. Folgende Wörter: Argumente, werden vom Programm interpretiert.
#### Umgebungsvariablen
* _Umgebungsvariablen_ enthalten Werte, die allen Programmen zur Verfügung stehen, z.B. `$PATH` (bzw. `%PATH%` auf Windows). Tippen Sie `set`
* Umgebungvariablen vererben sich an gestartete Prozesse
* Wichtige Umgebungsvariablen:
   * `PATH` (`%PATH%` (Windows) bzw. `$PATH` (sonst)) enthält die Verzeichnisse, in denen das OS nach Programmen sucht.
   * `PYTHONHOME` ggf. Grundverzeichnis von Python
   * `PYTHONPATH` Modul-Suchverzeichnisse von Python

### Starten von Python-Programmen an der Kommandozeile

`python meinscript.py argumente argumente`

### Benutzen der Kommandozeilenargumente

In [47]:
import sys
print(sys.argv)

(['/home/tv/.virtualenvs/jupyter/lib/python3.5/site-packages/ipykernel/__main__.py', '-f', '/run/user/1000/jupyter/kernel-d7960b55-1169-4c46-81e8-6b72f4a21aaa.json'],)
['/home/tv/.virtualenvs/jupyter/lib/python3.5/site-packages/ipykernel/__main__.py', '-f', '/run/user/1000/jupyter/kernel-d7960b55-1169-4c46-81e8-6b72f4a21aaa.json']


* `sys.argv[0]` ist der Name des Programms
* `sys.argv[1:]` sind die Argumente

z.B. [argparse](https://docs.python.org/3/library/argparse.html) hilft beim Verarbeiten komplexer Argumentstrukturen

### Standardein-, ausgabe, Standardfehler

`ls` listet Verzeichnisinhalte, `wc -l` zählt Zeilen → zähle Dateien
```bash
ls > ls.txt     # Führe ls aus, schreibe die Ausgabe von ls nach ls.txt
wc -l < ls.txt  # Führe wc -l aus, als Eingabe soll ls.txt verwendet werden
ls | wc -l      # Führe ls aus, die Ausgabe von ls soll die Eingabe von wc -l sein.
```

In Python:

* `sys.stdin` ist eine bereits geöffnete Datei, die die Eingabe repräsentiert.
* `sys.stdout` ist eine bereits geöffnete Datei, die die Eingabe repräsentiert.
* `sys.stderr` ist eine weitere bereits geöffnete Datei, die die Eingabe repräsentiert.

Alle diese Dateien sind normalerweise mit der Konsole verknüpft. stdin wird an der Kommandozeile durch `< dateiname` umgeleitet, stdout durch `> dateiname`. Mit `kommando1 | kommando2` werden stdout von kommando1 mit stdin von kommando2 verbunden.

### Modulsuchpfad

In [48]:
sys.path

['',
 '/home/tv/git/pydelta.2015',
 '/home/tv/.virtualenvs/jupyter/lib/python35.zip',
 '/home/tv/.virtualenvs/jupyter/lib/python3.5',
 '/home/tv/.virtualenvs/jupyter/lib/python3.5/plat-x86_64-linux-gnu',
 '/home/tv/.virtualenvs/jupyter/lib/python3.5/lib-dynload',
 '/usr/lib/python3.5',
 '/usr/lib/python3.5/plat-x86_64-linux-gnu',
 '/home/tv/.virtualenvs/jupyter/lib/python3.5/site-packages',
 '/home/tv/.virtualenvs/jupyter/lib/python3.5/site-packages/IPython/extensions',
 '/home/tv/.ipython']

Wird beim Start von Python durch das `site`-Modul bevölkert

### Installation von Paketen

Das Kommandozeilenprogramm `pip` installiert Pakete.

```bash
pip --help
pip install --help
pip install --user --upgrade regex
```
… das letzte Kommando installiert das Paket `regex`. Falls es schon installiert ist, wird es aktualisiert (`--upgrade` bzw. `-U`). Es wird in Ihr Benutzer-Modulverzeichnis installiert.

#### Übung

Installieren Sie das Paket `requests` in Ihr Benutzermodulverzeichnis. Vergleichen Sie die Ausgabe von `sys.path` vorher und nachher. Wohin wurde das Paket installiert?