## Einführung in das Programmieren mit Python
# Module

## Wiederholung: Funktionen

In [1]:
# +------------------------------------------------ def = Schlüsselwort Funktionsdefinition
# |    +------------------------------------------- Funktionsname
# |    |            ,---------------------,-------- Klammern für Argumentliste (auch ohne Argumente!)
# |    |           |  ,---------------------------- Argument/Parameter, verpflichtend
# |    |           |  |          ,----------------- Argument/Parameter, mit Standardwert 'None'
def avg_word_length(text, strip_chars=".,?!;"):
    """                                             (Docstring, beschreibt Funktion, help(avg_word_length))
    Returns the average length of the words in text. Whitespace will be stripped,
    if strip is not None, leading and trailing characters from strip_chars will be
    removed from each word, as well.
    """
    words = text.split()
    chars_in_words = 0
    for word in words:        
        word = word.strip(strip_chars)
        chars_in_words += len(word)
    return chars_in_words / len(words)               # return <ausdruck> gibt den Wert von <ausdruck> zurück, sonst None

satz = input("Satz: ")
print("Die Wörter in", satz, "sind durchschnittlich", 
      #    ,------------------------------------------- Funktionsname
      #    |          .----------------------------.--- Klammern = Funktionsaufruf
      #    |         |  .------------------------- | -- positionales Argument (Position -> text)
      #    |         |  |       .----------------- | -- keybord-Argument 
      avg_word_length(satz, strip_chars='!?.,;:()"'), 
      "Zeichen lang.")

Satz: Ottp Mops kotzt
Die Wörter in Ottp Mops kotzt sind durchschnittlich 4.333333333333333 Zeichen lang.


## Module

* Weitere Möglichkeit, Programmcode einzukapseln
* Typischer Use-Case: zusammengehörige Funktionen (, Klassen, …)
* Mitgelieferte Funktionalität (jenseits des Sprachkerns) und Herunterladbares kommt in Modulen

* Modul = Python-Datei
* Modulname = Python-Dateiname ohne Pfad und Endung

<p>Module bieten eine weitere Möglichkeit, Programmcode in abgeschlossene Einheiten zu kapseln. Typischerweise werden zusammengehörige Funktionen in einem Modul versammelt. Module sind die wichtigste Organisationseinheit in Python, da alle Python-eigenen Funktionalitäten, aber auch alle zusätzlich herunterladbare Erweiterungen immer in Form von Modulen kommen.</p>
<p>Module sind Python-Dateien, die Funktionen und Variablen-Definitionen enthalten.<br/>
Name des Moduls = Name der Datei (ohne die Endung .py)<br/>
Beispiel: <br/>


In [2]:
def get_chars(instring):
    chars = []
    for i in instring:
        chars.append(i)
    return chars

Speichern Sie diese Funktion in der Datei `chars.py`.
Nun können Sie in jedem neuen Programm diese Funktion zugänglich machen, indem Sie einfach `import Dateiname` (ohne Endung!) eingeben:

In [3]:
! pwd
! realpath chars.py

/home/lennart/Uni/python_intro
/home/lennart/Uni/python_intro/chars.py


In [4]:
import chars
chars.get_chars("hallo")

['h', 'a', 'l', 'l', 'o']

### Modulsuchpfad

Wo werden Module gesucht? Der _Modulsuchpfad_ wird beim Starten von Python befüllt und ist systemspezifisch. Sie können ihn mit `sys.path` anzeigen:

In [5]:
import sys
print(sys.path)

['/home/lennart/Uni/python_intro', '/home/lennart/anaconda3/envs/python_intro/lib/python38.zip', '/home/lennart/anaconda3/envs/python_intro/lib/python3.8', '/home/lennart/anaconda3/envs/python_intro/lib/python3.8/lib-dynload', '', '/home/lennart/anaconda3/envs/python_intro/lib/python3.8/site-packages', '/home/lennart/anaconda3/envs/python_intro/lib/python3.8/site-packages/IPython/extensions', '/home/lennart/.ipython']


* `''` steht für das aktuelle Verzeichnis (`os.getcwd()`)
* Umgebungsvariable `PYTHONPATH`
* Probieren Sie's aus!

### Formen der import-Anweisung

In [6]:
# Standardform. Hier muss der Modulname beim jeden Aufruf einer Funktion genannt werden.
import chars
chars.get_chars("hallo")

['h', 'a', 'l', 'l', 'o']

In [7]:
# Man kann auch ein kurzes Alias für einen längeren Modulnamen setzen:
import chars as c
c.get_chars("hi")

['h', 'i']

In [8]:
# import eine Funktion in den lokalen Namensraum, d.h. man kann sie nun ohne Modulnamen verwenden
# man könnte auch mehrere importieren: from chars import get_chars, other_function
from chars import get_chars
get_chars("hi")

['h', 'i']

In [9]:
# "Alles" importieren -- aber Vorsicht, kann unübersichtlich werden ...
from chars import *

#### Best Practice – Import

* Import-Statements stehen (fast) immer oben im Programm
* Für manche Libraries gibt es etablierte Aliase:
```python
import numpy as np
import networkx as nx
```
* Verwenden Sie eher die `from module import symbol`-Form, wenn es Ihnen um einzelne Funktionen/Typen/… geht, und die `import module`-Form, wenn es um die Bibliothek als solche geht
* `from module import *` ist __nur__ in interaktiven Sitzungen etc. akzeptabel, in Programmen verschleiert es die Herkunft (und damit die Identität) der Symbole

### Programm == Modul

* _Jedes_ Python-Skript ist ein Modul, auch Ihr "Hauptprogramm"
* der Name jedes Moduls steht in der modulspezifischen Variable `__name__`
* der spezielle Name `"__main__"` steht für das Hauptprogramm
* damit können Sie ein Skript als Modul und als Programm nutzbar machen:

In [10]:
"""Some useful string utilities"""
def get_words(text):
    """Returns a list of words in the given `text`"""
    return text.split()

def _main():
    import sys
    words = get_words(sys.argv[1])
    print(len(words), "Words: ", words)
    
if __name__ == "__main__":
    _main()

1 Words:  ['-f']


#### Achtung
Code außerhalb der des ```__name__ == '__main__':``` Abschnitts, wird bei jedem Import der Moduls ausgeführt.

In [11]:
! realpath bad_chars.py
! cat bad_chars.py | pygmentize

/home/lennart/Uni/python_intro/bad_chars.py
[34mimport[39;49;00m [04m[36mtime[39;49;00m

[34mfor[39;49;00m t [35min[39;49;00m [36mreversed[39;49;00m([36mrange[39;49;00m([34m1[39;49;00m,[34m11[39;49;00m)):
	[34mprint[39;49;00m(f[33m"[39;49;00m[33mNur noch {t} Sekund{[39;49;00m[33m'[39;49;00m[33men[39;49;00m[33m'[39;49;00m[33m if t > 1 else [39;49;00m[33m'[39;49;00m[33me[39;49;00m[33m'[39;49;00m[33m}. Dann ist alles startbereit![39;49;00m[33m"[39;49;00m)
	time.sleep([34m1[39;49;00m)

[34mdef[39;49;00m [32mget_chars[39;49;00m(instring):
    chars = []
    [34mfor[39;49;00m i [35min[39;49;00m instring:
        chars.append(i)
    [34mreturn[39;49;00m chars

[34mif[39;49;00m [31m__name__[39;49;00m == [33m'[39;49;00m[33m__main__[39;49;00m[33m'[39;49;00m:
    [34mprint[39;49;00m(get_chars([33m"[39;49;00m[33mHello World![39;49;00m[33m"[39;49;00m))


In [12]:
from bad_chars import get_chars

Nur noch 10 Sekunden. Dann ist alles startbereit!
Nur noch 9 Sekunden. Dann ist alles startbereit!
Nur noch 8 Sekunden. Dann ist alles startbereit!
Nur noch 7 Sekunden. Dann ist alles startbereit!
Nur noch 6 Sekunden. Dann ist alles startbereit!
Nur noch 5 Sekunden. Dann ist alles startbereit!
Nur noch 4 Sekunden. Dann ist alles startbereit!
Nur noch 3 Sekunden. Dann ist alles startbereit!
Nur noch 2 Sekunden. Dann ist alles startbereit!
Nur noch 1 Sekunde. Dann ist alles startbereit!


## Kommandozeile

* [Kurztutorial für alle OS](https://tutorial.djangogirls.org/de/intro_to_command_line/)
* es gibt immer ein aktuelles Verzeichnis. 
    * Linux/MacOS: Anzeigen mit `pwd`, wechseln mit `cd neuer/pfad`
    * Windows: Anzeigen mit `cd`, wechseln mit `cd neuer\pfad`
* __Kommandos__ bestehen aus einem oder mehreren Wörtern, durch Leerzeichen getrennt, ggf. mit " " umschlossen.
* Erstes Wort: Befehl, z.B. Programm. Folgende Wörter: Argumente, werden vom Programm interpretiert.

### Umgebungsvariablen
* _Umgebungsvariablen_ enthalten Werte, die allen Programmen zur Verfügung stehen, z.B. `$PATH` (bzw. `%PATH%` auf Windows). Tippen Sie `set`
* Umgebungvariablen vererben sich an gestartete Prozesse
* Wichtige Umgebungsvariablen:
   * `PATH` (`%PATH%` (Windows) bzw. `$PATH` (sonst)) enthält die Verzeichnisse, in denen das OS nach Programmen sucht.
   * `PYTHONHOME` ggf. Grundverzeichnis von Python
   * `PYTHONPATH` Modul-Suchverzeichnisse von Python

### Übung

Kommandozeilenargumente finden Sie in Ihrem Programm in der Liste `sys.argv`. `sys.argv[0]` ist immer der Name des Programms.

In [13]:
import sys
sys.argv

['/home/lennart/anaconda3/envs/python_intro/lib/python3.8/site-packages/ipykernel_launcher.py',
 '-f',
 '/home/lennart/.local/share/jupyter/runtime/kernel-41ad5789-96d5-4065-946e-9a664a79dd38.json']

Schreiben Sie ein Programm, das die Kommandozeilenargumente, mit denen es aufgerufen wird, auf den Bildschirm ausgibt. Speichern Sie es als `cmdtest.py` und rufen Sie es an der Kommandozeile mit verschiedenen Argumenten auf.

### Pythons Standard-Module
* Python kommt mit einer [umfangreichen Bibliothek von Modulen](https://docs.python.org/3/library), die für viele Probleme schon ausreichend sind (batteries included).
* Python-Module sind oft einfach Python-Dateien im Suchpfad 

## Externe Module installieren

* Zentrales Archiv externer Python-Module: __PyPI__ – Python Package Index – https://pypi.python.org/pypi
* Tool zur Installation externer Python-Module: `pip` – Bestandteil der Python-Installation
* Kommandozeilentool

In [14]:
%%bash

pip --help


Usage:   
  pip <command> [options]

Commands:
  install                     Install packages.
  download                    Download packages.
  uninstall                   Uninstall packages.
  freeze                      Output installed packages in requirements format.
  list                        List installed packages.
  show                        Show information about installed packages.
  check                       Verify installed packages have compatible dependencies.
  config                      Manage local and global configuration.
  search                      Search PyPI for packages.
  wheel                       Build wheels from your requirements.
  hash                        Compute hashes of package archives.
  completion                  A helper command used for command completion.
  debug                       Show information useful for debugging.
  help                        Show help for commands.

General Options:
  -h, --help                  Show h

<table>
<tr><td><code>pip install</code> <em>⟨Paketname⟩</em></td><td>Installiert das angegebene Paket, falls nicht bereits da</td></tr>
<tr><td><code>pip install --update</code> <em>⟨Paketname⟩</em></td><td>Installiert oder aktualisiert das angegebene Paket</td></tr>
<tr><td><code>pip install --user</code> <em>⟨Paketname⟩</em></td><td>Installiert das angegebene Paket nur für den aktuellen Benutzer</td></tr>

### Übungsaufgaben externe Module

Das Paket [requests](http://python-requests.org/) ein Paket, das HTTP-Zugriffe sehr einfach macht. 

1. Installieren Sie es mit `pip`. 
2. Finden Sie heraus, wohin das Paket installiert wurde.
3. Schreiben Sie mit Requests ein Programm, das herausfindet, ob die Unihomepage erfolgreich aufgerufen werden kann.
4. (Schreiben Sie unter Zuhilfenahme von requests ein kleines Script, bei dem der Benutzer einen Ländercode (z.B. `de` oder `co`) eingibt und Namen und Hauptstadt des betreffenden Landes angezeigt bekommt. Benutzen Sie dazu den Service http://restcountries.eu/, der Ihnen allerlei Länderinfos zu einem Land im von Requests direkt unterstützten JSON-Format liefert.)

### Pakete (Packages)

Komplexe Bibliotheken werden oft in _Pakete_ gegliedert. 

In [15]:
! pip install scikit-learn
from sklearn.metrics import f1_score



Ein Paket / Package ist ein Verzeichnis, in dem eine Datei `__init__.py` liegt. Z.B. ein kleiner Ausschnitt aus scikit-learn:

```
sklearn
├── base.py
├── metrics
│   ├── base.py
│   ├── classification.py
│   ├── cluster
│   └── __init__.py
└── __init__.py
```

`import sklearn.metrics` lädt `sklearn/metrics/__init__.py`.