# Vorlesung Python 5 - 03.02.2021

## 1. Ankündigungen

Wichtige Termine:

 * Anmeldung auf Basis zur Berichtsabgabe - bis zum 05.02.2021
 * Abgabe des Berichts am **19.02.2021** digital auf eCampus
 
Die Anleitungen für den Latex- und Linux-Block sind bereits online, für Python/Statistik wird in Kürze online gestellt.

**Wichtig**: 

 * Studenten, die den Kurs für 4 LP belegen (*physik131*), brauchen nur einen Linux- und Python/Statistik-Bericht abgeben
 * Studenten, die den Kurs für 6 LP belegen (*physik132*), müssen alle Teilberichte abgeben

## 2. Python File-IO

Für das Bearbeiten von Daten aus Dateien haben wir im Rahmen des `numpy`-Moduls schon das Einlesen mit `numpy.loadtxt(...)` genutzt. 

An einigen Stellen, möchte man aber auch Daten, z.B. Resultate von Fits in Dateien abspeichern, die bisher mit `print` ausgegeben wurden.

Zum Speichern von kompletten Datensätzen kann man die Funktion `numpy.savetxt(...)`, auf die ich hier nicht eingehen möchte.

**Beispiel**:

In dem Beispiel haben wir 2 `numpy`-Arrays, gefüllt mit Zufallszahlen und wollen als Vergleich jeweils den Mittelwert, die Standard-Abweichung und die Varianz bestimmen und in einer LaTeX-Tabelle abspeichern:

In [10]:
import numpy as np
import numpy.random as nr

num=10000

array1 = nr.normal(loc=0.5, scale=0.1, size=num)
array2 = nr.uniform(low=0., high=1., size=num)

Zum Testen kann man die Werte berechnen:

In [11]:
print(array1.mean())
print(array1.std())
print(array1.var())
print(array2.mean())
print(array2.std())
print(array2.var())

0.5000823554568489
0.09936090676081101
0.009872589792330579
0.4928602555231697
0.2895868928273825
0.08386056849741792


Ein besserer Output wäre so:

In [12]:
print('-'*60)
print('Verteilung | Mittelwert | Standardabweichung | Varianz')
print('-'*60)
print(f'Normal     | {array1.mean():.8f} | {array1.std():.8f}         | {array1.var():.8f}')
print(f'Gleich     | {array2.mean():.8f} | {array2.std():.8f}         | {array2.var():.8f}')
print('-'*60)

------------------------------------------------------------
Verteilung | Mittelwert | Standardabweichung | Varianz
------------------------------------------------------------
Normal     | 0.50008236 | 0.09936091         | 0.00987259
Gleich     | 0.49286026 | 0.28958689         | 0.08386057
------------------------------------------------------------


Oder als Latex-Format:

In [13]:
print('\\begin{tabular}[h]{l|l|l|l}')
print(' \\hline')
print(' Verteilung & Mittelwert & Standardabweichung & Varianz\\\\')
print(' \\hline')
print(f' Normal & {array1.mean():.8f} & {array1.std():.8f} & {array1.var():.8f}\\\\')
print(f' Gleich & {array2.mean():.8f} & {array2.std():.8f} & {array2.var():.8f}\\\\')
print(' \\hline')
print('\\end{tabular}')

\begin{tabular}[h]{l|l|l|l}
 \hline
 Verteilung & Mittelwert & Standardabweichung & Varianz\\
 \hline
 Normal & 0.50008236 & 0.09936091 & 0.00987259\\
 Gleich & 0.49286026 & 0.28958689 & 0.08386057\\
 \hline
\end{tabular}


**Wichtig**: um einen `\` zu erhalten, muss man in der Ausgabe `\\` schreiben!

### 2.1 print

Speichern in einer Datei kann man mit `print` erledigen:

In [14]:
with open('output_print.txt', 'w') as f:
    print('\\begin{tabular}[h]{l|l|l|l}', file=f)
    print(' \\hline', file=f)
    print(' Verteilung & Mittelwert & Standardabweichung & Varianz\\\\', file=f)
    print(' \\hline', file=f)
    print(f' Normal & {array1.mean():.8f} & {array1.std():.8f} & {array1.var():.8f}\\\\', file=f)
    print(f' Gleich & {array2.mean():.8f} & {array2.std():.8f} & {array2.var():.8f}\\\\', file=f)
    print(' \\hline', file=f)
    print('\\end{tabular}', file=f)

Hier werden gleich zwei Konzepte verwendet:

### 1. File-Objekte

In Python wie in anderen Programmiersprachen gibt es sog. File-Objekte, die auf relativ einfache Art und Weise das Lesen- und auch Schreiben von Dateien ermöglichen:

#### File-Objekte anlegen

File-Objekte werden mit `open` erzeugt:

```Python
f = open(<filename>, <permission>)
```

 * `filename` ist einfach der Dateiname und kann auch Verzeichnisse enthalten
 * `permission` kann folgendes sein:
    * `r`  zum Lesen
    * `w`  zum Schreiben
    * `a`  zum Anhängen
    * und noch ein paar mehr, siehe `help(open)` 
    
Rückgabewert ist eine Variable, mit der man Lesen/Schreiben kann

#### File-Objekte schliessen

Jedes geöffnete File-Objekt muss von Hand geschlossen werden oder am Programmende werden alle offenen Objekte geschlossen:

```Python
f.close()   # schliesst ein offenes File-Objekt
```

**Wichtig**: Mehrmaliges Schliessen gibt einen Fehler!

### 2. with-Umgebung

Die `with`-Umgebung wird gerne bei File-Operationen genommen, weil sie ein wenig Arbeit beim Programmieren abnimmt. Die Umgebung kann noch erheblich mehr, worauf wir hier aber nicht eingehen werden.

Aus der Syntax heraus wird hier eine andere Art der Deklaration gemacht:

```Python
...
with open(...) as f:
    block
...
````

ist äquivalent zu:

```Python
f = open(...)
block
f.close()
```

Im Prinzip wird `with` hier verwendet, um das `f.close()` zu sparen, was manchmal von den Programmierern auch *vergessen* wird!

Zurück zu dem `print`-Beispiel:

Mit dem zusätzlichen Argument `file=` in `print` kann man ein offenes File-Objekt angeben, wobei dann die Ausgabe in diese Datei geschrieben wird!

### 2.2 write

Anstelle von `print` kann man auch die Funktion `f.write(...)` verwenden:

In [16]:
with open('output_print.txt', 'w') as f:
    f.write('\\begin{tabular}[h]{l|l|l|l}\n')
    f.write(' \\hline\n')
    f.write(' Verteilung & Mittelwert & Standardabweichung & Varianz\\\\\n')
    f.write(' \\hline\n')
    f.write(f' Normal & {array1.mean():.8f} & {array1.std():.8f} & {array1.var():.8f}\\\\\n')
    f.write(f' Gleich & {array2.mean():.8f} & {array2.std():.8f} & {array2.var():.8f}\\\\\n')
    f.write(' \\hline\n')
    f.write('\\end{tabular}\n')

**Wichtig:** `f.write(...)` schreibt keine automatischen Returns am Ende der Zeile, die muss man manuell angeben!

### 2.3 writelines

Eine relativ elegante Lösung ist, dass man den Ausgabetext in einer Liste von Strings abspeichert:

In [18]:
text = list()
text.append('\\begin{tabular}[h]{l|l|l|l}\n')
text.append(' \\hline\n')
text.append(' Verteilung & Mittelwert & Standardabweichung & Varianz\\\\\n')
text.append(' \\hline\n')
text.append(f' Normal & {array1.mean():.8f} & {array1.std():.8f} & {array1.var():.8f}\\\\\n')
text.append(f' Gleich & {array2.mean():.8f} & {array2.std():.8f} & {array2.var():.8f}\\\\\n')
text.append(' \\hline\n')
text.append('\\end{tabular}\n')

print(text)

['\\begin{tabular}[h]{l|l|l|l}\n', ' \\hline\n', ' Verteilung & Mittelwert & Standardabweichung & Varianz\\\\\n', ' \\hline\n', ' Normal & 0.50008236 & 0.09936091 & 0.00987259\\\\\n', ' Gleich & 0.49286026 & 0.28958689 & 0.08386057\\\\\n', ' \\hline\n', '\\end{tabular}\n']


und dann abspeichern:

In [19]:
with open('output.tex', 'w') as f:
    f.writelines(text)

:-)

## 3. Hilfe zu Python / Debugging

An dieser Stelle sollen einmal alle Möglichkeiten an Hilfe zum Nutzen von Python dargestellt werden. als Beispiel nehmen wir nochmal das `kafe2`-Modul:

### 3.1 direkte Hilfe

In [20]:
%matplotlib inline

from kafe2 import XYContainer, Fit, Plot

import numpy as np
import matplotlib.pyplot as plt

# the linear model function
def linear_model(x, a, b):
    # Our first model is a simple linear function
    return a * x + b


# the numpy data
x_data = np.array([1.0, 2.0, 3.0, 4.0])
y_data = np.array([2.3, 4.2, 7.5, 9.4])
y_err  = np.array([0.3,0.45,0.35,0.25])

# define the data object
xy_data = XYContainer(x_data=x_data, y_data=y_data)
xy_data.add_error(axis='y', err_val= y_err) 

# define the fit object
my_fit = Fit(data=xy_data, model_function=linear_model) 

results = my_fit.do_fit()   # do the fit!

print(results)

{'did_fit': True, 'cost': 2.6779212418183818, 'ndf': 2, 'goodness_of_fit': 2.6779212418183818, 'cost/ndf': 1.3389606209091909, 'chi2_probability': 0.2621179669793847, 'parameter_values': OrderedDict([('a', 2.410372330912922), ('b', -0.14822776208071486)]), 'parameter_cov_mat': array([[ 0.01605522, -0.04370975],
       [-0.04370975,  0.14386601]]), 'parameter_errors': OrderedDict([('a', 0.1267089696080867), ('b', 0.37929611386007195)]), 'parameter_cor_mat': array([[ 1.        , -0.90947877],
       [-0.90947877,  1.        ]]), 'asymmetric_parameter_errors': None}


In [21]:
help(my_fit)

Help on XYFit in module kafe2.fit.xy.fit object:

class XYFit(kafe2.fit._base.fit.FitBase)
 |  XYFit(xy_data, model_function=<function linear_model at 0x7ff54e9bbc10>, cost_function=<kafe2.fit.xy.cost.XYCostFunction_Chi2 object at 0x7ff54e966c70>, minimizer=None, minimizer_kwargs=None, dynamic_error_algorithm='nonlinear')
 |  
 |  This is a purely abstract class implementing the minimal interface required by all
 |  types of fitters.
 |  
 |  Method resolution order:
 |      XYFit
 |      kafe2.fit._base.fit.FitBase
 |      kafe2.fit.io.file.FileIOMixin
 |      builtins.object
 |  
 |  Methods defined here:
 |  
 |  __init__(self, xy_data, model_function=<function linear_model at 0x7ff54e9bbc10>, cost_function=<kafe2.fit.xy.cost.XYCostFunction_Chi2 object at 0x7ff54e966c70>, minimizer=None, minimizer_kwargs=None, dynamic_error_algorithm='nonlinear')
 |      Construct a fit of a model to *xy* data.
 |      
 |      :param xy_data: the x and y measurement values
 |      :type xy_data: (2

Wonach suchen?

 * Funktionen, sind in der Regel offensichtlich, achten Sie auf die Beschreibung, *notwendige* und *optionale* Parameter
 * Variablen oder Properties (können auch nur *read-only* sein)
 * manchmal steht *inherited* bei Funktionen/Variablen/Properties weiter unten, d.h. sie sind in anderen Objekten sog. Elternobjekten definiert, aber können ganz normal zugegriffen werden
 
Bei Variablen/Properties *kann* der Typ mitgeliefert sein, aber man sollte diese zum Testen entweder mit `print` ausgeben oder mit `type` den Typ bestimmen.

In [22]:
print(my_fit.parameter_names)
print(my_fit.parameter_values)
print(my_fit.parameter_errors)

print(type(my_fit.parameter_values))

l = [1,2,3,4]          # python Liste
print(l)

a = np.arange(1000000) # numpy array !
print(a)

('a', 'b')
[ 2.41037233 -0.14822776]
[0.12670897 0.37929611]
<class 'numpy.ndarray'>
[1, 2, 3, 4]
[     0      1      2 ... 999997 999998 999999]


### 3.2 Hilfen von den Modul-Seiten

Wenn Sie ein Modul z.B. `kafe2` nutzen und nicht wissen, wozu man es anwendet, evt. installieren muss, wie man es benutzt, dann gibt es in der Regel die Webseiten der Autoren, die das Modul beschreiben:

 * `kafe2` [https://kafe2.readthedocs.io/en/latest/ ]
 * `numpy` [https://numpy.org/doc/ ]
 * `scipy` [https://docs.scipy.org/doc/ ]
 * `matplotlib` [https://matplotlib.org/ ]
 * ...
 
(Generell hat sich für die OpenSource-Gemeinde [https://readthedocs.org/ ] durchgesetzt, um Dokumentation online anbieten zu können!)

### 3.3  Hilfen von https://stackexchange.com/

Allgemein sind bei Fragen rund um das Programmieren und auch zu anderen Problemen, Foren von 
[https://stackexchange.com/ ] sehr beliebt. Das Bekannteste Forum ist:

**[Stackoverflow](https://stackoverflow.com/)**

Für Python und andere Module kann man zur Übersicht  **Tags** verwenden:

* [python]
* [pytho-3.x]
* [numpy]
* [matplotlib]
* [scipy]

`kafe2` ist leider zu speziell und nicht als **Tag** verfügbar!

Es gibt aber noch spezielle Foren, die für Sie vielleicht auch von Interesse sind:

 * [https://tex.stackexchange.com/ ]  für alles rund um LaTeX
 * [https://math.stackexchange.com/ ] für Fragen rund um Mathematik
 * [https://physics.stackexchange.com/ ] für Fragen rund um Physik

**Wichtig** und **Warnung**:
 * meistens/oft sind die Fragen/Antworten auf Englisch
 * die Foren sind von der Community gemanaged, d.h. die Antworten müssen nicht immer korrekt sein, es gibt Antworten, für die *Votes*  vergeben werden. Antworten mit der höchsten Zustimmung wird nicht falsch sein ... 
 * Kommentare sind hilfreich
 * bei den Programmierfragen lernt man auch unkonventionelle Lösungen
 * beim Verwenden von Antworten, bitte immer angeben, woher man es hat, Link etc.! Das hilft der eigenen Dokumentation und das Verstehen!

### 3.4 Debuggen von Codes

An dieser Stelle kann man leider kein einheitliches Konzept nennen; im Prinzip hat jeder seine eigenen Strategien. Es gibt aber ein paar einfache Möglichkeiten, während des Erstellens von Code, Debugging zu betreiben:

 * Debugging erfordert nicht immer eine spezielle Software, z.B. einen Debugger
 * Teil-Aufgaben oder -Probleme sollen in Funktionen ausgelagert werden, die man speziell für bestimmte Parameter separat testen kann. Verwenden Sie ruhig ein neues leeres Notebook für diese Tests
 * Geben Sie Schlüsselvariablen, dessen Werte meist mit Algorithmen berechnet werden, mit `print` aus, unter Umständen auch den Zustand beim Erstellen. Die `print`-Befehle können gelöscht werden, wenn der Code das tut, was er soll!
 * Schreiben Sie kurzen Code und nutzen Sie vorgefertigte Funktionen und Algorithmen, man muss nicht das Rad neu erfinden! kurzer Code -> weniger Fehlermöglichkeiten!
 * Dokumentieren Sie Ihren Code, denn dadurch muss man sich die Codezeilen nochmal anschauen und versuchen den Sinn zu erkennen. Komplizierter Code, den man nicht auf anhieb versteht, ist meistens die Ursache von Fehlern
 * Testen Sie ihre Funktionen auch mit willkürlichen Eingaben *Babytest*, dadurch werden Fehler, an die man sonst nicht denken würde, sichtbar