# Python Programmieren mit dem Jupyter Notebook

### Gert-Ludwig Ingold
Universität Augsburg

<img src="images/EU_flag-Erasmus__vect_POS.png" width="25%" align="right">

## Über mich

* Theoretischer Physiker an der Universität Augsburg
* Programmiervorlesungen in Python für Physiker und Materialwissenschaftler seit 2010
* Beiträge zu Open Source Projekten und Tutorials bei der EuroSciPy-Konferenz
* Beteiligung an zwei Erasmus+-Projekten zum Programmieren im schulischen und universitären Unterricht mit Python
  * iCSE4school (2015-2017)  
    Materialien: http://visual.icse.us.edu.pl/school/
  * Jupyter@edu (2017-2019)  
    Materialien: https://github.com/marcinofulus/jupyter4edu

## Python programmieren

* in der Python shell
  * vor allem zum Ausprobieren sehr kurzer Codesegmente
  * besser: IPython shell (improved Python shell)   
    Ausgangspunkt für Entwicklung des Jupyter Notebooks
* in einem Editor
  * ggf. Lernaufwand bei mächtigen Editoren
  * auch in anderen Zusammenhängen nutzbar
* in einer Entwicklungsumgebung (IDLE, Spyder, ...)
  * relativ geringe Einarbeitungszeit
* im Jupyter-Notebook
  * <font color="#c00">Eigenschaften ⇒</font>

## Aus Newtons Notizbuch

<img src="images/MS-ADD-04004_25_detail.png">

## Von Newton zum modernen Notebook
* *Erläuterungen*  
  Text, der Gliederungen und mathematische Formeln enthalten kann
* *mathematische Umformungen*  
  Programmcode und das daraus resultierende Ergebnis
* *Abbildungen*  
  graphische Darstellungen und Multimedia-Objekte
* *Darstellung*  
  HTML, PDF, …

## Von IPython zum Jupyter Notebook

* 2001: Start des IPython-Projekts durch Fernando Pérez  
* Dezember 2011: Mit IPython 0.12 wird das **IPython Notebook** eingeführt
* 2013-2014: Die Entwicklung von IPython wird mit 1,15 M\$ von der Alfred P. Sloan Stiftung unterstützt
* August 2013: Microsoft unterstützt die Entwicklung von IPython mit 100 k\$
* 2015: *The big split*: Aufteilung in einen sprachunabhängigen Teil (Jupyter) und einen Python-spezifischen
  Teil (IPython)
  
Frage: Warum *Jupyter*?  
Antwort: **Ju**lia - **Pyt**hon - **R**

## Eine kurze Tour durch das Jupyter Notebook Interface

<img src="images/help.png">

## Codezellen

In [None]:
for n in range(3):
    print('Das Jupyter-Notebook ist toll!')

* Ausgeführte Codezellen bekommen eine Nummer in der Reihenfolge der Ausführung.
* Codezellen können im Prinzip in beliebiger Reihenfolge ausgeführt werden.
* Hier liegt gerade für Anfänger ein potentieller Stolperstein.
* Man kann aber auch alle Zellen bis zu einer vorgegebenen Zelle ausführen lassen, z.B. wenn
  man an einem bestimmten Punkt des Notebooks einsteigen will.
* Vorsicht bei der automatischen Ausführung unbekannter Notebooks!

## Textzellen

### Markdown-Beispiele
* \*hervorgehobener Text\* oder \_hervorgehobener Text\_  
  *hervorgehobener Text* oder _hervorgehobener Text_
* \*\*stark hervorgehobener Text\*\* oder \_\_stark hervorgehobener Text\_\_  
  **stark hervorgehobener Text** oder __stark hervorgehobener Text__
* \`\`Code\`\`  
  ``Code``
  

## Textzellen

### HTML-Beispiel 
* ``<span style="color: white; background-color: #f88">farbiger Text</span>``  
  <span style="color: white; background-color: #f88">farbiger Text</span>

## Textzellen

### Formelsatz

``Hier steht eine Formel $\sqrt{1+x} = 1+\frac{x}{2}+...$ im Fließtext.`` 

Hier steht eine Formel $\sqrt{1+x} = 1+\frac{x}{2}+...$ im Fließtext.

Formeln können auch für sich in einer Zeile stehen:

``$$\int_{-\infty}^{+\infty}\mathrm{e}^{-x^2}\mathrm{d}x = \sqrt{\pi}$$``

$$\int_{-\infty}^{+\infty}\mathrm{e}^{-x^2}\mathrm{d}x = \sqrt{\pi}$$

* Formelsatz unter Verwendung von LaTeX-Syntax
* Darstellung mit [MathJax](https://www.mathjax.org)

## Einige wichtige Tastaturkürzel

* Liste der Tastaturkürzel: ``p``

### Wechsel zwischen Kommando- und Eingabemodus

* zum Eingabemodus: ``Enter``
* zum Kommandomodus: ``ESC``

### Kommandomodus – Wechsel des Zellentyps

* Wechsel zu Markdown-Zelle: ``m`` (markdown)
* Wechsel zu Code-Zelle: ``y``

### Kommandomodus – Ausführung einer Zelle

* Ausführen einer Zelle: ``STRG-Enter``
* Ausführen einer Zelle und Auswahl der nächsten Zelle: ``SHIFT-Enter``
* Ausführen einer Zelle und Öffnen einer neuen Zelle: ``ALT-Enter``

### Kommandomodus – Manipulation von Zellen

* Kopieren ausgewählter Zellen: ``c``
* Ausschneiden ausgewählter Zellen: ``x``
* Einfügen unter der aktuellen Zelle: ``v``
* Einfügen über der aktuellen Zelle: ``SHIFT-v``
* neue Zelle über der aktuellen Zelle: ``a`` (above)
* neue Zelle unter der aktuellen Zelle: ``b`` (below)
* Löschen der aktuellen Zellen: ``dd`` (delete, really)

### Zerlegen und Zusammenfügen von Zellen

* Zerlegen am Cursor im Editiermodus: ``STRG-SHIFT--``
* Zusammenfügen von Zellen im Kommandomodus: ``SHIFT-m`` (merge)

### Auswählen mehrerer Zellen

* im Kommandomodus: ``SHIFT-↑`` oder ``SHIFT-↓``

## IPython – eine verbesserte Python-Shell

### Hilfe

kurze Variante mit Signatur, Dokumentationstext, Quelle und Typ

In [None]:
import random
random.seed?

lange Variante mit Code (sofern verfügbar)

In [None]:
random.seed??

Codeergänzung mit ``TAB``

In [None]:
random.

### Bezug auf frühere Ergebnisse

In [None]:
2**10

In [None]:
_-1000

In [None]:
__/2**8

### Bisherige Ein- und Ausgaben

In [None]:
In

In [None]:
Out

## Magische Befehle

In [None]:
%lsmagic

In [None]:
%quickref

### Zeilenmagie

In [None]:
%timeit 2.5**100

### Zellenmagie

In [None]:
import math

In [None]:
%%timeit 
result = []
nmax = 100000
dx = 0.001
for n in range(nmax):
    result.append(math.sin(n*dx))

In [None]:
import numpy as np

In [None]:
%%timeit
nmax = 100
dx = 0.001
x = np.arange(0, nmax, dx)
result = np.sin(x)

In [None]:
%%HTML
<style>
div.text_cell_render h2 {color: #c80;}
div.text_cell_render h3 {color: #c08;}
</style>

## Darstellungsmöglichkeiten

### HTML-Code

In [None]:
import calendar
calendar.LocaleHTMLCalendar().formatmonth(2019, 1)

In [None]:
from IPython.display import HTML
HTML(calendar.LocaleHTMLCalendar().formatmonth(2019, 1))

### LaTeX-Code

In [None]:
from IPython.display import Latex
Latex(r"$\cos(\alpha-\beta)=\cos(\alpha)\cos(\beta)+\sin(\alpha)\sin(\beta)$")

### Youtube-Videos

In [None]:
from IPython.display import YouTubeVideo
YouTubeVideo('X18jt2lVmJY')

### Audiosignale

In [None]:
from IPython.display import Audio
import numpy as np

def sound(func, step, power, decaypower, tmax=5, framerate=44100):
    n, t = np.ogrid[1:20:step, 0:tmax:framerate*tmax*1j]
    data = np.sum(func(2*np.pi*220*n*t)/n**power*np.exp(-n**decaypower*t), axis=0)
    return Audio(data, rate=framerate)

sound(np.sin, step=2, power=0, decaypower=1)

Objekte lassen sich in verschiedenen Formaten darstellen:

* Markdown
* LaTeX
* HTML
* Javascript
* SVG
* PNG
* JPEG

### Darstellung eines Farbobjekts als SVG

In [None]:
class RGBColor:
    def __init__(self, r, g, b):
        self.colordict = {"r": r, "g":g, "b": b}
        
    def _repr_svg_(self):
        return '''<svg height="50" width="50">
                    <rect width="50" height="50" fill="rgb({r},{g},{b})" />
                  </svg>'''.format(**self.colordict)

c = RGBColor(205, 128, 255)
c

### Darstellung eines Bruchs als HTML oder LaTeX

In [None]:
from fractions import Fraction

class MyFraction(Fraction):
    def _repr_html_(self):
        return "<sup>%s</sup>&frasl;<sub>%s</sub>" % (self.numerator,
                                                          self.denominator)
    
    def _repr_latex_(self):
        return r"$\frac{%s}{%s}$" % (self.numerator, self.denominator)
    
    def __add__(a, b):
        """a + b"""
        return MyFraction(a.numerator * b.denominator +
                          b.numerator * a.denominator,
                          a.denominator * b.denominator)
        
MyFraction(12, 345)+MyFraction(67, 89)

In [None]:
from IPython.display import display_latex
display_latex(MyFraction(12, 345)+MyFraction(67, 89))

## Widgets

In [None]:
from ipywidgets import interact, widgets

In [None]:
import matplotlib.pyplot as plt

In [None]:
class Taylorseries:
    def __init__(self, coeffs):
        self.coeffs = coeffs
        
    def __call__(self, x, order):
        p = np.poly1d(self.coeffs[-order-1:])
        return p(x)

maxorder = 11   
taylor_sin = Taylorseries([(-1)**((n-1)//2)/math.factorial(n) if n % 2 else 0
                           for n in range(maxorder, -1, -1)])
taylor_cos = Taylorseries([(-1)**((n+1)//2)/math.factorial(n) if not (n % 2) else 0
                           for n in range(maxorder, -1, -1)])

In [None]:
@interact(funcs=widgets.Dropdown(options={'Sinus': (np.sin, taylor_sin),
                                          'Kosinus': (np.cos, taylor_cos)},
                                 description='Funktion'),
          order=widgets.IntSlider(min=0, max=maxorder, value=0,
                                  description='Ordnung')
         )
def g(funcs, order):
    f, ftaylor = funcs
    x = np.linspace(-np.pi, np.pi)
    plt.plot(x, f(x))
    plt.plot(x, ftaylor(x, order))
    plt.ylim(-1.5, 1.5)
    plt.show()

## Kopplung von Widgets

In [None]:
funcs_widget = widgets.Dropdown(options={'Sinus': (np.sin, taylor_sin),
                                         'Kosinus': (np.cos, taylor_cos)},
                                description='Funktion')
order_widget = widgets.IntSlider(min=1, max=maxorder, value=0, step=2,
                                 description='Ordnung')

def update_min_order(*args):
    minval = {np.cos: 0, np.sin: 1}
    order_widget.min = minval[funcs_widget.value[0]]
    order_widget.value = order_widget.min
    
funcs_widget.observe(update_min_order, 'value')
    
interact(g, funcs=funcs_widget, order=order_widget);

### Defaultwidgets

In [None]:
@interact(param1={'A': 1, 'B': 2, 'C': 3},
          param2=['a', 'b', 'c'],
          param3=(0, 10),
          param4=(-1., 1.),
          param5='Hallo',
          param6=True,
          param7=False
         )
def g(**kwargs):
    for k, v in kwargs.items():
        print(f'{k}: {v}')

## ipynb-Datei

* Die Notebook-Datei (``.ipynb``) ist lesbar, aber ein direktes Editieren sollte 
  man entweder bleiben lassen oder sorgfältig vorgehen.
* Mit Hilfe der IPython-API lassen sich Notebooks bei Bedarf maschinell lesen 
  oder schreiben.

In [None]:
with open('jupyter.ipynb') as file:
    content = file.readlines()
for line in content[:18]:
    print(line.strip('\n'))

In [None]:
for line in content[-23:]:
    print(line.strip('\n'))

## Umwandlung in andere Formate

``jupyter nbconvert --to FORMAT notebook.ipynb``

Defaultformat ist HTML.

In [None]:
from nbconvert import exporters
exporters.get_export_names()

## Jupyter-Notebook im Unterricht

* Jupyter-Notebook eignet sich sehr gut zum Bereitstellen interaktive Lehrmaterialien
* es eignet sich sehr gut zur Datenanalyse und zur Dokumentation der Ergebnisse, z.B. im experimentellen Unterricht
* es kann zur Korrektur von Übungsaufgaben herangezogen werden ⇒ ``nbgrader``
* es unterstützt exploratives Programmieren durch die einfache Möglichkeit, kürzere Programmteile auszuprobieren

In [None]:
%matplotlib notebook

In [None]:
x = np.linspace(0, 1, 100)
y = np.sin(x)
plt.plot(x, y)
plt.show()

* Jupyter-Notebook eignet sich eher schlecht zum Erstellen längerer Programme
* es sollte von Schüler / Studierenden nicht als einzige Möglichkeit wahrgenommen werden, in Python zu programmieren
* die Möglichkeit, Zellen nicht in der vorgegebenen Reihenfolge abzuarbeiten, kann zu Irritationen führen

<font color="#c30">⇒ Das Jupyter-Notebook eröffnet spannende Möglichkeiten für den Unterricht, ist aber kein Allzweckmittel.</font>

## Technische Aspekte

### Anaconda-Distribution (https://anaconda.org)
* umfassende und freie Python-Distribution für Windows, Linux, MacOS
* leichte Installation und Erweiterbarkeit
* Ausrichtung auf Datenanalyse und numerische Pakete für den wissenschaftlichen Einsatz  
  potentiell interessant für den naturwissenschaftlichen Unterricht
* mit gut 600 MB nicht ganz klein

### Jupyter vs. Jupyterhub

**Jupyter**
* Installation auf dem eigenen Rechner
* unterschiedliche Betriebssysteme: mit Anaconda-Distribution einheitliches Arbeitsumfeld möglich

**Jupyterhub**
* serverbasierte Jupyter-Installation
* webbasierter Zugriff unabhängig von der lokalen Softwareinstallation
* einheitliche Arbeitsbedingungen
* Benutzerverwaltung erforderlich

## Einführung in das Programmieren für Physiker und Materialwissenschaftler

* für Studierende im 2. oder 4. Semester
* Studierende teilweise ohne Programmiererfahrung  
  ⇒ betreute Übungen
* allgemeine Programmierkonzepte, keine Betonung von Pythonspezifika  
  ⇒ gelegentlich Vergleich mit anderen Programmiersprachen
* Manuskript online als HTML und PDF frei verfügbar: https://gertingold.github.io

### Inhalte

1. *Vorschau*  
   Zuweisungen, Schleifen, Verzweigungen, Funktionen
2. *Einfache Datentypen, Variablen, Zuweisungen*  
   Ganze Zahlen, Gleitkommazahlen, mathematische Funktionen, komplexe Zahlen, Variablen und Zuweisungen, Wahrheitswerte, Formatierung von Ausgaben
3. *Kontrollstrukturen*  
   for-Schleife, while-Schleife, Verzweigungen, Abfangen von Ausnahmen
4. *Funktionen*  
   Funktionsdefinitionen, Dokumentation von Funktionen, lokale und globale Variable, rekursive Funktionen, Funktionen als Argumente von Funktionen, Lambda-Funktionen, Schlüsselworte und Defaultwerte

5. *Zusammengesetzte Datentypen*  
   Listen, Tuple, Zeichenketten, Dictionaries
6. *Ein- und Ausgabe*  
   Eingabe über die Kommandozeile und die Tastatur, Lesen und Schreiben von Dateien
7. *Numerische Programmbibliotheken am Beispiel von NumPy/SciPy*  
   Installation, Arrays und Anwendungen, numerische Integration, Integration gewöhnlicher Differentialgleichungen
8. *Objektorientiertes Programmieren*  
   Klassen, Attribute und Methoden, Vererbung
9. *Erstellung von Grafiken*  
   matplotlib, PyX

## Übungsaufgaben

https://github.com/marcinofulus/jupyter4edu/tree/master/augsburg/exercises

<img src="images/spiral.png" width=30% align="right" style="padding-right: 20px;">

# Zahlenspirale

* Aufgabe vom Project Euler (https://projecteuler.net/)  
  Versuch, Studierende zur Bearbeitung weiterer Aufgaben aus dem Project Euler zu motivieren
* im Prinzip analytisch lösbar
* algorithmische Schwierigkeit: Umsetzung der spiralförmigen Anordnung der Zahlen  
   ⇒ Hilfestellung in weiteren Jupyter-Notebooks

<img src="images/julia.png" width=30% align="right" style="padding-right: 20px;">

# Juliamenge

* Motivation durch graphisches Endergebnis
* Funktion zur graphischen Darstellung wird zur Verfügung gestellt
* Schwierigkeiten:
  * Realisierung eines kontinuierlich erscheinenden Bildes durch ein Gitter
  * Umsetzung von Zahlen in Farben  
  ⇒ Unterstützung durch weitere Notebooks
* Umgang mit komplexen Zahlen

<img src="images/parrondo.png" width=30% align="right" style="padding-right: 20px;">

# Parrondo-Paradoxon

* Motivation durch Paradoxon: Kombination von zwei Verlustspielen kann ein Gewinnspiel ergeben
* Umgang mit Zufallszahlen
* unterstützende Notebooks, um Möglichkeit zur schrittweisen Bearbeitung zu geben
* Möglichkeit der Verbesserung im Semesterverlauf: Funktionen, objektorientierte Lösung

<img src="images/pi.png" width=30% align="right" style="padding-right: 20px;">

# Kreiszahl mit hoher Genauigkeit

* Bestimmung der Kreiszahl mit einigen Tausend Nachkommastellen mit Hilfe des arithmetisch-geometrischen Mittels
* Illustration der Möglichkeiten beliebig großer Integers in Python
* Herausforderungen:
  * Realisierung einer Wurzelfunktion für Integers
  * Anpassung des Algorithmus auf ganze Zahlen

<img src="images/primetime.png" width=30% align="right" style="padding-right: 20px;">

# Primzahlen als Uhrzeit

* Effiziente Berechnung von Primzahlen mit dem Sieb des Eratosthenes
* Integerdivision
* weiterführende Notebooks zu List comprehensions und enumerate

<img src="images/polynomial.png" width=30% align="right" style="padding-right: 20px;">

# Symbolisches Rechnen mit Polynomen

* Demonstration der Möglichkeit von symbolischem Rechnen
* Übung von Dictionaries
* weiterführende Notebooks zur setdefault-Methode und zu Sets

<img src="images/conway.png" width=30% align="right" style="padding-right: 20px;">

# Conways Spiel des Lebens

* Motivation: interessante Simulation
* Verwendung einer numerischen Bibliothek: Faltung aus SciPy
* zufälliger Anfangszustand sowie definierte Anfangszustände
* Funktion zur Animation wird vorgegeben

## nbgrader

* automatisierte Korrektur von Aufgaben
* Möglichkeit zur webbasierten Verteilung von Aufgaben

https://nbgrader.readthedocs.io  
https://github.com/jupyter/nbgrader

<img src="images/nbgrader.png" height="700px">

### ⇒ Demo

## Korrektur

3 Zellentypen:
* autograded answer
* autograded test
* manually graded answer

## Funktionen

* Funktionen müssen früh in der Vorlesung eingeführt werden  
  *aber:* es werden keine speziellen Aspekte benötigt, wie fehlende Argumente, kein Rückgabewert, Defaultargumente, Schlüsselwortargumente
* Studierende gewöhnen sich früh an ein strukturiertes Programmieren  
  *aber:* die Strukturierung ist vorgegeben
* Docstrings definieren die Aufgabestellung  
  für Studierende sind Docstrings normaler Bestandteil von Funktionen  
  *aber:* sie schreiben die Docstrings nicht selbst

## Korrektur mit Tests

* Testgetriebene Entwicklung  
  *aber:* die Tests werden nicht von den Studierenden geschrieben
* Feedback durch Fehlermeldungen der Tests
  *aber:* Studierenden verlassen sich zu sehr auf diese Fehlermeldungen statt einen kritischen Blick auf den eigenen Code zu entwickeln
* „dumme“ Fehler passieren immer
  * „triviale“ Standardtests: werden Ergebnisse zurückgegeben, ist der Datentyp korrekt, ...?
  * \+ Tests der Funktionalität, die möglichst keine Hinweise für die Lösung geben

## Heterogenität

* Studierende ohne Programmiererfahrung und gelegentlich mit „Schreib“hemmungen
* Studierende mit Erfahrungen in einer anderen Programmiersprache  
  Code sieht nicht sehr nach Python aus, z.B. Iteration über Indizes statt über Objekte
  
Verwendung von zusätzlichen Notebooks, die Hilfestellung geben oder eine schrittweise Problemlösung erlauben

* individualisierte Lernwege möglich
* Notebooks werden in zusätzlichen Tabs geöffnet, die unübersichtlich werden können