# Einleitung

Im Gegensatz zu dem, was der Titel "Einführung in Python mit Jupyter" vermuten lässt, ist dies keine Einführung in die Programmiersprache Python. Oder besser: Es ist nicht nur eine Einführung in Python. Es ist auch eine Einführung in das praktische Arbeiten mit Jupyter. Und die Arbeit mit Jupyter ist nicht an die Beherrschung einer bestimmten Programmiersprache gebunden. Weiterhin werden die Kapitel nicht Bestandteile eines Buches sein und sollten nicht als solche betrachtet werden. Vorgesehen ist vielmehr eine "Reihe" oder Serie, die sich aber auf bestimmte Themen beschränken muss. Eine "Einführung in JAVA mit Jupyter" wäre z.B. in Gefahr gelaufen, auszuufern und zu explodieren. Wenn ich also im Verlauf dieser "Reihe" auf einmal von "Data Science" in das Thema "Internet of things" (IoT) wechseln sollte... beides ist auf Grund des umfassenden Gebrauchs von Python in diesen Bereichen möglich! (Dies heißt nicht, dass man nicht auch für beide JAVA einsetzen kann! Zwei Fragen sind allerdings eingangs noch zu klären:

## Warum Python?

Ganz einfach: Python ist leicht zu lernen, ein modernes BASIC. Und Python ist mächtig durch sehr mächtige Programmierkonstrukte. Erstaunlich viele, umfangreiche, durchdachte und mächtige Module (in anderen Sprachen Bibliotheken oder gar Frameworks) tun ein übriges. Abgesehen davon hat mich das "Python-Ökosystem" überzeugt wie das, welches das JAVA-Umfeld ist. Für bestimmte Aufgaben ist Python mit den vorhandenen Bibliotheken (Modulen) und Tools ideal. Im Umfeld des Themas "Data Science" ist sie die Lingua Franca geworden. Bei der Programmierung des Rasperberry Pi ist sie die beliebtete Sprache und damit eine der wichtigsten im Bereich IoT (Internet of Things).

## Warum Jupyter?

Jupyter ist eine Lösung für interative Programmierung inklusive Grafikausgabe und Dokumentation, Letztere wiederum inklusive mathematischer Formeln. Diese Lösung eignet sich hervorragend für Datenanalyse, aber eben auch zu Lernzwecken. Gibt es Alternativen? Ja, [Apache Zeppelin](https://zeppelin.apache.org/ "Apache Zeppelin") ist eine solche Alternative. Zeppelin kommt aus dem Umfeld von [Apache Hadoop](https://hadoop.apache.org/) und [Apache Spark](https://spark.apache.org/), also Softwareprodukten aus dem "Big Data" Umfeld. Dominierend ist in diesem Umfeld (Apache) die Programmiersprache JAVA, jedoch kann Zeppelin mit Python zusammenareiten, aber umgekehrt hat man von Python aus auch Zugriff auf Spark. Unabhängig davon, für welche Kombination man sich im Einzelfall entscheidet: Der Einstieg in die Programmierung mit Python im Rahmen von Notebooks ist mit Jupyter zumindest dann einfacher, wenn man dem Vorschlag unter 1. (Installation) folgt.

## Warum überhaupt?

Die Motivation ist schlicht die, weiterzugeben, was man selbst gelernt hat. Lernen ist nicht immer linear. Ein Beispiel ist mein eigenes Lernen im Python-Umfeld: Interesse an den Themen IoT und Smart Home auf der einen, Faszination für das große Thema Data Science auf der anderen Seite, führten mich zu Python. Wenn ich weiter schaue erkenne ich schnell eine Baumstruktur von Interessen, aber lerne ich auch so? Von A nach B nach C? Also ich nicht. Was aber würde ich von einem Lehrbuch halten, dass von A nach C nach B usw. springt? Nichts! Insofern wollen diese Seiten auch Struktur vermitteln, die Orientierung bietet. 

Als Letztes: Die Notebooks sind auf Deutsch geschrieben. Der Grund liegt nicht in meinen Englisch-Kenntnissen. Vielmehr gibt es eine Unmenge von Tutorials und sogar Online-E-Books völlig legal im WWW. Aber alles ist auf Englisch, was an sich völlig O.K. ist. Trotzdem stellt es für manche eine Hemmschwelle da. Sprachbarrieren, auch wenn nur schwach vorhanden, sind eine Hemmschwelle, um sich mit einem Thema wenigstens erstmalig zu beschäftigen. Bei Interesse einer Intensivierung der Kenntnisse bleibt nur die englische Sprache. Hier also eine Hilfe zum Einstieg: auf Deutsch.

## 1. Installation

Dieses Kapitel werde ich sehr kurz halten. Die Installationsmglichkeiten, gerade für denjenigen, der schon eine Python-Umgebung installiert hat, sind vielfältig. Diese Zeilen richten sich an den Anfänger, daher empfehle ich die Installation der [Anconda](https://www.anaconda.com)-Distribution. Diese enthält schon im ursprünglichen Download alles, was man zum Arbeiten mit Python und Jupyter benötigt. Zusätzlich benötige Module kann man über das Tool Conda herunterladen. Eine [Liste](https://docs.anaconda.com/anaconda/packages/pkg-docs/) der verfügbaren Packages steht zur Verfügung. Da Anaconda die Jupyter-Intallation schon integriert hat, wird eine Installation über das Anconda-Installations-Tool [CONDA](https://conda.io/en/master/) nicht nötig sein. Eine nachträgliche Installation mit dem Standard-Python-Tool [PIP](https://pypi.org/project/pip/) ist möglich, wie [hier](https://jupyter.readthedocs.io/en/latest/install.html) beschrieben. 

## 2. Start

Der Start des Jupyter-Servers und des Standard-Browsers erfolgt durch Eingabe des Befehls 

jupyter notebook

in einem Konsole-Fenster. Tip unter Windows: Das Start-Verzeichnis, welches das Jupyter-Dashboard anzeigt, lässt sich mit dem Wechel in das gewünschte Verzeichnis vor Start simpel manipulieren:

cd C:\Users\Username\Anaconda3\notebooks
jupyter notebook
stop

Damit lassen sich unterschiedliche Startverzeichnisse durch unterschiedliche Batch-Dateien repräsentieren. Die statische Alternative ist unter allen Betriebssystemen die Manipulation der Konfigurations-Dateien.

## 3. Die Benutzeroberfläche

!["Dashboard"](img/dashboard1.jpg "Dashboard")

Jupyter startet mit einem sogenannten Dashboard. Hier finden wir zuerst einmal drei Reiter, wobei der erste Reiter voreingetellt ist.

1. Files (Dateien): Eine Ansicht der Dateien und Ordner im Startverzeichnis. Sie dient der Navigation in den Ordnern und dem Öffnen von Dateien, z.B. Notebooks. Hier können Dateien und Ordner auch markiert und gelöscht werden. Auf der rechten Seite finden wir:

2. Running (geöffnete Notebooks): Hier hat man eine Üersicht über die aktuell geöffneten Notebooks.

3. Clusters: Parallele Datenverareitung. Dies werden wir hier nicht besprechen.

Doch kommen wir zurück zu Reiter 1:

1.1. Upload: Hier kann man Dateien hochladen, z.B. Bilder. Sie landen genau in dem Verzeichnis, das aktuell ausgewählt ist.

1.2. New: Hier wird ein neues Notebook erstelllt. Bei einer neuen Installation wird man hier nur die Auswahl haben, ein neues Python-Notebook zu erstellen. Im Bild sieht man die Auswahl "Java", weil das IJava-Kernel nachträglich installiert wurde.

!["New"](img/menu1.jpg "New")

Weiterhin lassen sich Verzeichnisse(Folder) oder einfache Tetdateien erstellen.

## 4. Erstes Notebook

Durch die Auswahl von "Python 3" im Menu "New" erzeugen wir ein neues Notebook, das mit dem Python 3-Kernel läuft, d.h. wir können Python 3-Code in entsprehende Zellen eingeben und ausführen. Das Notebook stellt sich so dar:

!["Erstes Notebook"](img/notebook1.jpg "Erstes Notebook")

Wir betrachten hier nicht die Menupunkte der Reihe nach, sondern beginnen mit der ersten, automatisch erzeugten Zelle, beginnend mit in[ ] und unterhalb der Symbolleiste. Dort geben wir den Befehl 

print("Hallo Welt!" 

ein. Man beachte die Autoergänzung: zu jedem " gehört ein Zweites, zu jedem [ gehört ein ]. Nun klicken wir auf

!["Run cells](img/runcell.jpg "Run cells") 

in der Symbolleiste oder im Menu "Cell" auf "Run Cells" (Probiert man beide aus, sieht man einen Unterschied. Das Symbol steht für "Run cells, select below" und erzeugt eine neue Zelle):

In [1]:
print("Hallo Welt!")

Hallo Welt!


Wir sehen, dass die ursprüngliche Zell nun mit in[1] eingeleitet, was uns anzeigt, dass es sich um die erste erzeugte Zelle handelt. Darunter sehen wir die Ausgabe "Hallo Welt!". Nun klicken wir auf 

!["Neue Zelle"](img/neuezelle.jpg "Neue Zelle")

oder auf den Punkt "Insert cell below". Nun wählen wir in der Ausahliste

!["Zelltyp"](img/Zelltyp.jpg "Zelltyp")

den Typ "Markdown" aus. Das in[ ] verschwindet links vor der Zelle. In der Zelle können wir nun einen Text eingeben. Wieder klicken wir auf "Run cells". Die Zelle an sich scheint erschwunden zu sein, dafür erscheint der eingegebene Text nun in einer anderen Schriftart.

Markdown kann als Superset von HTML, der Hypertext Markup Language, verstanden werden. D.h. dass HTML-Code innerhalb eines Markdown-Textes eingesetzt werden kann. Markdown selbst ist eine Möglichkeit, Formatierungen usw. zu verwenden, ohne dass der Text wie bei HTML schwer lesbar wird. Der Text dieser Zeilen wurde in Markdown geschrieben. Mehr dazu unten.

## 5. Markdown

Markdown-Text wird in HTML gerendert, nur eingefügter HTML-Code bleibt unerändert. Innerhalb von HTML-Code kann Marup-Text nicht umgewandelt werden. Um den urpsünglichen Markdown-Text den gerendeten Versionen gegenüberstellen zu können, wurden die ungerenderte Texte in Zitate (siehe unten) verbracht, gefolgt on einer Markdown-Zelle.

### 5.1. Absätze

Absätze werde durch Leerzeilen erzeugt, wobei "leer" bedeutet, das keine sichtbaren Zeichen vorhanden sind:

>Dies ist Absatz 1.
>
>Dies ist Absatz 2.

Dies ist Absatz 1.

Dies ist Absatz 2.

Hier erkennen wir einen großen Unterschied zu HTML, denn in HTML sind Leerzeilen bedeutungslos. Aber in Markdown soll der Quelltext eben gut lesbar sein.

### 5.2. Zeilenumbrüche

Zeilenumbrüche können durch Anfügen von zwei oder mehr Leerzeichen herbeigeführt werden. Die Erzeugung einer neuen Zeile im Quelltext ohne Leerzeichen führt im gerenderten Text nicht zum Umbruch. Beispiel:

>Zwei Leerzeichen__
>oder mehr.

Der Unterstrich wurde hier zur Sichtbarmachung der Leerzeichen verwendet.

Zwei Leerzeichen  
oder mehr.

"Leerzeichen" sind natürlich nicht in der Zelle mit dem gerenderten Text zu sehen.

### 5.3 Kopfzeilen

Es gibt zwei Möglichkeiten, Kopfzeilen zu erzeugen:

Dies ist eine H1 Kopfzeile.
=============== 
Dies ist eine H2 Kopfzeile.
-------------------------------

Üblicher ist der Gebrauch des "sharp"-Zeichnes:

# H1 
## H2 
### H3

Die Kopfzeilen (Header) können auch geschlossen werden, was im Quelltext besser aussieht:

### Titel ###

### 5.4. Zitate 

Zitate werden mit dem ">" ("größer als") Zeichen eingeleitet:

>The time has come,' the Walrus said,  
>To talk of many things:  
>Of shoes — and ships — and sealing-wax —  
>Of cabbages — and kings —  
>And why the sea is boiling hot —  
>And whether pigs have wings.'

Es gibt eine "faule" Variante der Zitate, die aber nicht der Forderung nachkommt, dass sie im Quelltext gut erkennbar sein sollen:

>Dies ist ein  
mehrzeiliges Zitat.  
Aber...

Eine Schachtelung von Zitaten ist möglich:

>Ein Zitat, in dem zitiert wird:
>
>>"Dies ist ein Zitat!"
>
>Ende des Zitats.

Innerhalb eines Zitates können andere Elemente wie Listen (siehe unten) und Kopfzeilen verwendet werden.

### 5.5. Listen

Unsortierte Listen werden durch die Zeichen Plus, Minus oder Sternchen, gefolgt von den Listenelementen, erzeugt:

- Äpfel
- Birnen
- Pflaumen
- Orangen

Sortierte Listen werden durch eine Zahl gefolgt von einem Punkt vor dem Listenelement erzeugt. Die Zahl im Quelltext hat keine Auswirkungen auf die gerenderte Liste:

1. Erstes Element
1. Zweites Element
1. Drittes Element

Diese Vorgehensweise widerspricht natürlich der Idee von Markdown, dass der Quelltext optisch möglichst nahe am Ausgabeformat liegen soll. Soll eine Zahl mit einem Punkt dahinter als solche dargestellt werden, so muss der Zahl ein Backslash folgen:

42. Die Antwort auf...

42\. Die Antwort auf...

### 5.6. Code

Code-Blöcke (Python, HTML, Markdown etc.), die zur Dokumentation in den Text eingefügt werden sollen, werden durch 4 Leerzeichen vor jeder Zeile oder einem [Tab] eingeleitet:

In Markdown kann man auch 

    #### Kopfzeilen
    
oder

    **Fettschrift**

dartellen.

Wir sehen oben dass in der Markdown-Zelle diese eingefügten Markdown-Anweisungen nicht gerendert werden. Man kann auch Code inline, also innerhalb einer Textzeile einfügen. Hierfür wird das Backtickzeichen ` benutzt.

Mit `print("Hallo Welt!")` begrüßen wir die Python-Welt.

Es gibt eine Variante, die Jupyter untertsützt:

```javascript
function fancyAlert(arg) {
  if(arg) {
    $.facebox({div:'#foo'})
  }
}
```

### 5.7. Fettschrift und Kursivschrift

Durch das Umschließen von Text mit dem Unterstrich _ oder dem Stern * erzeugt man Kursivschrift. Ein doppelter Unterstrich oder doppelter Stern erzeugt Fettschrift:

_test_

__test__

*test*

**test**

### 5.8. Tabellen

Es gibt inzwischen einige Erweiterungen des ursprünglichen Markdown, die z.T. von Jupyter unterstützt werden. Unter anderem gibt es das GitHub Flavored Markdown (GFM), welches auch Tabellen-Erzeugung unterstützt:

Vorname  | Nachname | Alter
-------- | -------- | --------
Karl     | Maier    | 21.7.1989
Otto     | Müller   | 1.7.1999

Weitere informationen hierzu finden man unter http://markdown-syntax.de/Syntax-GFM/Tabellen/

### 5.9. Links

Links können in Markdown auf fogende Art im Text (inline) angegeben werden:

Man findet [hier](https://de.wikipedia.org/wiki/Seiichi_Miyake "Seiichi Miyake") mehr zu Seiichi Miyake.

Die ersten eckigen Klammern umschließen den Text, der mit dem Link hinterlegt wird. Danach folgt ein Konstrukt aus runden Klammern, welches den Link enthält, danach ein Leerzeichen, gefolgt von einem optionalen Titel in Anführungszeichen. Wenn Links zu Dateien in der gleichen (serverseitigen) Verzeichnisstruktur führen, gelten die Regeln wie bei HTML:

### 5.10. Bilder

Bilder werden wie folgt eingebunden:

![Ein Pinguin](img/picture.jpg "Ein Pinguin")

Statt wie hier eine relative URL zu verwenden, kann man auch eine absolute URL der Form "http://..." nutzen.

### 5.11. Vermischtes und weitere Quellen

Die Möglichkeiten von Markdown wurden hier nicht vollständig dargestellt. Insbesondere wurde auch nicht auf die dieversen Erweiterungen eingegangen, die aber auch nicht alle von Jupyter unterstützt werden. Ein Beispiel ist durchgestrichener Text:

~~Diese Ausage ist wahr.~~

Eine Übersicht über Markdown, diverse Implementierungen dieses Standards und die Übersetzung in HTML findet man im [Wikipedia-Artikel](https://en.wikipedia.org/wiki/Markdown "Markdown") zu diesem Thema. Markdown wurde 2004 von [John Gruber](https://daringfireball.net/projects/markdown/syntax "John Gruber") entwickelt. Eine verbesserte Spezifikation ist [CommonMark](https://commonmark.org/ "CommonMark"). Hier gibt es auch ein interaktives Tutorial. Eine deutschsprachige Quelle findet sich [hier](https://markdown.de/ "markdown.de"). Hilfreich ist auch der [Markdown Guide](https://www.markdownguide.org/ "Markdown Guide").

## 6. Mathematische Formeln

Zur Darstellung von mathematischen Formeln nutzt Jupyter [MathJax](http://docs.mathjax.org/en/latest/mathjax.html "MathJax"). MathJax ermöglich unter anderem die Benutzung von Formeln im TeX/LateX-Stil. Ziel ist die publikationsreife Darstellung von Formeln. Hier wird nicht auf alle Möglichkeiten eingegangen, mit Hilfe der genannten Quellen sollte jedoch eine umfassende Nutzung möglich sein. Für die umfassende Nutzung von Jupyter, z.B. die Ausgabe eines Notebooks als PDF- oder Tex-File, sollte man eine Tex-Installation wie [MiKTeX](https://miktex.org "MiKTeX") installieren. Formeln werden in Markdown-Zellen eingefügt. Hier ein Beispiel:

\begin{align}
x = y
\end{align}

Neben dieser Möglichkeit gibt es auch die Verwendung innerhalb eines Textes:

Hier ein einfaches Beispiel: $f(x) = \sqrt(x)$. Alles klar?

### 6.1. Einige Formeln

Grundätzlich sind viele komplexe Formelkonstrukte möglich. Wie man sieht, ist die Augabe publikationsreif:
$$
\overbrace{f(x)=x^2}^{\text{Funktion $f$}}\\
\underbrace{f'(x)=2x}_{\text{Ableitung von $f$}}
$$
Hier der zugrunde liegende Code:

Wir werden hier nur ein paar Beispiele anschauen. Am Ende des Abschnitts gibt es natürlich Links zu weiterführender Literatur. Derweil mag zum Experimentieren der Online-Editor unter https://www.zahlen-kern.de/editor/ hilfreich sein.

#### 6.1.1. Exponenten und Wurzeln

Wie man einfach eine Zahl mit einem Exponenten versieht ("Potentieren"), haben wir oben schon gesehen. Wie sieht es mit nicht ganzahligen Potenzen und Wurzeln aus? (Die Qaudratwurzel haben wir ebenfalls schon oben kennengelernt.)

$$
x^{3/4} = \sqrt[4]{x^{3}}
$$

#### 6.1.2. Summen

Als Beispiel für eine Summe sieht man unten die empirische Verteilungsfunktion:

$$
F(x) = \sum_{i:a_i \leq x} f_i
$$

Der Aufbau einer Formel kann im Quelltext sehr unleserlich sein, für komplexere Formeln (gemeint ist hier die sichtbare Struktur einer Formel, nicht deren mathematische Bedeutung) benötigt man sicher Erfahrung oder Recherche im Web.

### 6.2. Weiterführende Links

Einige ["motivierende Beispiele"](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Typesetting%20Equations.html) findet man in der [Dokumentation](https://jupyter-notebook.readthedocs.io/en/stable/index.html#). Die Hochschule Augsburg hat einige [Beispiele](http://python.hs-augsburg.de:8888/notebooks/DuR/Mathematische%20Formeln.ipynb) auf Deutsch parat. [Hier](https://stackoverflow.com/questions/13208286/how-to-write-latex-in-ipython-notebook) findet man eine Disussion über andere Ausgabemöglicheiten, z.B. direkt in einer Code-Zelle. Es gibt viele weitere Quellen: Suche "Jupyter Latex", "Jupyter Formeln" usw.

## 7. Ausführbarer Code

Unter den Zelltypen im Menu "Cells" kann man auch den Standard voreingestellt lassen. Diese Einstellung meint nicht die unter 5.6. beschriebene Formatierungseinstellung. Hier geht es um um Code, der tatsächlich serverseitig ausgeführt wird.

In [1]:
print("Hallo Welt!")

Hallo Welt!


Gestartet wird das Skript über den Menüpunkt Cell/Run Cells. Dabei wird die Ausgabe des serverseitig ausgeführten Skripts auf den Client (Browser) umgelenkt und dort unterhalb der ausgeführten Zelle per JavaScript ausgegeben. Standardsprache ist Python. Über sogenannte Kernels lässt sich Jupyter aber so erweitern, dass auch andere Skriptsprachen wie z.B. R ausgeführt werden können. Seit Java 9 gibt es die JShell, die es ermöglichte mit einem entsrechenden Kernel selbst Java in Jupyter zunutzen, obwohl es sich hier um eine Skriptsprache handelt.Eine Liste von Kernels findet sich [hier](https://github.com/jupyter/jupyter/wiki/Jupyter-kernels). An anderer Stelle soll mehr über die Nutzung von Jupyter mit Python beschrieben werden.