<figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=250 ALIGN="right">
</figure>

# Skriptsprachen
### Sommersemester 2021
Prof. Dr. Heiner Giefers

# Einführung

In diesem Modul wird es um das Thema Skriptsprachen gehen.
Es stellt sich die Frage, was sind Skriptsprachen und vor allem, was unterscheidet Skriptsprachen von "normalen" Programmiersprachen?
Tatsächlich ist der Begriff *Skriptsprache* nicht ganz eindeutig definiert.
Es gibt aber einige charakteristische Eigenschaften, die man üblicherweise einer Skriptsprache zuordnet:

**1. Skriptprogramme werden nicht in Maschinencode compiliert**

Das bedeutet, dass ein Skriptprogramm auf einem Computer nicht allein lauffähig ist.
Es benötigt immer eine Laufzeitumgebung, die das Programm auf einem konkreten Computer ausführt.
Die Komponente der Laufzeitumgebung, die die Befehle des Skriptprogramms in Maschinencode übersetzt, nennt man Interpreter.

Als Maschinencode eines Computers bezeichnet man diejenigen Befehle, die direkt vom Prozessor ausgeführt werden können.
Je nach Prozessortyp ist dieser *Befehlssatz* unterschiedlich und daher sind Programme, die in Maschinencode kompiliert sind, nicht auf allen Computern lauffähig.
Außerdem greifen kompilierte Programme auf Schnittstellenfunktionen des Betriebssystems zu und sind daher noch vom Typ und der Version des installierten Betriebssystems abhängig.

Im Fall einer Skriptsprache ist die Laufzeitumgebung im Normalfall ein kompiliertes Programm, dass Sie vorab auf Ihrem Computer installieren müssen.
Die Skriptprogramme selbst sind aber völlig unabhängig vom Computertyp und auch vom Betriebssystem, lassen sich also in gleicher Form auf verschiedenen *Zielplattformen* ausführen.
Dieser Aspekt hat stark zur Verbreitung von Skriptsprachen geführt, denn ein Programmierer muss sich nicht darum Gedanken machen, ob sein Programm auf einem Windows oder Linux Betriebssystem läuft, oder ob die Architektur x86, ARM, oder irgend ein weiterer Prozessortyp ist.
Wenn ein Interpreter für die Zielplattform existiert, kann auch das Skriptprogramm ausgeführt werden.

Nach dieser Definition wäre auch Java eine Skriptsprache, denn Java-Programme sind auch nur innerhalb einer Java Virtuellen Maschine (der *JVM*) lauffähig.
es gibt aber noch einen weiteren Aspekt, der typische Skriptsprachen ausmacht.

**2. Skriptprogramme dienen häufig dazu, komplexere Aufgaben durch eine festgelegte Abfolge von Funktions- und Unterprogrammaufrufen zu automatisieren**

Im einfachsten Fall sind Skiptprogramme Stapelverarbeitungsdateien (engl. *batch file*) die eine Abfolge von Befehlen enthalten, die als Sequenz durch den Kommandozeileninterpreter eines Betriebssystems ausgeführt werden.
Auf Windows Systemen verbreitet ist die (aus MS-DOS-Zeiten stammende) Command Shell, die Skriptdateien, üblicherweise mit der Dateiendung `*.bat` verarbeiten kann.
Das folgende Beispiel zeigt ein Batch-Skript, dass von einer Command-Shell aus aufgerufen kann.
Die Shell *interpretiert*, also verarbeitet alle Befehle hintereinander.
So wird z.B. mit `CLS` zuerst der Ausgabebildschirm gelöscht, danach wird die Farbgestaltung der Ausgabe verändert und die Ausgabe "Hello, World" mit einer zusätzlichen Leerzeile erzeugt. Mit `PAUSE` wartet man auf einen Tastendruck des Benutzers.
Schließlich wird die Farbgebung wieder zurückgesetzt und das Skript (durch das erfolgreiche Abarbeiten des letzten Befehls) beendet.
<!--- PowerShell --->
```
@ECHO OFF
CLS
COLOR 5E
ECHO Hello, World
ECHO.
PAUSE
COLOR 07
```

Die neuere Windows PowerShell ist ebenfalls Skript-fähig (engl. *scriptable*), die übliche Dateiendung ist hierbei `.ps`.
Sehr verbreitet sind Shell-Skripte auf UNIX-artigen Betriebssystemen, wie etwa GNU/Linux.
Bash-Skripte z.B., sollten Ihnen aus früheren Vorlesungen vertraut sein.
 
Shell-Skripte für Kommandozeileninterpreter können auch Kontrollstrukturen (Bedingungen, Schleifen, etc.) enthalten und damit etwas komplexer sein.
Sie dienen aber immer der automatisierten Hintereinanderausführung von Kommandozeilenbefehlen.
Anders ist dies bei Skriptsprachen, die eher den Ansatz von Programmiersprache verfolgen.
Die meisten Skriptsprachen besitzen zwar auch einen interaktiven Modus, d.h. es gibt eine Art Shell, in die der Benutzer eine Sequenz von Befehlen *interaktiv* eingeben kann, dies ist aber nicht der normale Anwendungsfall.
Programme in Skriptsprachen wie etwa Python, Perl, PHP oder Ruby sind häufig deutlich umfangreicher als Shell-Skripte und enthalten komplexere Datenstrukturen.

## Vor- und Nachteile von Skriptsprachen

Häufig werden Shell-Skripte und Skiptprogramme eingesetzt, um kleinere Aufgaben zu automatisieren.
Da sie nicht zuerst kompiliert werden müssen, lassen sich Skripte schnell anpassen und sukzessive zur gewünschten Funktionalität ausbauen.
Skriptprogramme sind äußerst portabel, sie lassen sich unverändert auf allen Plattformen ausführen, für die ein Interpreter der Sprache existiert.

Ein Nachteil von Skriptsprachen ist, dass interpretierter Code deutlich (einer groben Schätzung nach ca. 100-mal) langsamer verarbeitet wird als in Maschinenbefehle kompilierter Code.
Die einzelnen Anweisungen des Programms müssen zuerst vom Interpreter analysiert und *verstanden* werden, bevor sie ausgeführt werden können.

Die Laufzeitumgebungen der meisten Skriptsprachen setzen aber verschiedene Tricks ein, um das Laufzeitproblem jedenfalls teilweise zu verbessern.
Python, Perl, Ruby, PHP und viele weiter Skriptsprachen werden nicht direkt interpretiert, sondern zuerst in eine Zwischenrepräsentation, den sogenannten *Bytecode* übersetzt.
Die Übersetzung beinhaltet, anders als z.B. beim Kompilieren eines C-Programms, wenige Analyse- und Optimierungsschritte, und kann daher relativ schnell durchgeführt werden.
Der resultierende Binärcode ist allerdings deutlich effizienter interpretierbar als der ursprüngliche Quellcode, was die Abarbeitung des Programms im Normalfall deutlich beschleunigt.

Manche Laufzeitumgebungen gehen sogar noch einen Schritt weiter und übersetzen den Binärcode zur Laufzeit des Programms in Maschinencode.
Dieser Mehraufwand lohnt sich vor allem für diejenigen Programmstellen, die sehr häufig ausgeführt werden.


## Python

In diesem Modul werden wir uns hauptsächlich mit der Skriptsprache Python beschäftigen.
Python ist eine sogenannte Multiparadigmensprache, was bedeutet, dass mehrerer Programmieransätze von der Sprache unterstützt werden.
In Python kann man sowohl imperativ, als auch objektorientiert, funktional und aspektorientiert programmieren.
Was das im einzelnen bedeutet, werden wir im Verlauf des Moduls noch genauer sehen.

Die Sprache selbst frei verfügbar und der Sprachstandard ist open-source.
Die Python Software Foundation steht als gemeinnützige Organisation hinter der Weiterentwicklung des Sprachstandards und der Referenzimplementation des Interpreters (CPython).

Zu etwas Verwirrung führt gelegentlich die Tatsache, dass mit der Version 3.0 im Jahre 2008 der Python-Standard von Grund auf überarbeitet wurde und damit nicht mehr abwärtskompatibel ist.
Das bedeutet, dass Python Programme, die den (heute immer noch verbreiteten) Standard 2.7 verwenden, nicht mehr mit Interpretern des neueren Standards ausgeführt werden können.

Es steht bereits fest, dass die 2er-Version von Python im Jahr 2019 erscheinen wird und dass ab dem Jahr 2020 Python2 nicht mehr unterstützt werden soll.
Wir werden daher aus guten Gründen in diesem Modul den neueren 3-er Standard der Sprache vorstellen und einsetzen.



## Literatur und Lehrbuch
Für dieses Modul werde ich Ihnen zu den einzelnen Themen Lehreinheiten (wie diese hier) zur Verfügung stellen.
Zum tieferen Verständnis und weiteren Nachschlagen gibt es eine Vielzahl von Python3 Lehrbüchern, einige davon finden Sie als Print- oder Online-Ressource in der Bibliothek.

Als Ersatz für den Lehrbrief dient das Lehrbuch **Ernesti und Kaiser, "Python 3: Das umfassende Handbuch", Rheinwerk 2018**, dass Sie in der Bibliothek ausleihen können.
Ich werde Ihnen zu jedem Präsenztermin die Abschnitt aus dem Lehrbuch nennen, in denen die jeweiligen Themen vertieft erklärt werden.
Das Buch enthält auch eine Vielzahl von Beispielen.
Es ist sehr empfehlenswert, einige dieser Beispiele selbst auszuprobieren und abzuwandeln.
So können Sie die Einzelheiten der Programmiersprache erproben und Praxiserfahrung sammeln.

### Auswahl und Installation einer Python-Distribution

Eine Hauptinformationsquelle und der erste Anlaufpunkt zum Thema Python ist www.python.org.
Dort finden Sie Links zum Sprachstandard, Dokumentationen und zur Referenzimplementation der Laufzeitumgebung mit dem Interpreter CPython.
Da Python eine offene Sprache ist, gibt es aber noch weitere Implementationen der Sprache, eine Auswahl finden Sie auf wiki.python.org/moin/PythonDistributions.

Eine Distribution, die sich in letzter Zeit besonderer Beliebtheit erfreut ist Anaconda [https://www.anaconda.com/distribution].
Die Distribution beinhaltet u.a. die integrierte Entwicklungsumgebung (IDE)  Spyder, den Kommandozeileninterpreter IPython, das webbasierte Umgebung Jupyter, sowie mächtige Werkzeuge für die Installation und Verwaltung von zusätzlichen Softwarepaketen.

Die Beispiele im Lehrbuch, sowie in den weiteren Lehrmaterialien verwenden die Anaconda Distribution.
Um Kompatibilitätsproblemen  vorzubeugen, empfehle ich Ihnen, auf Ihren privaten Geräten ebenfalls die Anaconda distribution zu verwenden.


**Aufgabe 1**

**Installieren Sie eine Python Distribution, vorzugsweise Anaconda, auf Ihrem Notebook.**

## Python im interaktiven Modus nutzen

Rufen Sie das Programm `ipython` auf.
Wenn Sie einen Anaconda auf einem Windows Computer installiert haben, finden Sie ein ausführbares Programm *ipython.exe* standardmäßig unter folgendem Dateipfad: `C:\Users\<Benutzername>\Anaconda3\Scripts\`.
Bei der Installation fügt Anaconda normalerweise das `Scripts`-Verzeichnis Ihrem Suchpfad hinzu, sodass die Programme von überall aus (also z.B. über die Windows-Suche) starten können.

Ebenfalls in der Anaconda Distribution mitgeliefert, ist die Standard Python Shell, die Sie mit dem Kommando `python.exe` aufrufen können.
Im Vergleich dazu bietet ihnen die ipython Shell eine farbige Hervorhebung von Schlüsselwörtern, eine formatierte Code-Darstellung und Auto-Vervollständigung.
Für die ersten Schritte in Python bietet es sich an, die interaktive Shell zu verwenden.

<br>
<br>
<figure>
  <IMG SRC="ipython.png" WIDTH=800 ALIGN="center">
</figure>
<br>
    


**Aufgabe 2**

**Starten Sie eine interaktive Python Shell und benutzten Sie sie als Taschenrechner.
Was passiert, wenn Sie das Zeichen `_` anstelle eines Operanden verwenden?**

## Python Skripte

Die interaktive Python-Shell ist im Grunde nichts anderes als ein Konsolenprogramm, dass Ihre Kommandos an den Python-Interpreter weiterleitet und dessen Ausgaben anzeigt.
Neben der interaktiven Verarbeitung können aber auch Anweisungen in einer Datei zusammengefasst werden und als Ganzes an den Interpreter übergeben werden.
Diese Dateien werden dann auch Skriptdatei oder kurz, Skript genannt.
Im Fall von Python ist die Dateiendung `.py` üblich, aber nicht vorgeschrieben.
Der Name des Skripts wird normalerweise als Argument an den Interpreter übergeben, als z.B. `python.exe myscript.py`.

Auf UNIX-artigen Betriebssystemen ist es möglich und üblich, am Anfang der Skriptdatei den zur Ausführung benötigten Interpreter über einen sogenannten *Shebang* (oder auch *Hashbang*) anzugeben.
Wenn man das Skript selbst, als ausführbares Programm in einer UNIX-Shell startet, so wird zuerst über das Kommando nach den beiden Zeichen `#!` die Ausführungsumgebung gestartet und dann das Skript als Argument an diese Umgebung übergeben.
Folgendes Beispiel zeigt ein einfaches Python-Skript, das die Versionsnummer des Interpreters auf der Kommandozeile ausgibt:

```python
#!/usr/bin/env python
import sys
print(sys.version)
```

### Python Notebooks

Jupyter Notebook ist eine Webanwendung, die eine grafische Benutzeroberfläche für Python (und andere Programmier-/Skriptsprachen) bietet.
Notebooks sind Dokumente die aus einer Folge von Zellen bestehen und einem Ausführungskernel zugeordnet sind.
Häufig wird als Kernel ein Python Interpreter verwendet, Jupyter unterstützt aber eine Reihe weiterer [Kernels](https://github.com/jupyter/jupyter/wiki/Jupyter-kernels).
Die einzelnen Zellen sind unterschiedlichen Typen zugeordnet, die wichtigsten Typen sind Code-Zellen und Markdown-Zellen.
Code-Zellen werden durch Drückern der Tastenkombination *Umschalttaste+Enter* (oder durch Klicken des *Run*-Buttons) auf dem assoziierten Kernel ausgeführt.
Markdown-Zellen enthalten neben reinem Text noch Formatierungsanweisungen; sie werden ebenso wie Code-Zellen durch *Umschalttaste+Enter* bestätigt und daraufhin vom Jupyter System gerendert.
Die [Markdown Syntax](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Working%20With%20Markdown%20Cells.html) ist relativ leicht zu erlernen, bietet aber gleichzeitig alle wichtigen Funktionen zum Erstellen optisch ansprechender Dokumente.

<br>
<br>
<figure>
  <IMG SRC="notebooks.png" WIDTH=800 ALIGN="center">
</figure>
<br>

**Aufgabe 3**

**Öffnen Sie dieses Notebook in Jupyter. Schreiben Sie einige Zeilen Python Code in die folgende Code-Zelle und führen Sie den Code aus.**