<a href="https://colab.research.google.com/github/dgromann/ProgrammingForTranslators/blob/master/ErsteSchritte.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Programmieren für ÜbersetzerInnen - Erste Schritte

Dieses Notebook bietet einige interaktive Programmierübungen für Ihre ersten Schritte in der Welt des Programmierens. Es wurde eigens für diesen Workshop angelegt. 

Wenn Sie den nachfolgenden Code auf Ihrem eigenen Windows-Computer zuhause ausführen möchten, folgen Sie bitte den Anweisungen in der Datei "ZuhauseProgrammieren.docx".

### Warum programmieren?
Damit kann man "langweilige" Aufgaben automatisieren, wie etwa suche nach Kollokationen in Text oder die Berechnung der Gewichtung von Fachausdrücken (z. B. TF-IDF Gewichtungen), und jede Anwendung genau an die eigenen Bedürfnisse anpassen. 

### Warum Python?

Es gibt viele verschiedenen Programmiersprachen, z. B. Java, C++, C#, etc. Warum also sollte man also gerade Python lernen? 


*   *Leicht zu lernen*: eine der einfachsten Programmiersprachen für absolute Anfänger - auch auf diesem Prinzip erstellt
*   *Stark nachgefragt*: großer Bedarf an Python-Softwareentwicklern am Markt
*   *Weit verbreitet*: Python wird am häufigsten für maschinelles Lernen, inklusive maschineller Übersetzung, Natural Language Processing (NLP) und künstliche Intelligenz im Allgemeinen eingesetzt 
*   *Große Gemeinschaft*: je mehr Programmierer es gibt, desto mehr Hilfestellungen findet man in Online-Gemeinschaften und -Foren. Es gibt beinahe kein Problem in Python, für das nicht schon online eine Lösung gefunden wurde.

Daher ist Python eine sehr attraktive Programmiersprache für SprachexpertInnen. 

# Lektion 1: Hallo Welt!

In der Welt des Programmierens besteht die lange Tradition als erste Aufgabe in der neuen Sprache "Hello World!" auf dem Bildschirm anzeigen zu lassen. 

Der Befehl `print("Hello World!")` macht genau das wonach er klingt, er gibt den Text innerhalb der Klammern und Anführungszeichen am Bildschirm aus.

Die nachstehende graue Zelle ist eine Code-Zelle. Das heißt der darin enthaltene Programmiercode kann vom Computer ausgeführt werden. Code muss nicht nur geschrieben, sondern auch ausgeführt werden. In unserer Workshopumgebung machen Sie dass, indem Sie einmal auf die graue Zelle klicken und dann auf die Schaltfläche "&#9658;| Run" unter der Menüleiste klicken oder aus dem Menü "Cell" den Befehl "Run Cells". 

Fragen und praktische Aufgaben werden hier als **Frage** bzw. **Aufgabe** gekennzeichnet. **Fragen** fordern Sie dazu auf Überlegungen anzustellen bevor Sie etwas praktisch testen. **Aufgaben** erfordern das aktive Schreibenv on Code in der grauen Code-Zelle nach der Aufgabenbeschreibung. 


**Frage:** \\
Was passiert wenn Sie den nachstehenden Code ausführen?

In [3]:
print("Welcome to Python!")

Welcome to Python!


**Aufgabe:** \\
Führen Sie den nachstehenden Code aus. Sie werden eine Fehlermeldung erhalten: 


*   Die erste Zeile zeigt die Datei und Zeilennummer an in welcher der Fehler aufgetreten ist.
*   Die zweite Zeile markiert die Position des Fehlers in der Zeile.
*   Die dritte Zeile zeigt an um welche Art von Fehler es sich handelt (EOL = End of Line bzw. auf Deutsch Zeilenende).


Was muss im Code geändert werden um den Fehler zu beheben? 

In [0]:
print("Hello World!

# Lektion 2: Variablen 

Variablen sind im Grunde Speicherplätze für Daten. Variablen speichern einen Wert, egal ob Zahl, Text oder Boolsche Werte (wahr oder falsch). Wenn man diesen Wert später wieder verwenden will, verwendet man einfach die Variable. 

Im Gegensatz zu anderen Programmiersprachen gibt man bei Python die Art der Variable nicht explizit an. Python erkennt die Art der Variable aufgrund des angegebenen Werts. Also anstelle von `int n = 2` für eine ganze Zahl (int = Integer), kann man in Python einfach `n = 2` sagen und dasselbe Ziel erreichen. 

Es gibt in Python verschiedene Arten von Datentypen:

*   Zahlen
*   Strings (Zeichenfolge)
*   Collections
  *   Liste (geordnete und veränderbare Sammlung; Mehrfachnennungen möglich)
  *   Tuple (geordnete und nicht veränderbare Sammlung; Mehrfachnennungen möglich) 
  *   Set (ungeordnet und veränderbare Sammlung; keine Mehrfachnennungen)
  *   Dictionary (ungeordnet, veränderbare, indizierte Sammlung; keine Mehrfachnennungen)

Wir konzentrieren uns in diesem Einstiegstutorial auf Zahlen, Strings, und Listen. 




 





## Lektion 2.1: Zahlen



Zahlen können auch direkt eingegeben werden, ebenso wie Text, sind dann aber nicht wiederverwendbar.  

In [0]:
# Als Variable 
result = 2 + 2 
print(result)

# Direkte Eingabe 
print("Auch dasselbe Ergebnis: ", 2 + 2)

Zahlen können als numerische Variablen gespeichert werden. 

**Frage:** \\
Was passiert wenn man die folgende Code-Zelle ausführt? Warum werden hier keine Anführungszeichen bei dem `print()`-Befehl verwendet verwendet?

In [97]:
num1 = 2 
num2 = 4 
result_num = num1 + num2 
print(result_num)

6


Das vorherige Beispiel zeigt ganze Zahlen, es ist aber auch möglich Zahlen mit  Nachkommastellen (sogenannte "floats") darzustellen: 

In [0]:
float1 = 2.1
float2 = 4.3 
float_result = float1 + float2
print(float_result)

Wenn der Code schon sehr lange ist oder es nicht ganz klar ersichtlich ist was für eine Art von Variable gerade vorliegt, kann man dies mit der Funktion `type()` ganz leicht herausfinden: 

In [0]:
print(type(num1))
print(type(float1))

**Frage:** \\
Was wird am Bildschirm ausgegeben wenn ich den folgenden Code ausführe und warum?

In [96]:
result1 = result + result_num
print(result1)

10


**Aufgabe:** \\
Addieren Sie die Variable `result1` mit dem Ergebnis der Float-Operation `float_result`, weisen Sie das Ergebnis einer neuen Variable `result2` zu und geben Sie das Ergebnis auf dem Bildschirm aus.

In [0]:
# Ich bin ein Kommentar und füge eine Beschreibung für Menschen hinzu (wird nie im Programm berücksichtigt)
# Schreiben Sie hier Ihre Addition.  
print()

### Lektion 2.1.1: Arithmetische Operatoren
Auf Zahlen können auch viele arithmetische Operationen ausgeführt werden.

**Aufgabe:** \\
Sehen Sie sich die Beispieloperationen in der nächsten Codezelle an und führen Sie die Zelle so wie sie ist aus. Welche der nachstehenden Operationen kennen Sie bereits? Welche nicht? Was könnte ihre Funktion sein? 

Um das herauszufinden, ändern Sie die Werte von `zahl1` und `zahl2` und führen Sie die Code-Zelle erneut aus. Wiederholen Sie diese Berechnung bis Sie eine Idee bekommen, was jede Operation genau mit den Zahlen macht. Wie Sie sehen kann ich auch direkt das Ergebnis ausgeben, ohne es vorher einer Variable zuzuweisen, wodurch das Ergebnis jedoch auch nicht gespeichert wird.


In [98]:
zahl1 = 6 
zahl2 = 2 

print("Addition: zahl1 + zahl2 = ", zahl1 + zahl2)
print("Subtraktion: zahl1 - zahl2 =  ", zahl1 - zahl2)
print("Multiplikation: zahl1 * zahl2 =  ", zahl1 * zahl2)
print("Division: zahl1 / zahl2 =  ", zahl1 / zahl2)
print("Modulus: zahl1 % zahl2 =  ", zahl1 % zahl2)
print("Exponent: zahl1 ** zahl2 =  ", zahl1 ** zahl2)

Addition: zahl1 + zahl2 =  8
Subtraktion: zahl1 - zahl2 =   4
Multiplikation: zahl1 * zahl2 =   12
Division: zahl1 / zahl2 =   3.0
Modulus: zahl1 % zahl2 =   0
Exponent: zahl1 ** zahl2 =   36


### Lektion 2.1.2: Vergleichsoperatoren

Wenn man zwei odermehr Variablen miteinander vergleichen will, ist die Verwendung vordefinierter Vergleichsoperatoren sehr sinnvoll.



*   `==`: übereprüft die Äquivalenz zwischen den Werten von zwei Variablen
*   `!=`: überprüft die Nicht-Äquivalenz zwischen den Werten von zwei Variablen 
*   `>`: überprüft ob der Wert der linken Variable größer ist als der Wert einer rechten 
*   `<`: überprüft ob der Wert der linken Variable kleiner ist als der Wert einer rechten 
*   `>=`: überprüft ob der Wert der linken Variable gößer oder gleich ist dem Wert der rechten einer anderen 
*   `<=`: überprüft ob der Wert der linken Variable kleiner oder gleich ist dem Wer der rechten einer anderen 


In [0]:
print("zahl1 == zahl2 ", zahl1 == zahl2)
print("zahl1 != zahl2 ", zahl1 != zahl2)
print("zahl1 > zahl2 ", zahl1 > zahl2)
print("zahl1 < zahl2 ", zahl1 < zahl2)
print("zahl1 >= zahl2 ", zahl1 >= zahl2)
print("zahl1 <= zahl2 ", zahl1 <= zahl2)

Das Ergebnis, dass hier ausgegeben wird stellt Boolsche Werte dar. Boolsche Werte können immer nur den Wert wahr (`True`) oder falsch (`Falsch`) annehmen udn sind beim Programmieren sehr wichtig. 

## Lektion 2.2: Strings

In "Strings" werden Textdaten in Python gespeichert. Strings können in einfachen oder doppelten Anführungszeichen dargestellt werden.
Zum Beispiel:

In [0]:
print('Das ist ein String.')
print("Das ist auch ein String")
print("Das ist der Unterschied:")
print('doesn\'t')
print("doesn't")
print('"Ja" hat er gesagt.')

Auch auf Strings kann die Operation der Addition angewandt werden:




In [0]:
name1 = "Dagmar"
name2 = " Gromann"
result_name = name1 + name2
print(result_name)


**Aufgabe:** \\
Erstellen Sie eine neue Variable für Ihren Vornamen und eine neue Variable für Ihren Nachnamen. Schreiben Sie dann eine Variable in der Sie beide addieren und geben Sie diese Variable am Bildschirm aus.  

In [0]:
# Schreiben Sie hier Ihren Vor- und Nachnamen als Variablen, addieren diese und geben das Resultat aus.
print()

Ein Leerzeichen kann und wird auch oft als eigener String definiert, um verschiedene Strings flexibel zu kombinieren. Zum Beispiel: 

In [0]:
objekt1 = "Banane"
objekt2 = "Apfel"
combination = objekt1 + " " + objekt2
combination2 = objekt2 + " " + objekt1
print(combination)
print(combination2)

Strings sind automatisch indiziert, dass heißt jedem Buchstaben wird ein Index zugewiesen, dann man direkt ansteuern kann. Der Index beginnt mit "0", da dies die übliche Zählweise in der Informatik ist - man beginnt immer bei 0.

In [0]:
print("Der erste Buchstabe des Wortes:", wort[0])
print("Der dritte Buchstabe des Wortes:", wort[3])
print("Vom ersten zum dritten Buchstaben:", wort[1:4]) 

Wird in einem Ausdruck mit zwei Indizes der erste ausgelassen, bedeutet es automatisch "von Anfang an". Wird der zweite ausgelassen, bedeutet es automatisch bis "ganz zum Ende".

In [0]:
print(wort[:3]) # Die ersten drei Buchstaben 
print(wort[3:]) # Alle außer den ersten drei Buchstaben
print(wort[:-2]) # Alles außer der letzten zwei Buchstaben
print(wort[-2:]) # Nur die letzten zwei Buchstaben

**Aufgabe:** \\
Geben Sie die letzten vier Buchstaben des Wortes "wort" mithilfe der nachstehenden Code-Zelle aus.

In [0]:
print(wort[])

### Lektion 2.2.1: Operatoren
Neben der Addition kann ein String auch multipliziert werden. 



**Frage:** \\
Was passiert wenn ein String mit einer bestimmten Zahl multipliziert wird? Kann ein String auch mit sich selbst multipliziert werden?

In [0]:
wort = "Terminologie"
print(wort * 5)

**Aufgabe:** \\
Welche dieser Vergleichsoperatoren kann auch sinnvoll auf Text angewandt werden?  Testen Sie Ihre Annahme in der nachstehenden Code-Zelle.

In [0]:
text1 = "Banane"
text2 = "Apfel"

print("text1 == text2 ", text1 == text2)
print("text1 != text2 ", text1 != text2)
print("text1 > text2 ", text1 > text2)
print("text1 < text2 ", text1 < text2)
print("text1 >= text2 ", text1 >= text2)
print("text1 <= text2 ", text1 <= text2)

**Aufgabe:** \\
Sehen Sie sich den nachstehende Code an und führen Sie in aus. Sie werden eine Fehlermeldung erhalten. Wie kann der Fehler behoben werden? (Welche Zeile muss verändert / gelöscht werden?)

In [0]:
x = 1
y = 2
first = "first"
print(x + y + 1) 
print(x + y + first)
print(first, x, y)

## Lektion 2.3: Listen

Im Gegensatz zu Zahlen und Strings, kann eine Liste mehrere Elemente speichern. 

In [0]:
my_string = "Programmieren für ÜbersetzerInnen"
my_list = ["Programmieren für ÜbersetzerInnen", "Freitag", "Februar", "Gymnasiumstraße"]
print(my_string)
print(my_list)

Listen sind ebenso wie Strings indiziert, d. h. bestimmte Positionen einer Liste können direkt angesprochen werden. Auch wie bei Srtings beginnen wir hier mit 0 zu zählen.

In [0]:
print(my_list[0])

**Aufgabe** \\
Geben Sie das Element "Freitag" aus der Liste `my_list` aus indem Sie den Index in Klammern von `0` auf den richtigen Index ändern:

In [0]:
print(my_list[0])

**Aufgabe** \\
Geben Sie die Liste `my_list` insgesamt drei Mal aus ohne die Variable öfter als einmal in den Code zu schreiben. 

In [0]:
# Wie kann my_list drei Mal ausgegeben werden ohne die Variable zu wiederholen?
print(my_list)

Listen können auch verschiedene Datentypen kombinieren:

In [0]:
my_mixed_list = ["Programmieren für ÜbersetzerInnen", "Freitag", "Februar", 14, 2020, "Gymnasiumstraße", 50, True]
print(my_mixed_list)

Es ist möglich einer Liste Elemente hinzuzufügen durch Verwendung der Funktion `append()` wobei in Klammern das anzuhängenden Element (hier die Zahl 0) angegeben wird. 

Die Funktion `len()` gibt die Länge - also die Anzahl der Listenelement bzw. die Anzahl der Buchstaben - der Variable, die ihr in Klammern übergeben wird, wieder. 

In [105]:
# Die Zahl 0 hinzufügen
my_mixed_list.append(0)
print(my_mixed_list)

# Die Länge der Liste ausgeben 
print("Länge von my_mixed_list: ", len(my_mixed_list))

# Funktioniert auch auf strings 
print("Länge von mein String: ", len(my_string))

['Programmieren für ÜbersetzerInnen', 'Freitag', 'Februar', 14, 2020, 'Gymnasiumstraße', 0]
Länge von my_mixed_list:  7
Länge von mein String:  33


Weiters können Elemente aus Listen mithilfe der Funktion `del` und dem Listennamen[Index] entfernt werden.

In [0]:
# Das Element auf Position 6 entfernen  
del my_mixed_list[6]
print(my_mixed_list)

# Die Länge der Liste ausgeben 
print("Länge von my_mixed_list: ", len(my_mixed_list))

**Aufgabe:** \\
Fügen Sie der nachstehenden Liste das Element "Apfel" hinzu und löschen Sie das Element "Banane". Wie viele Elemente hat die Liste (bitte ausgeben lassen und nicht manuell abzählen)?

In [0]:
test_list = ["Pfirsich", "Kiwi", "Mango", "Ananas", "Banane"]

print("Länge:")