Hello, World! Wir wollen heute eine möglichst kurze und kompakte Einführung in Python geben. Dieses Notebook dient dabei zur praktischen Veranschaulichung der heutigen Inhalte, soll aber auch als Lernmaterial zum späteren Nachlesen herhalten.
Üblicherweise beginnt man in jeder Programmiersprache mit dem Ausdruck "Hello, World!". Mit diesem Ausdruck können meist ein paar grundlegende Eigenschaften der jeweiligen Programmiersprache gezeigt werden.

In [8]:
print("Hello, World!")

Hello, World


Der obige Ausdruck zeigt uns Folgendes:
- Die oben benutzen Klammern sind eines der grundlegenden Features von Python, aber auch vielen anderen Programmiersprachen. Auf das, was innerhalb der Klammer steht, wird die außen beschriebene Funktion angewandt (in diesem Fall der print-Befehl).
- Einer der wichtigsten Befehle in Python ist der print()-Befehl. Mit ihm kann man sich Ausdrücke in die Konsole ausgeben.
- Schriftzeichen werden im Allgemeinen in Anführungszeichen geschrieben (dabei ist unerheblich ob '' oder "" genutzt wird). Bei numerischen Ausdrücken ist dies übrigens nicht nötig.

In Jupyter Notebooks wird der print()-Befehl nicht zwangsläufig benötigt - eine Ausgabe erfolgt auch, falls nur ein Wert ausgegeben wird und dieser in der letzten Zeile steht (wenn auch mitunter in leicht anderem Format)!

In [11]:
"Hello, World!"

'Hello, World!'

Da wir nicht jedes Mal von Neuem Code schreiben wollen, kann man Code in Variablen speichern. Man kann jegliche in Python verfübaren Datentypen in einer Variable speichern. Dazu nutzt man den sogenannten Assignment Operator "=". Man schreibt den Namen der Variable auf die linke Seite des Gleichzeichens und den Code, der der Variable zugewiesen werden soll, auf die rechte Seite. Grundsätzlich sind Variablennamen klein zu schreiben. Leerzeichen werden durch Underscores _ ersetzt.

In [12]:
tutor1 = "Torben"
tutor2 = "Jonas"
age_tutor1 = 22
age_tutor2 = 23

In [15]:
print(tutor1, age_tutor1)
print(f"{tutor2} ist {age_tutor2} alt.")  # fortgeschrittenere Variante

Torben 22
Jonas ist 23 alt.


In Python lassen sich verschiedenste mathematische und logische Operatoren einsetzen. Diese Operatoren werden im Grunde genommmen wie auch sonst "im richtigen Leben" verwendet. Hier einige Beispiele:

In [6]:
# Mathematische Operatoren

# Addition
sum_numbers = 7 + 8 + 15
print("sum_numbers:", sum_numbers)

# Subtraktion
number1, number2, = 25, 17
diff_numbers = number1 - number2 # kann man auch mit Variablen machen, sofern diese numerische Ausdrücke beschreiben
print("diff_numbers:", diff_numbers)

# ... und jegliche andere Rechenoperationen (siehe Slides)

sum_numbers: 30
diff_numbers: 8


In [17]:
# Logische Operatoren --> ergeben stehts Wahrheitsausdrücke (True oder False)

print(True and False)
print(True or False)
print(not False and True)


print(20 * "-") # Trennlinie

# Auch diese Operatoren können wieder mit Variablen genutzt werden, denen die richtigen Ausdrücke zugewiesen sind
# Beachte: eine 1 ist dasselbe wie True, eine 0 dasselbe wie False

num0 = 0
num1 = 1
num2 = 2

print(num0 and num1)
print(num2 - num1 and num1)
print(num0 or True)

False
True
True
--------------------
0
1
True


Oben ist - wie gesagt - nur ein Ausschnitt aller möglichen Operatoren gezeigt. Eine Liste der verschiedenen mathematischen und logischen Operatoren findet ihr auch in den Slides. Des Weiteren gibt es noch die Bitwise Operatoren. Diese operieren auf der Bit-Ebene, arbeiten also mit den zu 1en und 0en konvertierten Zeichen. Auf diese näher einzugehen würde aber den Rahmen sprengen (für Interessierte: https://www.geeksforgeeks.org/python-bitwise-operators/).

Wie bereits mehrfach im obigen Code gezeigt, können auch Kommentare in eingefügt werden. Diese werden von der Maschine ignoriert, sollten aber unbedingt zur besseren Lesbarkeit des Codes eingefügt werden. Kommentare können nach dem # Symbol eingefügt werden.

In [8]:
"Kein Kommentar - wird ausgegeben"

'Kein Kommentar - wird ausgegeben'

In [9]:
# Kommentar - keine Ausgabe

Die restlichen Zusammenhänge wollen wir an einem praktischen Beispiel deutlich machen. Dafür importieren wir den SWIID-Datensatz (Solt, 2021). Dieser enthält verschiedenste Kenndaten zur wirtschaftlichen Ungleichheit in mehreren Ländern über viele Jahre hinweg.

In [21]:
# Install a pip package in the current Jupyter kernel
import sys
!{sys.executable} -m pip install pandas

import pandas as pd

# import Swiid dataset
swiid = pd.read_csv("swiid7_1_summary.csv")
swiid = swiid.astype({"year": int}, errors='raise') 
swiid.head()



Unnamed: 0,country,year,gini_disp,gini_disp_se,gini_mkt,gini_mkt_se,abs_red,abs_red_se,rel_red,rel_red_se
0,Afghanistan,2007,30.4,2.5,33.3,2.8,,,,
1,Afghanistan,2008,30.5,2.5,33.4,2.9,,,,
2,Afghanistan,2009,30.5,2.5,33.6,3.0,,,,
3,Afghanistan,2010,30.5,2.7,33.7,3.0,,,,
4,Afghanistan,2011,30.6,2.7,33.7,3.0,,,,


Zuerst wollen wir uns damit beschäftigen, welche Länder wir in unserem Datensatz haben. Dazu lassen wir uns ein Array (Sammelobjekt) aller Element in der Spalte country ausgeben und entfernen die Duplikate.

In [38]:
countries = swiid.country.unique()
countries

array(['Afghanistan', 'Albania', 'Algeria', 'Angola', 'Anguilla',
       'Antigua and Barbuda', 'Argentina', 'Armenia', 'Australia',
       'Austria', 'Azerbaijan', 'Bahamas', 'Bangladesh', 'Barbados',
       'Belarus', 'Belgium', 'Belize', 'Benin', 'Bhutan', 'Bolivia',
       'Bosnia and Herzegovina', 'Botswana', 'Brazil', 'Brunei',
       'Bulgaria', 'Burkina Faso', 'Burundi', 'Cambodia', 'Cameroon',
       'Canada', 'Cape Verde', 'Central African Republic', 'Chad',
       'Chile', 'China', 'Colombia', 'Comoros', 'Congo-Brazzaville',
       'Congo-Kinshasa', 'Costa Rica', "Côte d'Ivoire", 'Croatia',
       'Cyprus', 'Czech Republic', 'Czechoslovakia', 'Denmark',
       'Djibouti', 'Dominica', 'Dominican Republic', 'Ecuador', 'Egypt',
       'El Salvador', 'Equatorial Guinea', 'Estonia', 'Ethiopia', 'Fiji',
       'Finland', 'France', 'Gabon', 'Gambia', 'Georgia', 'Germany',
       'Ghana', 'Greece', 'Grenada', 'Guatemala', 'Guinea',
       'Guinea-Bissau', 'Guyana', 'Haiti', 'Hondura

Wie wir sehen können, ist die Sammlung ziemlich lang. Wir greifen nun den ersten Wert heraus, um mit diesem arbeiten zu können. Beachte dabei, dass man in Python beginnnt bei 0 zu zählen.

In [39]:
first_country = countries[0]
first_country

'Afghanistan'

Wie wir sehen können, wird uns der entsprechende Wert (wie auch in der Sammlung weiter oben) in Anführungsstrichen ausgegeben. Dies zeigt an, dass es sich um einen String handelt, was wir auch mit der type()-Funktion überprüfen können.

In [40]:
type(first_country)

str

Auch Zahlen können Strings sein, wenn sie in "" geschrieben werden. Hier muss man jedoch aufpassen, da diese dann ihre spezifischen Eigenschaften als numerische Werte verlieren (weshalb ein Fehler geworfen wird).

In [41]:
2 + "2"

TypeError: unsupported operand type(s) for +: 'int' and 'str'

Mit Strings kann man verschiedenste Sachen machen. Hierzu kann man unter anderem die in Python vorgefertigten Methoden benutzen: https://www.w3schools.com/python/python_ref_string.asp

Als nächstes wollen wir uns einem weiteren Datentyp zuwenden, dem int. Dazu schauen wir auf die zweite Spalte der Tabelle, die Jahreszahlen. Hier lassen wir uns wieder alle Jahreszahlen ausgeben, diesmal mit Duplikaten

In [46]:
years = swiid["year"].tolist()
years

[2007,
 2008,
 2009,
 2010,
 2011,
 2012,
 1996,
 1997,
 1998,
 1999,
 2000,
 2001,
 2002,
 2003,
 2004,
 2005,
 2006,
 2007,
 2008,
 2009,
 2010,
 2011,
 2012,
 1988,
 1989,
 1990,
 1991,
 1992,
 1993,
 1994,
 1995,
 1996,
 1997,
 1998,
 1999,
 2000,
 2001,
 2002,
 2003,
 2004,
 2005,
 2006,
 2007,
 2008,
 2009,
 2010,
 2011,
 2000,
 2001,
 2002,
 2003,
 2004,
 2005,
 2006,
 2007,
 2008,
 2009,
 2002,
 2003,
 2004,
 2005,
 2006,
 2007,
 2008,
 2009,
 2007,
 1961,
 1962,
 1963,
 1964,
 1965,
 1966,
 1967,
 1968,
 1969,
 1970,
 1971,
 1972,
 1973,
 1974,
 1975,
 1976,
 1977,
 1978,
 1979,
 1980,
 1981,
 1982,
 1983,
 1984,
 1985,
 1986,
 1987,
 1988,
 1989,
 1990,
 1991,
 1992,
 1993,
 1994,
 1995,
 1996,
 1997,
 1998,
 1999,
 2000,
 2001,
 2002,
 2003,
 2004,
 2005,
 2006,
 2007,
 2008,
 2009,
 2010,
 2011,
 2012,
 2013,
 2014,
 2015,
 1988,
 1989,
 1990,
 1991,
 1992,
 1993,
 1994,
 1995,
 1996,
 1997,
 1998,
 1999,
 2000,
 2001,
 2002,
 2003,
 2004,
 2005,
 2006,
 2007,
 2008,
 2009,

Wie man sieht, bekommt man eine sehr lange Liste der Jahreszahlen. Wieder wollen wir uns zur Veranschaulichung die eine Zahl greifen, diesmal die hundertste.

In [47]:
years_100 = years[99]
years_100

1994

Wieder wollen wir nun den Typen bestimmen.

In [49]:
type(years_100)

int

Ints sind grundsätzlich alle ganzen Zahlen. Diese können nun mit allen mathematischen und logischen Operatoren genutzt werden. Beispielsweise können wir gucken, ob die erste Zahl in der Tabelle größer ist als die letzte:

In [50]:
years[0] > years[-1] # von hinten gezählt

False