# Einführung in Python

In diesem Notebook erhältst du eine Einführung in Python.

Voraussetzungen:
- Du solltest bereits wissen, wie man ein `Jupyter Notebook` asuführt.

Viel Spaß!

---
## Variablen

Stell dir eine Variable wie eine Box vor, in die du etwas hineinlegen kannst – z. B. eine Zahl, ein Wort oder ein Ergebnis einer Rechnung.

Diese Box bekommt einen Namen, damit du sie später wieder verwenden kannst.

In [None]:
name = "Lena"
alter = 15

**Erklärung:**

> `name` ist eine Variable, die den Text "Lena" enthält. <br>
> `alter` ist eine Variable, die die Zahl 14 enthält.

**Was du noch wissen solltest**

> - Der Variablenname kann ein einzelner Buchstabe sein (z.B. `x`, `a`, `z`) oder auch ein Wort (z.B. `zwischenergebnis`, `temperatur`).<br>
> - Achte nur darauf, dass eine Variable nie mit einer Zahl beginnt oder Leerzeichen, Sonderzeichen oder Umlaute beinhaltet!<br>
> - Lange Variablen kannst du mit einem Unterstrich besser leserlich darstellen: `wichtiger_wert`

**Aufgabe**

> Definiere dir nun eigene Variablen. Verwende `print(...)`, um sie darzustellen. Hier einige Beispiele, wie man `print(...)` verwendet:

In [None]:
print("Name:")
print(name)
print(f"Mein name ist {name} und ich bin {alter} alt")

---
# Datentypen

Jede Variable hat einen Datentyp. Der Datentyp sagt Python, was für eine Art von Information gespeichert wird.

## Grundlegende Datentypen

Zunächst betrachten wir die grundlegendsten und wichtigsten Datentypen:

| Datentyp | Beschreibung                 | Beispiel          |
|----------|------------------------------|-------------------|
| `int`    | Ganze Zahl                   | `10`, `-3`, `0`   |
| `float`  | Kommazahl                    | `3.14`, `0.5`     |
| `str`    | Zeichenkette (Text/String)   | `"Hallo"`, `"123"`|
| `bool`   | Wahrheitswert (Boolean)      | `True`, `False`   |

Es ist wichtig zu verstehen, welche Variable mit welchem Datentyp *belegt* ist, denn dies hat Einfluss darauf, was bei einer Verarbeitung geschieht. Definieren wir uns erneut einige Variablen: 

In [None]:
zahl1 = 1
zahl2 = 5
zahl3 = 2.3
text1 = "hallo"

Nun können wir die Variablen **verabreiten**, also z.B. **addieren** oder **subtrahieren**, also mathematische Operationen anwenden:

In [None]:
summe1 = zahl1 + zahl2
print(summe1)

In [None]:
differenz1 = zahl1 - zahl2
print(differenz1)

**Aufgaben**

> 1. Was passiert, wenn wir `zahl1` und `zahl2` addieren? Was ist der Datentyp des Ergebnisses? Tipp: Wende `type(...)` auf dein Ergebnis an. <br>
> 2. Wende Multiplikation und Division an. <br>
> 3. Was passiert wenn du `zahl1` und `text1` addierst?

**Tipp:** Du kannst den Datentyp auch mit `type(..)` überprüfen:

In [None]:
type(zahl1)

---
## Besondere Datentypen

Neben den grundlegenden Datentypen gibt es noch besondere Datentypen, die etwas komplexer sind. Schauen wir uns einige an:

### Listen

Mit Listen kannst du mehrere Werte in einer einzigen Variable speichern. Das ist praktisch, wenn du z. B. mehrere Namen, Zahlen oder Objekte sammeln willst.

In [None]:
fruechte = ["Apfel", "Banane", "Kirsche"]
zahlen = [1, 2, 3, 4, 5]

# Wir können übrigens auch unterschiedlichste Datentypen in einer Liste sammeln:
verschiedenes = ["Apfel", 3, 5.6, False]

Du erkennst Listen an den eckigen Klammern `[` und `]`. Die Elemente darin sind durch *Kommas* getrennt.

Wir können eine Liste *als Ganzes* ausdrucken, oder nur ein bestimmtes Element daraus: 

In [None]:
print(fruechte)

In [None]:
print(fruechte[0])  # Apfel (erstes Element)
print(zahlen[2])   # 3 (drittes Element)

**Was du noch wissen solltest:**
> Das erste Element muss mit dem Index 0 addressiert werden: `fruechte[0]`<br>
> Listen haben besondere Eigenschaften. Man kann die Länge einer Liste bestimmen (`len(...)`) <br>
> Einer Liste können Elemente hinzugefügt werden (`.append(...)`)

In [None]:
n_fruechte = len(fruechte)

print("Anzahl an Früchten:", n_fruechte)

In [None]:
fruechte.append("Kiwi")

print(fruechte)

---
## Dictionaries

In sog. `Dictionaries` können wir auch ganz verschiedene Daten abspeichern - ähnlich wie in einer Liste. Der Unterschied ist, dass wir jedem Eintrag der Liste einen Namen geben können. So können wir bestimmte Einträge "beim Namen ansprechen":

In [None]:
daten = {"name": "Lena", "alter": 15, "lieblings_fruechte": fruechte}
print(daten)

In [None]:
daten["name"]

In [None]:
daten["lieblings_fruechte"]

**Aufgabe**

> Erstelle eigene Dictionaries mit eigenen Werten und versuche sie wieder auszulesen.

---
# Erweiterungen von Python durch Einbindung von Paketen

In Python gibt es viele nützliche Pakete (auch Bibliotheken genannt), die dir helfen, bestimmte Aufgaben einfacher zu lösen – zum Beispiel mathematische Berechnungen, Diagramme oder Datenanalysen.

Wir schauen uns im Folgenden nun diese Pakete an:
- `numpy`
- `pandas`
- `matplotlib`

---
## numpy
Ein bekanntes und oft genutztes Paket ist `numpy` (gesprochen: Num-pie). Es hilft dir bei Berechnungen mit Zahlenlisten, Mittelwerten und vielem mehr.

So bindest du es ein:

In [None]:
import numpy as np

> `np` ist nur eine Abkürzung (Alias) – damit musst du später nicht jedes Mal numpy ausschreiben.

**Beispiel**: Mittelwert berechnen mit `mean()`

Stell dir vor, du hast mehrere Noten und willst den Durchschnitt berechnen. Dafür gibt es in numpy die Funktion `mean()`:

In [None]:
import numpy as np

noten = [1.3, 2.0, 2.3, 1.7]  # Liste an Noten
durchschnitt = np.mean(noten)

print("Durchschnittsnote:", durchschnitt)

Das Paket `numpy` stellt dir nicht nur `.mean()` zur Verfügung, sondern ganz viele weitere Funktionen.

Hier noch ein weiteres Beispiel:

In [None]:
np.abs(-3.4)

---
## pandas

[pandas](https://pandas.pydata.org/) ist Bibliothek, speziell für Datenanalyse. Es erleichtert uns
- das Lesen von Daten
- das Verarbeiten von Daten
- das Speichern von Daten
- das Darstellen von Daten.

Weil es so umfangreich ist, werden wir es auch viel verwenden.

In [None]:
import pandas as pd

Mit `pandas` kann man tabellarische Daten einlesen. Wir speichern den Inhalt der Datei "testdaten.csv" in der Variable `df`

In [None]:
df = pd.read_csv("testdaten.csv")

Ich habe `df` gewählt, denn der Datentyp der Variable ist `pandas.DataFrame`, also ein Dataframe. Damit ist im Prinzip eine Tabelle gemeint.

Dass es sich um eine Tabelle handelt, sehen wir gleich.

Es ist nützlich, sich zunächst nur die ersten Zeilen anzeigen zu lassen, also den Kopf (oder Engslisch "head"):

In [None]:
df.head()

Wir können nun mit den Daten aus der Tabelle arbeiten. Zum Beispiel das Maximum der Spalte `CO2_ppm` berechnen:

In [None]:
df["CO2_ppm"].max()

**Aufgabe**

> Probiere aus, das Minimum zu berechnen, oder zu beantworten, wie viele Reihen die Tabelle hat (Tipp: Nutze `len`). Was könnte man noch berechnen?

---
## matplotlib

Manchmal ist es einfacher, Daten zu sehen, anstatt nur Zahlen zu lesen. Dafür gibt es in Python das Paket: Mit dem Paket `matplotlib`

Mit `matplotlib.pyplot` (meist abgekürzt als `plt`) kannst du ganz einfach Diagramme erstellen – zum Beispiel Liniendiagramme, Balkendiagramme und mehr.

So bindest du es ein:

In [None]:
import matplotlib.pyplot as plt

In [None]:
mittlere_temperaturrn = [21.3, 22.4, 21.8, 20.9, 22.6]
jahreszahlen = [2000, 2002, 2004, 2006, 2008]

plt.plot(jahreszahlen, mittlere_temperaturrn, marker="o")
plt.title("Mittlere Temperaturen")
plt.xlabel("Jahr")
plt.ylabel("Mittlere Temperatur (°C)")
plt.grid(True)
plt.show()

**Erklärung:**
> `plt.plot(...)` erstellt ein Liniendiagramm.<br>
> Der erste Eintrag in `plt.plot(...)` entspricht den X-Werten, der zweite Eintrag den Y-Werten.<br>
> `plt.title(...)`, `xlabel(...)`, `ylabel(...)` geben dem Diagramm einen Titel und Achsenbeschriftungen.<br>
> `plt.show()` zeigt das Diagramm an.

**Aufgabe**:
> Was macht `plt.grid()`? Kommentiere die Zeile aus und führe die Zelle erneut aus. Hierzu setzt du ein `#` for `plt.grid()`, was dafür sorgt, dass diese Zeile nicht ausgeführt wird.<br>
> Verändere die Zahlen in `noten` oder füge weitere hinzu<br>
> Füge einen weiteren Datensatz hinzu, indem du mehrmals `plt.plot(...)` mit anderen Variablen ausführst.