# Pandas - Tabellen in Jupyter Notebooks

Pandas stellt eine Möglichkeit zur Verfügung, in Jupyter Notebooks mit Tabellen zu arbeiten.
Tabellen treten in technischen Berechnungen sehr häufig auf. Daher ist es sinnvoll, diesen Einsatz in Jupyter Notebooks zu kennen.

## Voraussetzungen

Um `pandas` nutzen zu können, muss das Modul importiert werden. Das kann an jeder beliebigen Stelle im Notebook erfolgen. Häufig wird es zu Beginn importiert. Es ist üblich, für pandas den abgekürzten Namen pd zu verwenden:

In [None]:
# Import von pandas unter dem Namen pd
import pandas as pd

Neben `pandas` wird häufig noch `numpy` benötigt. Dieses Modul enthält Objekte, mit denen numerische Berechnungen einfach durchführbar sind.

In [None]:
# import des Moduls numpy
import numpy as np

Das folgende YouTube Video zeigt, wie man mit pandas DataFrames Zeilen und Spalten auswählen kann. Sollte die Internetverbindung hier im Klassenraum zu schlecht sein, können Sie das Video auch zuhause anschauen.

In [None]:
from IPython.display import YouTubeVideo

YouTubeVideo('iaziBEhdyRk')

Einen Überblick über `pandas` und `numpy` kann man sich mit dem Befehl `help` verschaffen. Die Information ist in englischer Sprache verfügbar:

In [None]:
# Um die Hilfe zu sehen, den # vor der nächsten Zeile entfernen:
#help(pd)
#help(np)

In Pandas werden zwei Objekte bereitgestellt, die häufig benutzt werden. Das sind zum einen das 

    pd.Series()-Objekt, 
    
zum anderen das 

    pd.DataFrame()-Objekt

## Anlegen von DataFrames

Mit Hilfe von `pd.DataFrame()` lassen sich unter Jupyter Notebooks einfach Tabellen darstellen. 

Tabellen sind dabei spaltenweise aufgebaut. Als Beispiel soll eine Tabelle mit zwei Spalten und drei Zeilen angelegt werden. Beachten Sie den Einsatz von Runden Klammern und von geschweiften Klammern.

Die runden Klammern werden benötigt, um Argumente an `pd.DataFrame` zu übergeben. Die geschweiften Klammern `{...}` definieren ein sogenanntes Wörterbuch (dictionary, `dict`). In einem Wörterbuch werden Schlüssel und Werte in der Form `{key: value, ...}` zusammengestellt.

In [None]:
df = pd.DataFrame(
    {
        'Spalte 1': [1,2,3],
        'Spalte 2': [4,5,6]
    }
)

df

Beachten Sie:
- Die Indizes beginnen bei 0 zu zählen. Der letzte Index ist deshalb um 1 kleiner, als die Anzahl der Zeilen.
- Der Dataframe wird spaltenweise angelegt.

  Das erfolgt innerhalb geschweifter Klammern als `<Spaltenname>: <Liste>`
  
  
- Die Namen der Spalten sind als `df.columns` abrufbar:

In [None]:
df.columns

Soll eine einzelne Spalte eines DataFrame ausgegeben werden, so geschieht das über den Befehl

`df[Spaltenname]`

Meistens ist der Spaltenname ein String, z.B. `'Spalte 1'` . Dann schreibt man:

In [None]:
df['Spalte 1']

### Aufgabe 1

Erstellen Sie einen DataFrame `df_a1` mit 3 Spalten und vier Zeilen. Die Zeilen und Spalten sollen mit beliebigen Daten gefüllt werden.

In [None]:
# Ihre Lösung beginnt hier.

### Aufgabe 2

Geben Sie die erste und die letzte Spalte Ihres DataFrame aus.

In [None]:
# Ihre Lösung beginnt hier.

## Ausgabe von Zeilen

Häufig will man nicht die Spalten eines DataFrame ausgeben, sondern die Zeilen. Das gelingt am einfachsten über die Methode `DataFrame.loc[]`. Achten Sie auf die eckigen Klammern! Zum Beispiel wird die erste Zeile (Index 0) mit

`df_a1.loc[0]`

ausgegeben.

### Aufgabe 3

Geben Sie die mittleren beiden Zeilen Ihres DataFrame aus.

In [None]:
# Ihre Lösung beginnt hier.

## Ausgabe als DataFrame
Im Video wird gezeigt, wie Sie das Ergebnis auch als DataFrame ausgeben können. Die Lösung besteht darin, innerhalb von `.loc[]` eine Liste als Auswahl anzugeben. Dann wird automatisch ein DataFrame zurückgegeben.

In [None]:
df.loc[[1,2]]

In [None]:
# oder, wenn man nur eine Zeile als Dataframe ausgeben will:
df.loc[[1]]

### Aufgabe 4
Geben Sie die ersten drei Zeilen Ihres DataFrame als DataFrame aus.

In [None]:
# Ihre Lösung beginnt hier.

## Beispiel: Berechnung von Lufvolumenströmen 

Das Erdgeschoss eines Reihenhauses hat die folgenden Räume: Eine Küche mit $12\,m^2$, einen Flur mit $6.5\,m^2$, ein Wohnzimmer mit $26.8\,m^2$, ein WC mit $3.5\,m^2$ sowie einen Abstellraum mit $4.2\,m^2$.

In [None]:
df_eg = pd.DataFrame(
    {
        'Raum': ['Küche', 'Flur', 'Wohnzimmer', 'WC', 'Abstellraum'],
        'Fläche': [12.0, 6.5, 26.8, 3.5, 4.2]
    }
)

df_eg

### Aufgabe 5: 

Geben Sie die Spalte 'Raum' und die Spalte 'Fläche' jeweils als DataFrame in einer Zelle aus:

In [None]:
# Ihre Lösung beginnt hier.

### Aufgabe 6:

Geben Sie aus, welche Fläche die Küche hat:

In [None]:
# Ihre Lösung beginnt hier.

## Arbeiten mit DataFrames

Zur Orientierung wird noch einmal der DataFrame `df_eg` ausgegeben:

In [None]:
df_eg

Zur Berechnung der Gesamtfläche wird die Spalte `df.Fläche` summiert:

In [None]:
A_ges = df_eg.Fläche.sum()
A_ges

Um die Flächenanteile zu berechnen, muss jede einzelne Fläche durch die Gesamtfläche dividiert werden:

Häufig ist es sinnvoll, dazu den bestehenden DataFrame um eine neue Spalte zu ergänzen. Immer wenn ein DataFrame ergänzt wird, muss der Spaltenname über die eckigen Klammern geschrieben werden:

In [None]:
df_eg['Anteil'] = df_eg.Fläche/A_ges
df_eg

An den bestehenden DataFrame können auch völlig neue Spalten angehängt werden. Sollen zum Beispiel die Räume als Zu- oder Ablufträume kennzeichnen, so wird eine neue Spalte mit den entsprechenden Zuordnungen benötigt:

In [None]:
df_eg['Art'] = ['Ab','-','Zu','Ab','Ab']
df_eg

Manchmal ist es sinnvoll, eine Spalte zum Index zu machen:

In [None]:
df_eg.set_index('Raum')

Damit ist zum Beispiel der Aufruf

`df_eg.loc['Küche','Fläche']`

möglich:

In [None]:
df_eg.set_index('Raum').loc['Küche','Fläche']

In [None]:
df_eg.set_index('Art').loc['Ab']

Der Index wird nicht nur im Ergebnis der Operation gespeichert. Im DataFrame `df_eg` ist der Index nicht geändert worden. Um das zu erreichen, muss
- entweder eine Neuzuweisung erfolgen,
- oder der Parameter `inplace=True` gesetzt werden.

In [None]:
df_eg

Möchte man einen gesetzten Index wieder zurücksetzen, so geht das mit der Methode `.reset_index()`:

In [None]:
df_1 = df_eg.set_index('Art')
df_1

In [None]:
df_1.loc['Ab']

In [None]:
df_1.reset_index(inplace=True)
df_1

### Aufgabe 7:

Geben Sie mit Hilfe der Indizierung die Fläche des Wohnzimmers aus

In [None]:
# Ihre Lösung beginnt hier.

## Eine Kopie des DataFrame erzeugen:

Schreibt man `df_1 = df_eq`, so wird im Normalfall keine Kopie des DataFrame angelegt, sondern ein sogenannter View. Wird `df_1` verändert, so ändert sich auch `df_eq`. Häufig möchte man das nicht. Dann legt man eine Kopie des DataFrames mit der Methode `.copy()` an:

In [None]:
df_eg_ab = df_eg[df_eg.Art=='Ab'].copy()
df_eg_ab

Mit der Kopie des DataFrame kann nun normal weitergearbeitet werden:

In [None]:
df_eg_ab['dV'] = [50, 25, 25]
df_eg_ab

Der gesamte Abluftvolumenstrom ist dann:

In [None]:
df_eg_ab.dV.sum()

### Aufgabe 8

Erstellen Sie ein neues Notebook, `Kontrollierte_Wohnungsbeluefung.ipynb`, in dem Sie das folgende Problem behandeln:

Das Erdgeschoss der betrachteten Wohnung hat eine Küche ($12\,m^2$), einen Flur ($6.5\,m^2$), ein Wohnzimmer ($26.8\,m^2$), ein WC ($3.5\,m^2$) <br> und einen Abstellraum ($4.2\,m^2$).

Im Obergeschoss der betrachteten Wohnung gibt es ein Bad ($11.5\,m^2$), ein Elternschlafzimmer ($13.25\,m^2$), und zwei Kinderzimmer ($12.5\,m^2$ und $11.25\,m^2$). Der Flur hat eine Fläche von $4.5\,m^2$.

1. Erstellen Sie einen DataFrame für die gesamte Wohnung (z.B. `df`),<br>
   und Kennzeichnen Sie Räume aus EG und OG sowie die Zu- und Ablufträume
3. Berechnen Sie die Nutzfläche der Wohnung und den erforderlichen Zuluftvolumenstrom `dV_zu`.<br>
   Die benötigte Formel lautet:
   
   $$
     \dot{V}_\text{zu} = -0.001\,A_\text{N}^2 + 1.15\,A_\text{N} + 20
   $$
   
   Mit $A_\text{N}$: Nutzfläche der Wohneinheit in $m^2$, $\dot{V}_\text{zu}$: Volumenstrom in $\frac{m^3}{h}$

3. Erzeugen Sie einen DataFrame für die Ablufträume und ermitteln Sie den erforderlichen Abluftvolumenstrom.
4. Geben sie den erforderlichen Gesamtvolumenstrom an und verteilen Sie Zu- und Abluft auf die Räume.
