# Bibliotheken

<div class="alert alert-success">
Zunächst müssen die Bibliotheken importiert werden, mit denen wir die Daten einlesen und visualisieren können.
</div>

In [1]:
import pandas as pd
import numpy as np

#Importieren der Bibliothek PyTree zum Trainieren eines Decision Tree
#from PyTree import ClassificationTree as ct

#Importieren der  Bibliotheken plotly und cufflinks zur Datenvisalisierung 
import plotly as py
from plotly.offline import iplot
import cufflinks as cf
cf.go_offline()


# Quader Daten

## Import

<div class = "alert alert-success">
Nun müssen wir erst einmal die Daten hier in das Jupyter Notebook hineinbekommen, um diese dann später analysieren und interpretieren zu können. Dazu lesen wir die Daten als sogenannte <b>csv-Datei</b> (csv = comma-separated values, zu Deutsch: durch Komma getrennte Werte) in ein <b>Dataframe</b> ein, welches wir <code>df_quader</code> nennen. Ein Dataframe kann man sich vorstellen wie eine Tabelle, in der die Zeilen jeweils den aufgenommenen Datensätzen entsprechen und die Spalten die einzelnen Attribute/Variablen - wie z.B. einzelne Punkte des Quaders - darstellen.
</div>

In [2]:
df_quader = pd.read_csv('Quader.csv', sep=';')

df_quader

Unnamed: 0,Name,A,B,C,D,E,F,G,H
0,Q1,"(0,0,0)","(0,2,0)","(2,2,0)","(2,0,0)","(2,0,2)","(2,2,2)","(0,2,2)","(0,0,2)"
1,Q2,"(0,0,0)","(1,0,0)","(0,2,0)","(1,2,0)","(0,0,2)","(1,0,2)","(0,2,2)","(1,2,2)"


## Aufbereiten und Visualisieren

<div class = "alert alert-success">
    Nun wollen wir kurz einmal testen, ob die Daten richtig eingelesen wurden. Dazu lassen wir uns den achten Punkt aus dem zweiten Quader durch einen Aufruf des Dataframes in der 0. Zeile und der 7. Spalte ausgeben.
</div>

In [3]:
# Koordinaten für den Punkt auslesen in Zeile 0 und Spalte 7 auslesen
df_quader.iloc[0].iloc[7]

'(0,2,2)'

<div class = "alert alert-success">
Die drei Koordinaten sind hier als String gespeichert (erkennbar an den Anführungszeichen). Um den Punkt mit diesen Koordinaten zu visualisieren müssen wir auf die einzelnen Zahlenwerte zugreifen können. Also müssen wir den String am besten zu einem Zahlen-Tupel konvertieren, um in den einzelnen Koordinaten "rechnen" und diese verarbeiten zu können.

Dafür gibt es in Python den Befehl: eval()
</div>

In [4]:
eval(df_quader.iloc[0].iloc[7])

(0, 2, 2)

<div class = "alert alert-success">
    Um die verschiedenen Punkte eines Quaders bequem zu visualisieren, ist es hilfreich, die einzelnen Punkte in einen neuen DataFrame zu schreiben. Dabei sollten die drei Koordinaten eines jeden Punktes in einer eigenen Zele stehen. D.h. für unseren Quader erhalten wir einen DataFrame mit 8 Zeilen (8 Punkte) und drei Spalten (3 Koordinaten pro Punkt).
</div>

In [5]:
# quader i in einen gesonderten DataFrame schreiben 
# Jede Zeile repräsentiert einen Koordinatenpunkt

i=0

df_vis = pd.DataFrame(columns=['x', 'y', 'z'])

for j in range(1,9):#Wir starten hier bei 1, da in der 0. Spalte der Name des Quaders steht
    
    aktuelle_koordinaten = eval(df_quader.iloc[i].iloc[j])
    df_vis = df_vis.append(pd.Series(aktuelle_koordinaten, index=['x', 'y', 'z']),ignore_index=True)
    #print(pd.Series(aktuelle_koordinaten, index=['x', 'y', 'z']))
    #df_vis = pd.concat([df_vis,pd.Series(aktuelle_koordinaten, index=['x', 'y', 'z'])], ignore_index=True)
    
df_vis


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.



Unnamed: 0,x,y,z
0,0,0,0
1,0,2,0
2,2,2,0
3,2,0,0
4,2,0,2
5,2,2,2
6,0,2,2
7,0,0,2


<div class = "alert alert-success">
    Nachfolgend wollen wir den Quader in einer 3D-Ansicht visualisieren. Dazu nutzen wir die Methode <code>iplot</code>, die wir auf dem DataFrame df_vis aufrufen. Hier müssen wir zunächst mitteilen, welche Spalte die x-, die y- und die z-Koordinaten enthält und außerdem, welche Art von Visualisierung wir erstellen wollen (hier ein 3D-Scatter-Plot. Über den Mode können wir zudem festlegen, ob die Punkte lediglich als Punkte (<code>markers</code>) oder der Reihenfolge im DataFrame folgend verbunden mit Linien (<code>markers+lines</code>) angezeigt werden sollen. </code>

In [6]:
#Visualisierung des Quaders
df_vis.iplot(x='x', y='y', z='z', kind='scatter3d', mode='markers')

<div class = "alert alert-success">Wenn eine Gruppe von Punkten zusammengehört, kann es für die Visualisierung sinnvoll sein die Gruppe von Punkten in einer einheitlichen Farbe darzustellen. Um das zu ermöglichen können wir im DataFrame eine weitere Spalte ergänzen. In dieser Spalte legen wir für jeden Punkt fest zu welcher Gruppe dieser gehört.

Z. B. können wir für unseren Quader die Gruppen der unteren Punkte und der oberen Punkte unterscheiden.<br>
Dazu legen wir eine neue Tabellenspalte an und tragen dort ein, dass ob die einzelnen Punkte im DataFrame unten (z-Koordinate=0) oder oben im Quader liegen (z-Koordinate = 2).
Anschließend hängen wir die Spalte an das DataFrame an.
</div>

In [7]:
# Jeder Koordinatenpunkt wird einem den unteren oder den oberen Punkten zugeordnet
#anlegen einer leeren Tabellenspalte
location =[]
#Füllen der Tabellenspalte
for i in range(8):
    if (df_vis.iloc[i]['z'] == 0):
        location.append('unten')
    else:
        location.append('oben')
    


#Anhängen der Spalte
df_vis['Lage'] = location
df_vis

Unnamed: 0,x,y,z,Lage
0,0,0,0,unten
1,0,2,0,unten
2,2,2,0,unten
3,2,0,0,unten
4,2,0,2,oben
5,2,2,2,oben
6,0,2,2,oben
7,0,0,2,oben


<div class = "alert alert-success">
    Nachdem wir im DataFrame nun festgehalten haben, welche Punkte welche Position haben, können wir eine Visualisierung erstellen, die zwischen diesen beiden Kategorien unterscheidet. Dabei erstellen wir die Visualisierung so wie oben gesehen und ergänzen, dass wir als Kategorie (<code>categories</code>) hinsichtlich der Lage der Punkte, die in der Spalte <code>Lage</code> festgehalten ist, unterscheiden wollen. Auf diese Weise werden die Marker der einzelnen Punkte jeweils hinsichtlich der Lage verschieden eingefärbt.
</div>

In [8]:
df_vis.iplot(x='x', y='y', z='z', kind='scatter3d', mode='markers', categories='Lage')

## Alternative Visualisierungsmethode

<div class="alert alert-success">    
    Alternativ zur <code>iplot</code>-Metode kann man auch die <code>plotly.express</code>-Bibliothek zur Visualisierung nutzen. In unserem Fall benötigen wir die Methode <code>scatter_3d</code>, um eine 3D-Visualisierung unseres Quaders zu erstellen. Diese nutzen wir ähnlich wie die <code>iplot</code>-Methode von oben, geben also über die Attribute an, was die x-/y-/z-Koordinaten sind und darüber hinaus noch, welches DataFrame visualisert werden soll. Zusätzlich können wir über das Attribut <code>color</code> eine farbliche Unterscheidung festlegen, hier also die Farben hinsichtlich der unterschiedlichen Einträge in der Tabellenspalte <code>Lage</code> aufteilen auf die Punkte. Die Visualisierung speichern wir in <code>fig</code> und zeigen diese mithilfe der <code>show</code>-Methode anschießend an.
</div>

In [9]:
#visualisierung der quader
import plotly.express as px
fig = px.scatter_3d(df_vis, x='x', y='y', z='z', color = 'Lage')
fig.show()