## 1. Daten importieren

Für dieses Tutorial relevant ist der Datensatz `house_location_new_data.csv` der zum Download in der Lektion zu Verfügung steht. Wir speichern diesen zunächst einem sinnvollen Speicherort. Dann importieren wir diesen in der üblichen Weise.

In [10]:
# Pandas importieren
import pandas as pd

# Daten importieren - der Pfad zu den Daten muss eventuell angepasst werden
data = pd.read_csv("../data/house_location/house_location_new_data.csv", index_col=0)

## 2. Modell importieren

Bevor wir uns in späteren Tutorials damit befassen, wie Modelle erzeugt - genauer *trainiert* oder *gefittet* - werden können, befassen wir uns hier zunächst nur damit, wie ein fertiges Modell für Vorhersagen genutzt werden kann. Wir nehmen also an, dass das *Training* bereits stattgefunden hat.

Die Bibliothek unserer Wahl, um solche Modelle zu managen, heißt **Scikit-Learn**. Wir importieren zur Übung diese Bibliothek - genauer: ein bestimmtes Modell dieser Bibliothek, den `DecisionTreeClassifier`. Es ist dabei nicht wichtig zu verstehen, um welches Modell es sich handelt oder wie dieses *trainiert* wurde.

In [3]:
# Scikit-Learn DecisionTreeClassifier importieren
from sklearn.tree import DecisionTreeClassifier

my_model = DecisionTreeClassifier()

my_model

DecisionTreeClassifier()

Die vorherige Aufgabe dient nur der Orientierung, denn tatsächlich ist das Modell bereits *trainiert* und muss nur heruntergeladen werden. In der Lektion ist das Modell zum Download verfügbar. Das Format des Modells ist `.pkl` - doch das ist zunächst nur untergeordnet wichtig. Formate zum Speichern von Modellen gibt es wie Sand am Meer. Durch eine Hilfsbibliothek - genannt `joblib`- kann dieses importiert werden.

In [5]:
# Modell mit joblib importieren
import joblib

my_model = joblib.load("house_location_model.pkl")

my_model

DecisionTreeClassifier(max_depth=10)

## 3. Vorhersagen

Ein so importiertes Modell kann zur Vorhersage auf dem weiter oben importierten Datensatz verwendet werden. Die Schnittstelle ist wie immer die `predict`-Funktion des Modells.

In [13]:
# Modell zur Vorhersage nutzen
prediction = my_model.predict(data)

In [14]:
prediction

array([0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1,
       0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0,
       0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0,
       0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0,
       1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0])