# Überschrift Finden!!!
Autor: Emirhan Igci
Datum: 23.04.2025

# Vorwort
Für die verwendete ck

# Agenda <a class="anchor" id="Agenda"></a>
  1. [Einleitung und Zielsetzung](#EinleitungundZielsetzung)
  1.1 [Einleitung und Zielsetzung](#EinleitungundZielsetzung)


# Einleitung und Zielsetzung <a class="anchor" id="EinleitungundZielsetzung"></a>

In der nachfolgenden Analyse werden **Immobilienpreise**, sowie **Mietpreise** auf Grundlage verschiedenster Einflussfaktoren analysiert.

Dabei werden folgende Hauptthesen untersucht:

Themen der Untersuchung:
1. Auswirkung der Barrierefreiheit von Immobilien und Wohnungen auf den Verkaufs- oder Mietpreis
2. Auswirkung der Region auf den Verkaufs- oder Mietpreis

Ziele:
1. Erstellen eines Modells, einer Funktion zur Kaufentscheidung der Immobilie basierend auf Kredit, eigenkapital und weiteren Faktoren


In [1]:
import sys
# sys.executable adressiert die Python-Installation von Jupyter
! {sys.executable} -m pip install dmba seaborn numpy pandas



# Aufbereitung der Daten

## Quelle
Die Quelle der Immobilien wurde durch die FDZ Ruhr bereitgestellt und durch das RWI - Leibnitz-Institut für Wirtschaft nochmals angepasst.
Es gibt zwei Dateitypen:

Die **Panel-Campus-Datei** umfasst Inserate aus den 15 größten deutschen Städten (alle mit mindestens rund 500 000 Einwohnern, darunter Berlin, Hamburg, München bis Duisburg). Für jede Stadt wird pro Kalenderjahr eine ähnlich große Zufallsstichprobe gezogen: Bei Haus-Verkäufen sind es etwa 1 000 Anzeigen pro Jahr, bei Mietwohnungen in Berlin oder Leipzig können es bis zu 50 000 sein. Insgesamt entfallen ungefähr 27 % der Datensätze auf Wohnungs-Verkäufe und 37 % auf Haus-Verkäufe und Mietwohnungen. Berücksichtigt werden nur Inserate, die bestimmte Qualitätskriterien erfüllen (kaum Fehlwerte, keine Ausreißer).

Die **Cross-Sectional-Campus-Datei** enthält eine bundesweite Stichprobe aus dem Jahr 2023. Grundlage sind alle Inserate, die in diesem Jahr mindestens einen Tag online waren; berücksichtigt wird jeweils nur der letzte Spell einer Anzeige. Für Gemeinden mit weniger als 50 Inseraten wird lediglich die Kreisebene ausgewiesen, wobei höchstens 100 Anzeigen pro Kreis gezogen werden. Anschließend wird abhängig von der Gesamtzahl der verfügbaren Datensätze eine Stichprobe von 50, 200, 1 000 oder 5 000 Beobachtungen gebildet.

Insgesamt gibt es daher 6 Dateien (Dateityp x Asschreibungstyp) (2x3):
* Panel: Datendatei für Hausverkäufe (HK_cities)
* Panel: Datendatei für Wohnungsverkäufe (WK_cities)
* Panel: Datendatei für Mietangebote (WM_cities)
* Cross-Sectional: Datendatei für Hausverkäufe (HK_2023)
* Cross-Sectional: Datendatei für Wohnungsverkäufe (WK_2023)
* Cross-Sectional: Datendatei für Mietangebote (WM_2023)

## Erste Betrachtung der Datensätze




In [2]:
import pandas as pd

#   Einlesen der Daten
pre = "CampusFile_"
#   Cross Section
hk_cs_df = pd.read_stata(f'./cross_section/{pre}HK_2023.dta')
wk_cs_df = pd.read_stata(f'./cross_section/{pre}WK_2023.dta')
wm_cs_df = pd.read_stata(f'./cross_section/{pre}WM_2023.dta')
#   panel
hk_p_df = pd.read_stata(f'./panel/{pre}HK_cities.dta')
wk_p_df = pd.read_stata(f'./panel/{pre}WK_cities.dta')
wm_p_df = pd.read_stata(f'./panel/{pre}WM_cities.dta')


In [15]:
display(hk_p_df.head())


Unnamed: 0,obid,plz,kaufpreis,mieteinnahmenpromonat,heizkosten,baujahr,letzte_modernisierung,wohnflaeche,grundstuecksflaeche,nutzflaeche,zimmeranzahl,nebenraeume,schlafzimmer,badezimmer,parkplatzpreis,ev_kennwert,laufzeittage,hits,click_schnellkontakte,click_customer,click_weitersagen,click_url,liste_show,liste_match,immobilientyp,denkmalobjekt,einbaukueche,einliegerwohnung,ev_wwenthalten,ferienhaus,foerderung,gaestewc,garten,kaufvermietet,keller,parkplatz,rollstuhlgerecht,bauphase,ausstattung,energieeffizienzklasse,energieausweistyp,haustier_erlaubt,heizungsart,kategorie_Haus,objektzustand,ergg_1km,blid,gid2019,kid2019,bef1,bef2,bef10,bef9,bef8,bef7,bef6,bef5,bef4,bef3,anbieter,duplicateid,spell,hits_gen,click_schnellkontakte_gen,click_weitersagen_gen,click_url_gen,liste_show_gen,liste_match_gen,adat,edat,price_sqm
0,43282109,21077,219700.0,Other missing,Other missing,,Other missing,92.0,Other missing,45.0,4.0,Other missing,Other missing,Other missing,Other missing,Other missing,22,116,0,0,0,4,2810,10577,House-buy,Other missing,Variable for other types only,Other missing,Other missing,Other missing,Variable for other types only,Other missing,Variable for other types only,Other missing,Other missing,Yes,Other missing,Not specified,Not specified,Not specified,Not specified,Variable for other types only,Not specified,Terraced house,Like new,4317_3370,Hamburg,2000000.0,2000,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,1,5.272727,0.0,0.0,0.181818,127.727272,480.772736,2007-10-01,2007-10-01,2388.043457
1,40358201,22589,229000.0,Other missing,Other missing,,Other missing,126.0,Other missing,Other missing,4.0,Other missing,Other missing,Other missing,Other missing,Other missing,208,1118,0,34,2,42,21715,40195,House-buy,Other missing,Variable for other types only,Other missing,Other missing,Other missing,Variable for other types only,Other missing,Variable for other types only,Other missing,Other missing,Other missing,Other missing,Not specified,Not specified,Not specified,Not specified,Variable for other types only,Not specified,Semi-detached house,Not specified,-9,Hamburg,2000000.0,2000,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,2,5.519531,0.0,0.011719,0.269531,101.675781,212.476562,2007-03-01,2007-09-01,1817.460327
2,40500064,21037,447000.0,Other missing,Other missing,1977.0,Other missing,190.0,2083.0,163.0,5.5,Other missing,4,3,Other missing,Other missing,6,21,0,0,0,0,506,2875,House-buy,Other missing,Variable for other types only,Yes,Other missing,Other missing,Variable for other types only,Other missing,Variable for other types only,Other missing,Other missing,Yes,Other missing,Not specified,Not specified,Not specified,Not specified,Variable for other types only,Central heating,Two-family house,Well-kept,4333_3367,Hamburg,2000000.0,2000,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,1,3.5,0.0,0.0,0.0,84.333336,479.166656,2007-01-01,2007-01-01,2352.631592
3,43592240,22455,151000.0,Other missing,Other missing,2008.0,Other missing,110.0,Other missing,Other missing,5.0,Other missing,3,2,Other missing,Other missing,32,506,0,3,2,10,5448,12489,House-buy,Other missing,Variable for other types only,Other missing,Other missing,Other missing,Variable for other types only,Other missing,Variable for other types only,Other missing,Other missing,Other missing,Other missing,Not specified,Not specified,Not specified,Not specified,Variable for other types only,Central heating,Semi-detached house,Not specified,-9,Hamburg,2000000.0,2000,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,1,17.795275,0.0,0.047244,0.566929,243.590546,512.551208,2007-11-01,2007-12-01,1372.727295
4,37597406,21079,170000.0,Other missing,Other missing,1914.0,Other missing,140.0,Other missing,40.0,8.0,Other missing,5,2,Other missing,Other missing,28,248,0,3,0,0,6957,16626,House-buy,Other missing,Variable for other types only,Other missing,Other missing,Other missing,Variable for other types only,Other missing,Variable for other types only,Other missing,Other missing,Yes,Other missing,Not specified,Not specified,Not specified,Not specified,Variable for other types only,Central heating,Semi-detached house,Modernised,-9,Hamburg,2000000.0,2000,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,Other missing,2,7.905172,0.0,0.0,0.0,244.956894,484.793091,2007-02-01,2007-02-01,1214.285767


Zu erkennen sind 71 Variablen m


### Aufbau

