# Analiza stanovanj in prostorov za oddajo

Podatki, ki jih imamo o stanovanjih in prostorih so:
- Naslov
- Kraj
- Ime (oglasa)
- Vrsta
- Nadstropje
- Leto izgradnje
- Velikost v m2
- Cena
- Ponudnik oz. zasebna ponudba
- Izračunana je še cena na m2

In [None]:
import numpy as np
import pandas as pd
ponudbe = pd.read_csv('oglasi.csv', index_col='url')
ponudbe['cena_m2'] = ponudbe.cena / ponudbe.velikost
pd.options.display.max_rows = 15

## Pregled podaktov

In [None]:
ponudbe[:5]

## Število ponudb po krajih oz. predelih

In [None]:
print(ponudbe['kraj'].value_counts()[:15])
ponudbe['kraj'].value_counts()[:40].plot.bar(figsize=(15, 5))

Vidimo, da se nahaja največ ponudb v Ljubljani, kar sem tudi pričakovala, ostala mesta, presenetil pa me je Trzin, saj je manjše mesto.

## Število nepremičnin po ponudnikih

In [None]:
print(ponudbe['ponudnik'].value_counts()[:10])
ponudbe['ponudnik'].value_counts()[:40].plot.bar(figsize=(15, 5))

Skoraj polovica oglasov je v zasebni ponudbi, kar me je presenetilo, saj sem po svojih izkušnjah z nepremicnine.net pričakovala še več oglasov nepremičninskih agencij. Je pa zanimiv podatek, da je ima Stoja trade toliko več oglasov in delež na tržišču od ostalih.

# Nepremičnine po vrsti

In [None]:
print(ponudbe['vrsta'].value_counts())
ponudbe['vrsta'].value_counts().plot.bar()

In [None]:
ponudbe.groupby('vrsta')['cena_m2'].mean().sort_values(ascending=False).plot.bar()

Ponudbe poslovnih prostorov prevladujejo nad ostalimi kategorijami. Najdražje pa so za najem po teh podatkih hiše, ker pa je cenovna razlika tolikšna, sem se odločila dodati še graf z cenami in velikostmi hiš, ki je pokazal, da je najbrž nekaj ponudb vnesenih narobe.

In [None]:
ponudbe[ponudbe.vrsta == 'Hiša'].plot.scatter(x='velikost', y='cena')

# Stanovanja

In [None]:
stanovanja = ponudbe[ponudbe.vrsta == 'Stanovanje']
stanovanja['nadstropje'].value_counts().plot.bar(figsize=(15, 5))

In [None]:
Večina stanovanj se oddaja v nižjih nadstropjih, k čemur pripomore tudi dejstvo da se veliko stanovanj nahaja v stanovanjkih hišah.

In [None]:
stanovanja['ponudnik'].value_counts()[:40].plot.bar(logy=True, figsize=(15, 5))

In [None]:
Pri oddaji stanovanj se razmerje med zasebno oddajo in ponudbo agencij še dodatno poveča v primerjavi z vsemi nepremičninami.

In [None]:
stanovanja.groupby('kraj')['cena_m2'].median().sort_values(ascending=False)[:40].plot.bar(logy=True, figsize=(15, 5))

In [None]:
Primerjava cene z lokacijo nam pokaže, da je pri nekaterih oglasih prišlo do pomote pri vnosu, hkrati pa pokaže, da se v Ljubljani cene močno spreminjajo glede na predel.

In [None]:
stanovanja.groupby('ponudnik')['cena_m2'].median().sort_values(ascending=False)[:40].plot.bar(logy=True, figsize=(15, 5))

In [None]:
Tudi pri primerjavi cen med ponudniki stanovanj se opazi napačno vnešena stanovanja, hkrati pa lahko najdemo agencije, ki posredujejo najdražja stanovanja.

In [None]:
# Ali velikost vpliva na ceno za m2
stanovanja.plot.scatter(x='velikost', y='cena_m2', logy=True, figsize=(15, 5))
# Ali velikost vpliva na koncno ceno
stanovanja.plot.scatter(x='velikost', y='cena', logy=True, figsize=(15, 5))
# Ali leto izgradnje vpliva na velikost
stanovanja.plot.scatter(x='leto', y='velikost', figsize=(15, 5))

In [None]:
Zgornji trije grafi pokažejo da:
- velikost stanovanja vpliva na ceno za m2 samo pri manjših stanovanjih
- se kot predvideno cena enakomerno viša z velikostjo stanovanja
- leto izgradnje ne vpliva preveč na velikost stanovanja

In [None]:
stanovanja[stanovanja.leto > 1900]['leto'].plot.box()

In [None]:
Večina stanovanj, ki se oddajajo je bilo zgrajenih v zadnjih 40 letih.

In [None]:
stanovanja[(stanovanja['cena_m2'] < 200) & (stanovanja.leto > 1850)].plot.scatter(x='leto', y='cena_m2', figsize=(15, 5))

In [None]:
Leto izgradnje večinoma nima vpliva na samo ceno najemnine.