# Wycena nieruchomości

## Ładujemy niezbędne bibioteki

In [None]:
import pandas as pd
import numpy as np
import matplotlib
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

## Importujemy plik z danymi

In [None]:
sales = pd.read_csv('dane/home_data.csv', index_col='id')

## Przyjrzyjmy się zawartości wczytanego pliku

In [None]:
sales.head()

## Zależność ceny sprzedaży od powierzchni mieszkalnej

In [None]:
sales.plot.scatter(x='sqft_living', y='price')

## Zbudujmy prosty model regresji pozwalający na wycenę nieruchomości na podstawie jej powierzchni

### Dzielimy dane na zbiór treningowy i testowy

In [None]:
training_set, test_set = train_test_split(sales, test_size=0.2, random_state=0)

### Wytrenujmy nasz model

In [None]:
df_to_vec = lambda x: np.array(x).reshape(-1, 1)
sqft_model = LinearRegression().fit(df_to_vec(training_set['sqft_living']), training_set['price'])
print('Średnia cena sprzedaży wynosi: ${:.0f}'.format(test_set['price'].mean()))

### Czas na ocenę jakości naszego modelu

In [None]:
sqft_r2 = sqft_model.score(df_to_vec(test_set['sqft_living']), test_set['price'])
print('R^2 = {:.3f}'.format(sqft_r2))

### Jak wypada nasz model na tle rzeczywistych danych?

In [None]:
feature_col = test_set['sqft_living']
matplotlib.pyplot.plot(feature_col, test_set['price'],'.',
                       feature_col, sqft_model.predict(df_to_vec(feature_col)),'-')

### Parametry modelu

In [None]:
slope = sqft_model.coef_[0]
intercept = sqft_model.intercept_
print('Nachylenie: ${:.0f} za sqft\nPrzesunięcie: -${:.0f}'.format(slope, -intercept))

## Dodajmy więcej cech do naszego modelu

Pozwól sobie na eksperymentowanie z zawartością listy my_features.
Postaraj się uzyskać jak najlepsze dopasowanie.

In [None]:
my_features = ['bedrooms','bathrooms','sqft_living','sqft_lot','floors','zipcode']
sales[my_features].head()

### Trochę statystyki

In [None]:
sales[my_features].describe()

### Wytrenujmy nasz model

In [None]:
my_features_model = LinearRegression().fit(training_set[my_features],
                                           training_set['price'])

## Porównajmy oba modele

In [None]:
my_feat_r2 = my_features_model.score(test_set[my_features],
                                     test_set['price'])
print('R^2 dla prostego modelu = {:.3f}'.format(sqft_r2))
print('R^2 dla bardziej złożonego modelu = {:.3f}'.format(my_feat_r2))

## Korzystając z modeli postarajmy się wycenić wybrane nieruchomości

Po prawej stronie house_id możesz wpisać dowolny numer występujący w zbiorze

In [None]:
house_id = 5309101200
house1 = sales.loc[house_id]
house1

### Zdjęcie domu o numerze 5309101200

<img src="obrazy/house1.png">

### Rzeczywista cena sprzedaży

In [None]:
print('${}'.format(house1['price']))

### Szacunkowa cena dla prostego modelu

In [None]:
print(sqft_model.predict(df_to_vec(house1['sqft_living'])))

### Szacunkowa cena dla bardziej złożonego modelu

In [None]:
df_to_row = lambda x: np.array(x).reshape(1, -1)
print(my_features_model.predict(df_to_row(house1[my_features])))

### Wycena innej nieruchomości

In [None]:
house2 = sales.loc[1925069082]
house2

### Zdjęcie domu o numerze 1925069082

<img src="obrazy/house2.jpg">

### Szacunkowa cena dla prostego modelu

In [None]:
print(sqft_model.predict(df_to_vec(house2['sqft_living'])))

### Szacunkowa cena dla bardziej złożonego modelu

In [None]:
print(my_features_model.predict(df_to_row(house2[my_features])))

### Wycena rezydencji Billa Gatesa

In [None]:
bill_gates = {'bedrooms':8, 
              'bathrooms':25, 
              'sqft_living':50000, 
              'sqft_lot':225000,
              'floors':4, 
              'zipcode':'98039', 
              'condition':10, 
              'grade':10,
              'waterfront':1,
              'view':4,
              'sqft_above':37500,
              'sqft_basement':12500,
              'yr_built':1994,
              'yr_renovated':2010,
              'lat':47.627606,
              'long':-122.242054,
              'sqft_living15':5000,
              'sqft_lot15':40000}

<img src="https://upload.wikimedia.org/wikipedia/commons/2/26/Residence_of_Bill_Gates.jpg">

In [None]:
pd.Series(bill_gates)

In [None]:
print(my_features_model.predict(df_to_row(pd.Series(bill_gates)[my_features])))