In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
import statsmodels.formula.api as smf
import numpy as np
import plotly.express as px
from sklearn.neighbors import KNeighborsClassifier # classificador por vizinhasa
from sklearn.model_selection import train_test_split # modelo treino e teste
from sklearn.metrics import accuracy_score # medir precisão do treino e teste
from sklearn.preprocessing import MinMaxScaler # pré processamento dos dados. os valores iram ficar entre 0 ~ 1 
from sklearn.svm import SVC # classificador linear
from sklearn.ensemble import RandomForestRegressor # regressão por floresta

In [3]:
pd.set_option('display.max_columns', None) # usando visualizador máximo de colunas
pd.set_option('display.max_rows', None) # usando visualizador máximo de linhas

In [4]:
base = pd.read_csv('https://raw.githubusercontent.com/DanielAsvel/valores-de-imoveis/main/base.csv')

In [None]:
base.head()

In [None]:
base.info()

In [None]:
base.describe()

In [None]:
base.isnull().sum() # mostrando o numeros de NaN do DF base

In [9]:
# separando só as colunas com numeros
baseNum = base[['Fachada','Beco', 'AreaAlvenaria', 'TamanhoLote', 'AnoConstrucao', 'AnoReforma', 'AreaAcabPorao1', 'AreaInacabPorao', 'AreaPorao', 'AreaTerreo', 'Area2Andar', 'AnoGaragem', 'CarrosGaragem', 'AreaGaragem', 'AreaDeck', 'AreaVarandaFechada', 'PrecoVenda' ]]

In [None]:
baseNum.isnull().sum() # mostrando o numeros de NaN do DF baseNum

In [None]:
((base.isnull().sum())/len(base['Id']))*100 # mostrando o numeros de NaN do DF baseNum, em porcentagem

## Substituindo os NaN por Zero

In [None]:
base0 = base.fillna(0)
base0.head()

In [None]:
px.scatter(base0,x = "Area2Andar", y="PrecoVenda").show()

In [None]:
px.scatter(base0,x = "AreaTerreo", y="PrecoVenda").show()

In [None]:
mod2 = smf.ols(formula = 'TamanhoLote ~ PrecoVenda', data = base0)
res = mod2.fit()
print(res.summary())

sns.regplot(x="TamanhoLote", y="PrecoVenda", data=base0, ci=None)
plt.show()

In [None]:
base6 = base0[['Fachada', 'AreaAlvenaria', 'TamanhoLote', 'AnoConstrucao', 'AreaTerreo', 'PrecoVenda' ]]
base6.head()

# Classificando por Vizinhaça

In [17]:
X = base6.drop('PrecoVenda', axis=1)
Y= base6['PrecoVenda']


In [None]:
classificador = KNeighborsClassifier(n_neighbors=3) # vizinhaça
classificador.fit(X,Y)

X_treino, X_teste, Y_treino, Y_teste = train_test_split(X,Y, train_size=2/3)

classificador2 = KNeighborsClassifier(n_neighbors=3) #classificador treino_teste
classificador2.fit(X_treino,Y_treino)

accuracy_score(Y_teste, classificador2.predict(X_teste)) # mostrando a porcentagem de acerto

In [None]:
normalizador = MinMaxScaler()
X_norm = normalizador.fit_transform(X)

X_treino, X_teste, Y_treino, Y_teste = train_test_split(X_norm,Y, train_size=2/3)

classificador3 = KNeighborsClassifier(n_neighbors=3) #classificador treino_teste, normalizado
classificador3.fit(X_treino,Y_treino)

accuracy_score(Y_teste, classificador3.predict(X_teste))

## SVC

In [None]:

#norm = MinMaxScaler()
#X_norm = norm.fit_transform(X)

X_treino, X_teste, Y_treino, Y_teste = train_test_split(X,Y, train_size=2/3)

svc = SVC(kernel='poly', degree = 10)
svc.fit(X_treino, Y_treino)

accuracy_score(Y_teste, svc.predict(X_teste))

# Regressão via random forest

In [21]:
X_treino, X_teste, Y_treino, Y_teste = train_test_split(X,Y, train_size=2/3)

In [22]:
regr = RandomForestRegressor(max_depth=20, random_state=0) # previsão máxima, colocando 20 camadas 
regr.fit(X, Y)
(regr.score(X, Y))*100

95.81780697825054

## Obtendo os dados das casas junto aos usuario. 

In [None]:
fachada = int(input('fachada: ' ))

In [None]:
area_alvenaria = int(input('Area da Alvenaria: ' ))

In [None]:
tamanho_do_lote = int(input('Tamanho do Lote: ' ))

In [None]:
ano_da_construcao = int(input('Ano da Construcao: ' ))

In [None]:
area_do_terreo = int(input('Area do Terreo: '))

# Calculando e monstrando o valor corespondente ao dados obtidos

In [None]:
casa = np.array([[fachada, area_alvenaria, tamanho_do_lote, ano_da_construcao, area_do_terreo ]]) 

In [None]:
valor = regr.predict(casa) # salor da casa baseado no modelo

In [None]:
print(valor)