# 1.0 Imports

In [1]:
import pandas as pd
import streamlit as st
from pycaret.regression import predict_model, load_model
import plotly.express as px
from sklearn.datasets import load_boston

In [2]:
def Pegar_Dados():
    boston = load_boston()
    dados = pd.DataFrame(boston.data, columns=boston.feature_names)
    dados['MEDV'] = boston.target
    return dados

data = Pegar_Dados()

In [3]:
data.head()

Unnamed: 0,CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT,MEDV
0,0.00632,18.0,2.31,0.0,0.538,6.575,65.2,4.09,1.0,296.0,15.3,396.9,4.98,24.0
1,0.02731,0.0,7.07,0.0,0.469,6.421,78.9,4.9671,2.0,242.0,17.8,396.9,9.14,21.6
2,0.02729,0.0,7.07,0.0,0.469,7.185,61.1,4.9671,2.0,242.0,17.8,392.83,4.03,34.7
3,0.03237,0.0,2.18,0.0,0.458,6.998,45.8,6.0622,3.0,222.0,18.7,394.63,2.94,33.4
4,0.06905,0.0,2.18,0.0,0.458,7.147,54.2,6.0622,3.0,222.0,18.7,396.9,5.33,36.2


In [4]:
# Titulo
st.title('Prevendo Valores de Imoveis de Boston')

# Subtitulo
st.markdown('Este App utilizado para exibir a solução de Machine Learning para prever valores os imóveis em Boston.')

# Lista de atributos a serem exibidos por padrão
cols = ['RM', 'PTRATIO', 'LSTAT', 'MEDV']
multselect = st.multiselect('Atributos', data.columns.tolist(), default=cols)

# Exibindo os top10 registros do dataframe
st.dataframe(data[multselect].head(10))
st.subheader('Distribuição de imóveis por preço')

# Definingo a faixa de valores
faixa_valores = st.slider('Faixa de Preço', float(data.MEDV.min()), 150., (10.0, 100.0))

# Filtrando os dados
dados = data[data['MEDV'].between(left=faixa_valores[0], right=faixa_valores[1])]

# Plotando a distribuicao dos dados
fig = px.histogram(dados, x='MEDV', nbins=100, title='Distribuição de Preços')
fig.update_xaxes(title='MEDV')
fig.update_yaxes(title="Total Imóveis")
st.plotly_chart(fig)

2020-11-26 15:31:54.253 INFO    numexpr.utils: Note: NumExpr detected 48 cores but "NUMEXPR_MAX_THREADS" not set, so enforcing safe limit of 8.
2020-11-26 15:31:54.257 INFO    numexpr.utils: NumExpr defaulting to 8 threads.


<streamlit.delta_generator.DeltaGenerator at 0x2002a8d6f70>

In [5]:
# mapeando dados do usuário para cada atributo
crim = st.sidebar.number_input('Taxa de Criminalidade', value=data.CRIM.mean())
indus = st.sidebar.number_input('Proporção de Hectares de Negócio', value=data.INDUS.mean())
chas = st.sidebar.selectbox('Faz limite com o rio?' , ('Sim', 'Não'))
zn = st.sidebar.number_input('Proporção de terreno em lotes', value=data.ZN.mean())
chas = 1 if chas =='Sim' else 0 # Transforando o ddo de entrada em binario
nox = st.sidebar.number_input('Concentração de óxido nítrico', value=data.NOX.mean())
rm = st.sidebar.number_input('Número de Quartos', value=1)
ptratio = st.sidebar.number_input('Índice de alunos para professores', value=data.PTRATIO.mean())
b = st.sidebar.number_input('Proporção de pessoas com descendencia afro-americana', value=data.B.mean())
lstat = st.sidebar.number_input('Porcentagem de status baixo', value=data.LSTAT.mean())

In [6]:
# Tansformando os atributos mapeados em dataframe
dados = {'CRIM': crim, 'INDUS': indus, 'CHAS': chas, 'NOX': nox, 'RM': rm, 'PTRATIO': ptratio, 'B': b, 'ZN': zn, 'LSTAT': lstat}
dados = pd.DataFrame([dados])

In [7]:
dados.head()

Unnamed: 0,CRIM,INDUS,CHAS,NOX,RM,PTRATIO,B,ZN,LSTAT
0,3.613524,11.136779,1,0.554695,1,18.455534,356.674032,11.363636,12.653063


In [8]:
# Executando a predição e mostrando o resultado
btn_predict = st.sidebar.button('Efetuar Predição')

In [9]:
# Carregando o modelo treinado:
model = load_model('previsor_vendas_imoveis')

2020-11-26 15:31:55.061 INFO    logs: Initializing load_model()
2020-11-26 15:31:55.062 INFO    logs: load_model(model_name=previsor_vendas_imoveis, platform=None, authentication=None, verbose=True)


Transformation Pipeline and Model Successfully Loaded


In [11]:
if btn_predict:
    previsao = predict_model(model, data=dados)
    st.subheader('O valor previsto para o imóvel é: ')
    result = f'US $ {previsao['Label'][0]}
    st.write(result)

SyntaxError: invalid syntax (<ipython-input-11-fd13e4d0d687>, line 4)

In [None]:
previsao = predict_model(model, data=dados)
