# Validação de Modelos
É desejável avaliar qualquer modelo que se construir. Na maioria dos projetos a medida relevante para a qualidade do modelo é a sua precisão preditiva. Avaliar se as previsões do modelo estarão próximas do que realmente acontece.
Medir as previsões fazendo-as com os dados usados para treinar o modelo e comparando-as aos dados de treino é um grande erro.

Primeiramente, seria necessário sumarizar a qualidade do modelo em uma forma compreensível. Comparar grandes quantidades de dados previstos com os reais, chegaria a uma mistura de bons e maus resultados. Seria necessário reduzir essa medição a uma única métrica para recolher insights úteis.

### Métricas de qualidade de modelo
Vamos começar com a métrica `Mean Absolute Error` (MAE).
O erro de uma previsçao para cada casa é dado por
erro = `valor_real` - `valor_predito`

A partir desse dado,para calcular a métrica MAE, tomamos o valor absoluto de cada erro cometido na previsão. Ou seja, convertemos para o módulo desse número para evitar valolres negativos. Então, calculamos a média desses valores.

Em média, as predições estão erradas por aproximadamente X

In [1]:
# Configurando o modelo a ser validado
import pandas as pd

melbourne_file_path = '../data/melb_data.csv'

melbourne_data = pd.read_csv(melbourne_file_path)

filtered_melbourne_data = melbourne_data.dropna(axis=0)

y = filtered_melbourne_data.Price

melbourne_features = ['Rooms', 'Bathroom', 'Landsize', 'BuildingArea', 
                        'YearBuilt', 'Lattitude', 'Longtitude']
X = filtered_melbourne_data[melbourne_features]

from sklearn.tree import DecisionTreeRegressor

melbourne_model = DecisionTreeRegressor()

melbourne_model.fit(X, y)

DecisionTreeRegressor()

Uma vez que temos o nosso modelo, podemos calcular o MEA

In [2]:
from sklearn.metrics import mean_absolute_error

# Calcula previsões de preços baseado nos dados de X
predicted_home_prices = melbourne_model.predict(X)
# Calcula o erro de X com relação a y
mean_absolute_error(y, predicted_home_prices)

434.71594577146544

O problema de se usar a mesma base de dados tanto para construir quanto para avaliar é que os vícios criados por uma base de dados serão confirmados pela avaliação, mesmo que não estejam de acordo com o que deveria ser analisado.

Preparando dados para avaliação, separando os dados em dois pedaços, um para ser usado para treino e outro para verificação

In [3]:
from sklearn.model_selection import train_test_split

# Dividindo os dados para features e alvo
# A divisão é baseada em um gerador de número aleatório
train_X, val_X, train_y, val_y = train_test_split(X, y, random_state = 0)

# Deninindo o modelo
melbourne_model = DecisionTreeRegressor()
# Fit
melbourne_model.fit(train_X, train_y)

val_predictions = melbourne_model.predict(val_X)
mean_absolute_error(val_y, val_predictions)


260412.63524854745

O valor retornado pela métrica foi de 500 para a amostra "in-sample" para mais de 250000, o que indica um modelo praticamente inutilizável. 