# Validação Cruzada
#### Realizando a validação cruzada na base de dados de carros usados.

### Importação das Bibliotecas

In [None]:
# importando a biblioteca pandas do python
import pandas as pd
# importando da biblioteca keras do python
from keras.models import Sequential
from keras.layers import Dense
# importando da biblioteca sklearn do python
from sklearn.model_selection import cross_val_score
from keras.wrappers.scikit_learn import KerasRegressor
from sklearn.preprocessing import LabelEncoder, OneHotEncoder

### Importando os Dados no Dataframe

In [None]:
# importando os dados no objeto 'dataframe'
dataframe = pd.read_csv('autos.csv', encoding = 'ISO-8859-1',
                       sep = ',')

### Pré-processamento dos Dados

In [None]:
# removendo colunas irrelevantes para a rede neural
dataframe = dataframe.drop('dateCrawled', axis = 1)
dataframe = dataframe.drop('dateCreated', axis = 1)
dataframe = dataframe.drop('nrOfPictures', axis = 1)
dataframe = dataframe.drop('postalCode', axis = 1)
dataframe = dataframe.drop('lastSeen', axis = 1)
dataframe = dataframe.drop('name', axis = 1)
dataframe = dataframe.drop('seller', axis = 1)
dataframe = dataframe.drop('offerType', axis = 1)

In [None]:
# removendo valores inconsistentes no preço
dataframe = dataframe.loc[dataframe.price > 10]
dataframe = dataframe.loc[dataframe.price < 350000]

In [None]:
# criando um dicionário com a moda dos termos para substituir
# em campos nulos
valores = {'vehicleType': 'limousine', 'gearbox': 'manuell',
           'model': 'golf', 'fuelType': 'benzin',
           'notRepairedDamage': 'nein'}

In [None]:
# substituindo os campos nulos 
dataframe = dataframe.fillna(value = valores)

In [None]:
# separando os atributos previsores dos atributos classe
previsores = dataframe.iloc[:, 1:13].values
classe = dataframe.iloc[:, 0].values

In [None]:
# criando o objeto 'labelencoder'
labelencoder_previsores = LabelEncoder()

In [None]:
# substituindo variáveis categóricas por variáveis numéricas
previsores[:, 0] = labelencoder_previsores.fit_transform(previsores[:, 0])
previsores[:, 1] = labelencoder_previsores.fit_transform(previsores[:, 1])
previsores[:, 3] = labelencoder_previsores.fit_transform(previsores[:, 3])
previsores[:, 5] = labelencoder_previsores.fit_transform(previsores[:, 5])
previsores[:, 8] = labelencoder_previsores.fit_transform(previsores[:, 8])
previsores[:, 9] = labelencoder_previsores.fit_transform(previsores[:, 9])
previsores[:, 10] = labelencoder_previsores.fit_transform(previsores[:, 10])

In [None]:
# transformando as variáveis numéricas em variáveis do tipo
# dummy
onehotencoder = OneHotEncoder(categorical_features = [0,1,3,5,8,9,10])
previsores = onehotencoder.fit_transform(previsores).toarray()

In [None]:
# criando as configurações da rede neural
def criar_rede():
    
    # criando o regressor
    regressor = Sequential()
    # adicionando a primeira camada oculta
    regressor.add(Dense(units = 158, 
                        activation = 'relu', 
                        input_dim = 316))
    # adicionando a segunda camada oculta
    regressor.add(Dense(units = 158, 
                        activation = 'relu'))
    # adicionando a camada de saída
    regressor.add(Dense(units = 1, 
                        activation = 'linear'))
    # configurando os parâmetros da rede
    regressor.compile(loss = 'mean_absolute_error', 
                      optimizer = 'adam',
                      metrics = ['mean_absolute_error'])
    
    # função retorna o regressor
    return regressor

In [None]:
# ajustando a rede neural para o treinamento
regressor = KerasRegressor(build_fn = criar_rede,
                           epochs = 100,
                           batch_size = 300)

In [None]:
# realizando a validação cruzada com os dados tratados
resultados = cross_val_score(estimator = regressor,
                             X = previsores, y = classe,
                             cv = 10, 
                             scoring = 'mean_absolute_error')

In [None]:
# visualizando os resultados obtidos
print(resultados)

In [None]:
# visualizando a média dos resultados
media = resultados.mean()
print(media)

In [None]:
# visualizando o desvio padrão dos dados
desvio = resultados.std()
print(desvio)

### Alguma Dúvida? Entre em Contato Comigo:

- [Me envie um e-mail](mailto:alysson.barbosa@ee.ufcg.edu.br);