# Validação Cruzada
#### Realizando a validação cruzada na base de dados de carros usados.

### Importação das Bibliotecas

In [None]:
# importando a biblioteca pandas do python
import pandas as pd
# importando da biblioteca keras do python
from keras.models import Sequential
from keras.layers import Dense
# importando da biblioteca sklearn do python
from sklearn.model_selection import cross_val_score
from keras.wrappers.scikit_learn import KerasRegressor
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.compose import ColumnTransformer

### Importando os Dados no Dataframe

In [None]:
# importando os dados no objeto 'dataframe'
dataframe = pd.read_csv('/content/drive/My Drive/autos.csv', encoding = 'ISO-8859-1',
                       sep = ',')

### Pré-processamento dos Dados

In [None]:
# removendo colunas irrelevantes para a rede neural
dataframe = dataframe.drop('dateCrawled', axis = 1)
dataframe = dataframe.drop('dateCreated', axis = 1)
dataframe = dataframe.drop('nrOfPictures', axis = 1)
dataframe = dataframe.drop('postalCode', axis = 1)
dataframe = dataframe.drop('lastSeen', axis = 1)
dataframe = dataframe.drop('name', axis = 1)
dataframe = dataframe.drop('seller', axis = 1)
dataframe = dataframe.drop('offerType', axis = 1)

In [None]:
# removendo valores inconsistentes no preço
dataframe = dataframe.loc[dataframe.price > 10]
dataframe = dataframe.loc[dataframe.price < 350000]

In [None]:
# criando um dicionário com a moda dos termos para substituir
# em campos nulos
valores = {'vehicleType': 'limousine', 'gearbox': 'manuell',
           'model': 'golf', 'fuelType': 'benzin',
           'notRepairedDamage': 'nein'}

In [None]:
# substituindo os campos nulos 
dataframe = dataframe.fillna(value = valores)

In [None]:
# separando os atributos previsores dos atributos classe
previsores = dataframe.iloc[:, 1:13].values
classe = dataframe.iloc[:, 0].values

In [None]:
# criando o objeto 'labelencoder'
labelencoder_previsores = LabelEncoder()

In [None]:
# substituindo variáveis categóricas por variáveis numéricas
previsores[:, 0] = labelencoder_previsores.fit_transform(previsores[:, 0])
previsores[:, 1] = labelencoder_previsores.fit_transform(previsores[:, 1])
previsores[:, 3] = labelencoder_previsores.fit_transform(previsores[:, 3])
previsores[:, 5] = labelencoder_previsores.fit_transform(previsores[:, 5])
previsores[:, 8] = labelencoder_previsores.fit_transform(previsores[:, 8])
previsores[:, 9] = labelencoder_previsores.fit_transform(previsores[:, 9])
previsores[:, 10] = labelencoder_previsores.fit_transform(previsores[:, 10])

In [None]:
# transformando as variáveis numéricas em variáveis do tipo dummy
# criando o objeto 'onehotencoder'
onehotencoder = ColumnTransformer(transformers=[("OneHot", OneHotEncoder(), 
                                                  [0,1,3,5,8,9,10])], 
                                  remainder='passthrough')
previsores = onehotencoder.fit_transform(previsores).toarray()

In [None]:
# criando as configurações da rede neural
def criar_rede():
    
    # criando o regressor
    regressor = Sequential()
    # adicionando a primeira camada oculta
    regressor.add(Dense(units = 158, 
                        activation = 'relu', 
                        input_dim = 316))
    # adicionando a segunda camada oculta
    regressor.add(Dense(units = 158, 
                        activation = 'relu'))
    # adicionando a camada de saída
    regressor.add(Dense(units = 1, 
                        activation = 'linear'))
    # configurando os parâmetros da rede
    regressor.compile(loss = 'mean_absolute_error', 
                      optimizer = 'adam',
                      metrics = ['mean_absolute_error'])
    
    # função retorna o regressor
    return regressor

In [None]:
# ajustando a rede neural para o treinamento
regressor = KerasRegressor(build_fn = criar_rede,
                           epochs = 100,
                           batch_size = 300)

In [None]:
# realizando a validação cruzada com os dados tratados
resultados = cross_val_score(estimator = regressor,
                             X = previsores, y = classe,
                             cv = 10, 
                             scoring = 'neg_mean_absolute_error')

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

In [None]:
# visualizando os resultados obtidos
print(resultados)

[-2427.60771307 -2246.52503152 -2241.71645544 -2247.15635017
 -2244.65275855 -2193.91914027 -2236.67937554 -2463.46726576
 -2157.8750987  -2211.24487199]


In [None]:
# visualizando a média dos resultados
media = resultados.mean()
print(media)

-2267.0844061003413


In [None]:
# visualizando o desvio padrão dos dados
desvio = resultados.std()
print(desvio)

93.60706975518


### Alguma Dúvida? Entre em Contato Comigo:

- [Me envie um e-mail](mailto:alysson.barbosa@ee.ufcg.edu.br);