<h1>Conceito</h1>

<h2><i>Pipelines</i> e validação cruzada</h2>

Para realizar a validação cruzada de maneira efetiva, é importante que todos os processos (normalizações, padronizações, treinamentos etc.) sejam repetidos em todas as etapas da validação, para que seja minimizado o efeito da aleatoriedade em todos esses processos.

Através da biblioteca *SKLearn* é possível criar uma *pipeline* de processos - ou seja, uma sequência de processos que serão realizados em uma base de dados. A criação dessa *pipeline* instancia um objeto da classe *Pipeline*, que possue os métodos *fit*, *train*, *predict* etc, semelhante aos objetos das classes relacionadas aos modelos de aprendizado de máquina.

Sendo assim, é possível utilizar o objeto *Pipeline*  na validação cruzada, para que todos os processos sejam repetidos em todas as etapas da validação.

<h1>Aplicação</h1>

In [1]:
import pandas as pd

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.model_selection import StratifiedKFold
from sklearn.model_selection import cross_validate

In [2]:
# Lendo a base de dados a ser utilizada
dados = pd.read_csv(r'Dados\Base.csv')

In [3]:
# Dividindo inputs e outputs
x = dados[["preco", "idade_do_modelo", "km_por_ano"]].values
y = dados["vendido"].values.ravel()

In [4]:
# Criando a pipeline que irá realizar a normalização dos dados e então o treinamento de uma máquina de vetor de suporte para classificação:
pipeline = Pipeline([('transformacao', StandardScaler()),
                     ('estimador', SVC())])

# Criando o modelo de validação cruzada:
cv = StratifiedKFold(n_splits = 10)
result = cross_validate(pipeline, x, y, cv = cv)

In [5]:
media = result['test_score'].mean()*100
desvio_padrao = result['test_score'].std()*100

print(f'A acurácia do modelo para um nível de confiança de 95% está entre {media - desvio_padrao:.2f}% e {media + desvio_padrao:.2f}%')

A acurácia do modelo para um nível de confiança de 95% está entre 75.57% e 77.81%
