### Modelo de Projeto de Modelagem Preditiva

O aprendizado de máquina aplicado é uma habilidade empírica. Você não pode melhorar lendo livros e
artigos. Você tem que praticar. Nesta lição, você descobrirá o aprendizado de máquina simples em seis etapas
modelo de projeto que você pode usar para iniciar seu projeto em Python. Depois de concluir isso
lição que você vai saber:

1. Como estruturar um projeto de modelagem preditiva de ponta a ponta.
2. Como mapear as tarefas que você aprendeu na Parte II em um projeto.
3. Como usar melhor o modelo de projeto estruturado para garantir um resultado preciso para o seu
conjunto de dados.

#### Pratique aprendizado de máquina com projetos

Trabalhar com problemas de aprendizado de máquina de ponta a ponta é extremamente importante. Você pode
leia sobre aprendizado de máquina. Você também pode experimentar pequenas receitas individuais. Mas máquina aplicada
o aprendizado não ganhará vida para você até que você trabalhe com um conjunto de dados do começo ao fim.
Trabalhar em um projeto obriga você a pensar em como o modelo será usado, a desafiar
suas suposições e ser bom em todas as partes de um projeto, não apenas em suas partes favoritas. O melhor
maneira de praticar projetos de aprendizado de máquina de modelagem preditiva é usar conjuntos de dados padronizados
do Repositório de Machine Learning da UCI. Depois de ter um conjunto de dados de prática e um monte de
Receitas do Python, como você junta tudo e trabalha com o problema de ponta a ponta?

##### Use um processo passo a passo estruturado

Qualquer projeto de aprendizado de máquina de modelagem preditiva pode ser dividido em seis tarefas comuns:

1. De ne Problema.
2. Resumir dados.
3. Prepare os dados.
4. Avalie Algoritmos.
5. Melhore os resultados.
6. Apresentar resultados.

As tarefas podem ser combinadas ou divididas ainda mais, mas esta é a estrutura geral. Trabalhar
por meio de problemas de aprendizado de máquina de modelagem preditiva em Python, você precisa mapear Python
neste processo. As tarefas podem precisar ser adaptadas ou renomeadas ligeiramente para se adequar ao Python
maneira de fazer as coisas (por exemplo, Pandas para carregamento de dados e scikit-learn para modelagem). Nas próximas
seção fornece exatamente esse mapeamento e elabora cada tarefa e os tipos de subtarefas e
bibliotecas que você pode usar.

#### Modelo de projeto de aprendizado de máquina em Python

Esta seção apresenta um modelo de projeto que você pode usar para trabalhar com aprendizado de máquina
problemas em Python de ponta a ponta.

##### Resumo do modelo

Abaixo está o modelo de projeto que você pode usar em seus projetos de aprendizado de máquina em Python.

In [None]:
# Modelo de Projeto Python
# 1. Prepare o problema
# a) Carregar bibliotecas
# b) Carregar conjunto de dados

# 2. Resumir dados
# a) Estatística descritiva
# b) Visualizações de dados

# 3. Preparar dados
# a) Limpeza de Dados
# b) Seleção de recursos
# c) Transformações de Dados

# 4. Avalie algoritmos
# a) Conjunto de dados de validação dividido
# b) Opções de teste e métrica de avaliação
# c) Algoritmos de verificação pontual
# d) Comparar Algoritmos

# 5. Melhore a precisão
# a) Ajuste de Algoritmo
# b) Conjuntos

# 6. Finalizar modelo
# a) Previsões no conjunto de dados de validação
# b) Crie um modelo autônomo em todo o conjunto de dados de treinamento
# c) Salvar modelo para uso posterior

##### Como usar o modelo de projeto

1. Crie um novo arquivo para seu projeto (por exemplo, nome do projeto.py).
2. Copie o modelo de projeto.
3. Cole-o em seu arquivo de projeto vazio.
4. Comece a enchê-lo, usando as receitas deste livro e de outros.

#### Etapas do modelo de projeto de aprendizado de máquina

Esta seção fornece detalhes adicionais sobre cada uma das etapas do modelo.

##### Preparar Problema

Esta etapa é sobre carregar tudo o que você precisa para começar a trabalhar no seu problema. Isso inclui:

. Módulos, classes e funções Python que você pretende usar.

. Carregando seu conjunto de dados de CSV.

Este também é o local de qualquer configuração global que você possa precisar fazer. É também o lugar
onde você pode precisar fazer uma amostra reduzida de seu conjunto de dados se for muito grande para trabalhar.
Idealmente, seu conjunto de dados deve ser pequeno o suficiente para construir um modelo ou criar uma visualização dentro de um
minuto, idealmente 30 segundos. Você sempre pode escalar modelos de bom desempenho mais tarde.

##### Resumir dados

Esta etapa é sobre entender melhor os dados que você tem disponíveis. Isso inclui
entender seus dados usando:

. Estatísticas descritivas, como resumos.
. Visualizações de dados, como gráficos com Matplotlib, idealmente usando funções de conveniência de
Pandas.

Não se apresse e use os resultados para levantar muitas questões, suposições e hipóteses
que você pode investigar mais tarde com modelos especializados.

##### Preparar Dados

Esta etapa trata de preparar os dados de forma que exponham melhor a estrutura do
problema e as relações entre seus atributos de entrada com a variável de saída. Esse
inclui tarefas como:

. Limpeza de dados removendo duplicatas, marcando valores ausentes e até imputando valores ausentes
valores.
. Seleção de recursos onde recursos redundantes podem ser removidos e novos recursos desenvolvidos.
. Transformações de dados onde os atributos são dimensionados ou redistribuídos para melhor expor o
estrutura do problema posteriormente para algoritmos de aprendizagem.

Comece simples. Revisite esta etapa com frequência e alterne com a próxima etapa até convergir para um
subconjunto de algoritmos e uma apresentação dos dados que resultam em resultados precisos ou precisos o suficiente
modelos para prosseguir.

##### Avaliar Algoritmos

Esta etapa trata de encontrar um subconjunto de algoritmos de aprendizado de máquina que são bons em explorar
a estrutura de seus dados (por exemplo, ter habilidade acima da média). Isso envolve etapas como:

. Separando um conjunto de dados de validação para usar para confirmação posterior da habilidade de seu
modelo desenvolvido.
. Definir opções de teste usando scikit-learn, como validação cruzada e métrica de avaliação
usar.
. Verificação pontual de um conjunto de algoritmos de aprendizado de máquina lineares e não lineares.
. Comparando a precisão estimada dos algoritmos.

Em um determinado problema, você provavelmente gastará a maior parte do seu tempo nesta e na etapa anterior
até você convergir para um conjunto de algoritmos de aprendizado de máquina de 3 a 5 com bom desempenho.

##### Melhorar a Precisão

Depois de ter uma lista restrita de algoritmos de aprendizado de máquina, você precisa aproveitá-los ao máximo.
Existem duas maneiras diferentes de melhorar a precisão de seus modelos:

. Pesquise uma combinação de parâmetros para cada algoritmo usando o scikit-learn que produz
os melhores resultados.
. Combine a previsão de vários modelos em uma previsão de conjunto usando o conjunto
técnicas.

A linha entre esta e a etapa anterior pode se confundir quando um projeto se torna concreto.
Pode haver um pequeno ajuste de algoritmo na etapa anterior. E no caso de conjuntos, você
pode apresentar mais do que uma lista restrita de algoritmos para combinar suas previsões.

##### Finalizar modelo

Depois de encontrar um modelo que acredita poder fazer previsões precisas sobre dados não vistos,
você está pronto para nalizá-lo. A finalização de um modelo pode envolver subtarefas como:

. Usando um modelo ideal ajustado pelo scikit-learn para fazer previsões sobre dados não vistos.
. Criar um modelo autônomo usando os parâmetros ajustados pelo scikit-learn.
. Salvando um modelo ideal para arquivo para uso posterior.

Depois de chegar até aqui, você estará pronto para apresentar os resultados às partes interessadas e/ou implantar
seu modelo para começar a fazer previsões sobre dados não vistos.

#### Dicas para usar bem o modelo

Esta seção lista dicas que você pode usar para aproveitar ao máximo o projeto de aprendizado de máquina
modelo em Python.

. Primeira passagem rápida. Faça uma primeira passagem pelas etapas do projeto o mais rápido possível. Esse
lhe dará a confiança de que você tem todas as peças de que precisa e uma linha de base de
que melhorar.

. Ciclos. O processo não é linear, mas cíclico. Você fará um loop entre as etapas e provavelmente
passe a maior parte do tempo em loops apertados entre as etapas 3-4 ou 3-4-5 até atingir um nível
de precisão suficiente ou você ficará sem tempo.

. Tente cada etapa. É fácil pular etapas, especialmente se você não estiver confiante ou
familiarizado com as tarefas dessa etapa. Tente fazer algo em cada etapa do processo,
mesmo que não melhore a precisão. Você sempre pode construir sobre ele mais tarde. Não pule etapas,
apenas reduza sua contribuição.

. Precisão da catraca. O objetivo do projeto é a precisão do modelo. Cada passo contribui
rumo a este objetivo. Trate as alterações que você faz como experimentos que aumentam a precisão como
o caminho de ouro no processo e reorganizar outras etapas em torno deles. Precisão é um
catraca que só pode se mover em uma direção (melhor, não pior).

. Adapte conforme necessário. Modifique as etapas conforme necessário em um projeto, especialmente quando você se torna
mais experientes com o modelo. Desfoque as bordas das tarefas, como as etapas 4 a 5 para melhor
servir a precisão do modelo.

In [None]:
%reload_ext watermark
%watermark -a "Caique Miranda" -gu "caiquemiranda" -iv

### End.