# Otimizações para Modelos

## O que são hiperparâmetros?

* Decisões de projeto do modelo: número de camadas, unidades, ativação (`relu`, etc), uso de `Dropout`, `BatchNormalization`, etc.
* Não são aprendidos via backpropagation, são definidos manualmente ou por busca automatizada.

## Como funciona a otimização:

1. Escolha automática de hiperparâmetros.
2. Treinamento do modelo com esses hiperparâmetros.
3. Avaliação em dados de validação.
4. Escolha do próximo conjunto de hiperparâmetros com base nos resultados anteriores.
5. Repetição do processo.
6. Avaliação final em dados de teste.

## Técnicas usadas:

* Busca aleatória
* Otimização Bayesiana
* Algoritmos genéticos
* Outros métodos sem gradiente

## Desafios:

* Espaço de busca não é contínuo → sem gradiente
* Cada avaliação é cara (novo modelo, novo treino).
* Resultados podem ser ruidosos.

> Otimizar o espaço de busca certo é essencial. Hiperparâmetro tuning **não substitui** conhecimento de boas práticas de modelagem.

## Ferramentas úteis:

* **KerasTuner**: oferece modelos tunáveis prontos (ex: `HyperXception`, `HyperResNet`)
* **AutoML**: tenta automatizar *todo* o processo (ex: AutoKeras)

# O que é ensembling?

* Combina as previsões de vários modelos para melhorar o desempenho.
* Cada modelo capta uma parte da verdade, juntos, os modelos enxergam o "todo" de forma mais precisa.

## Técnicas comuns:

* Média das previsões
* Média ponderada (pesos ajustados pela validação)

## Ponto-chave: **diversidade**

* Quanto mais **diferentes** forem os modelos, melhor.
* Modelos iguais com inicializações aleatórias = pouca diversidade → pouco ganho.

## O que funciona bem:

* Arquiteturas distintas
* Diferentes abordagens (ex: redes neurais + árvores de decisão)

