# Model tuning

## Definition
Tuning indebærer at justere parametrene for en algoritme med henblik på at forbedre algoritmens prædiktive performance.

## Typer af parametre i ML

- **hyperparametre**: parametre, der styrer læringsprocessen. Et eksempel er $C$ for `LogisticRegression`.
- **modelparametre**: estimeres/læres i forbindelse med modeltræning. F.eks. de estimerede koefficienter for `LogisticRegression`.

Det er således predictorens hyperparametre, man tuner. Man kan/bør også tune hyperparametrene for ens data-transformations-pipeline.

## Tuning-approach 1: Trial & Error
En manuel *trial & error* tuning-proces består i følgende skridt:

1. Vælg værdier for hyperparametre
2. Træn/fit model på træningssæt
3. Mål modellens performance på valideringssættet
4. Justér parametre og gentag trin 1-3

## Tuning-approach 2: Grid Search
*Grid search* indebærer, at der trænes og evalueres en model for alle kombinationer af parametre, som modeludvikleren har specificeret i et *grid*. 

<img src="https://miro.medium.com/v2/resize:fit:1200/1*o2rMCJKUcpqRBFfHZ3Jkfg.png" width="600">

Grid search er beregningsmæssigt tungt, da beregningstiden stiger eksponentielt i antallet af parametre.

## Tuning-approach 2: Random Search

Brugeren specificerer fordelinger for de hyper-parametre, der skal tunes, og hvor mange iterationer søgningen skal køre.

For hver iteration samples parameter-værdierne fra de specificerede fordelinger.

```python
space = dict()
space['penalty'] = ['none', 'l1', 'l2', 'elasticnet']
space['C'] = loguniform(1e-5, 100)
search = RandomizedSearchCV(model, space, n_iter=10)
```

## Avancerede approaches

Der findes også mere avancerede alternativer f.eks.:

- [Bayesian Optimization](https://en.wikipedia.org/wiki/Bayesian_optimization)

- [Hyperband](https://fastml.com/tuning-hyperparams-fast-with-hyperband/)
