# ***Hyperparameterinställning med Scikit-learn: En nybörjarguide***
---
### *Vad är hyperparametrar?*

**Hyperparametrar** - är konfigurationer som du ställer in innan du tränar en maskininlärningsmodell. De kontrollerar hur modellen lär sig och fungerar. 
</br>Till skillnad från vanliga parametrar, som modellen lär sig under träningen, måste hyperparametrar ställas in manuellt eller genom automatiserade metoder.

*Exempel på hyperparametrar:*
- Antal lager i ett neuralt nätverk
- Inlärningshastighet i gradientbaserade algoritmer
- Antal träd i en Random Forest
- C-värde i Support Vector Machines

### *Varför används hyperparameterinställning?*
- Förbättra modellens prestanda: Rätt hyperparametrar kan avsevärt förbättra en modells noggrannhet och generaliseringsförmåga.
- Undvika överanpassning: Genom att justera hyperparametrar kan vi hitta en balans mellan att passa träningsdata och generalisera till ny data.
- Anpassa modellen till specifika problem: Olika dataset och problem kan kräva olika hyperparameterinställningar för bästa resultat.

### *När används hyperparameterinställning?*

*Hyperparameterinställning används vanligtvis:*
- Efter att du har valt en modell och tränat den med standardinställningar.
- När du vill optimera en modells prestanda för ett specifikt problem.
- Som en del av modellvalsprocessen, för att jämföra olika modeller på lika villkor.

### *Hur fungerar hyperparameterinställning i Scikit-learn?*

*Scikit-learn erbjuder flera metoder för hyperparameterinställning:*
- GridSearchCV: Söker genom ett fördefinierat rutnät av hyperparametrar.
- RandomizedSearchCV: Söker slumpmässigt genom ett definierat intervall av hyperparametrar.
- HalvingGridSearchCV och HalvingRandomSearchCV: Mer effektiva versioner som använder successiv halvering.
---


**GridSearchCV** - är en funktion i Scikit-learn som systematiskt arbetar genom flera kombinationer av parameterinställningar, utvärderar alla kombinationer och behåller den bästa.

Namnet kommer från:

- "Grid" eftersom den söker genom ett rutnät av parametrar
- "Search" eftersom den söker efter den bästa kombinationen
- "CV" står för Cross-Validation (korsvalidering)

**Hur fungerar GridSearchCV?**

- Definierar ett parameterrutnät: Du anger ett "rutnät" av hyperparametrar att testa.
- Utför en uttömmande sökning: ***GridSearchCV*** testar alla möjliga kombinationer av de angivna parametervärdena.
- Använder korsvalidering: För varje kombination utförs korsvalidering för att utvärdera prestandan.
- Väljer den bästa modellen: Den väljer den parameterkombination som ger bäst resultat enligt ett specificerat mått (t.ex. noggrannhet).


**Här är några enkelt exempel på hur man kan använda GridSearchCV:**

In [4]:
from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC
from sklearn.datasets import load_iris

# Ladda exempeldata
iris = load_iris()
X, y = iris.data, iris.target

# Definiera modellen
svm = SVC()

# Definiera hyperparametrar att testa
param_grid = {
    'C': [0.1, 1, 10],
    'kernel': ['rbf', 'linear']
}

# Skapa GridSearchCV-objekt
grid_search = GridSearchCV(svm, param_grid, cv=5)

# Utför sökningen
grid_search.fit(X, y)

# Skriv ut bästa parametrar och resultat
print("Bästa parametrar:", grid_search.best_params_)
print("Bästa resultat:", grid_search.best_score_)


Bästa parametrar: {'C': 1, 'kernel': 'linear'}
Bästa resultat: 0.9800000000000001


In [3]:
from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# Ladda data
iris = load_iris()
X, y = iris.data, iris.target

# Dela upp data i tränings- och testset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Definiera modellen
svm = SVC()

# Definiera parameterrutnätet
param_grid = {
    'C': [0.1, 1, 10, 100],
    'kernel': ['rbf', 'linear'],
    'gamma': ['scale', 'auto', 0.1, 1]
}

# Skapa GridSearchCV-objektet
grid_search = GridSearchCV(svm, param_grid, cv=5, scoring='accuracy', n_jobs=-1)

# Utför sökningen
grid_search.fit(X_train, y_train)

# Skriv ut resultat
print("Bästa parametrar:", grid_search.best_params_)
print("Bästa korsvalideringsscore:", grid_search.best_score_)

# Utvärdera på testdata
best_model = grid_search.best_estimator_
test_score = best_model.score(X_test, y_test)
print("Testscore:", test_score)



Bästa parametrar: {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}
Bästa korsvalideringsscore: 0.9583333333333334
Testscore: 1.0


***I detta exempel:***
- Vi definierar ett rutnät av parametrar att testa för SVM-modellen.
- *GridSearchCV* kommer att testa alla kombinationer av dessa parametrar (4 * 2 * 4 = 32 kombinationer).
- För varje kombination utförs 5-faldig korsvalidering *(cv=5)*.
- Vi använder noggrannhet som utvärderingsmått *(scoring='accuracy')*.
- *n_jobs=-1* betyder att alla tillgängliga processorkärnor används för att parallellisera sökningen.
- Efter sökningen får vi de bästa parametrarna och den bästa scoren.
- Slutligen utvärderar vi den bästa modellen på testdata.


**Fördelar med GridSearchCV**
- Automatisering: Automatiserar processen att hitta de bästa hyperparametrarna.
- Grundlighet: Testar alla möjliga kombinationer i det definierade rutnätet.
- Korsvalidering: Använder korsvalidering för att ge en robust utvärdering av varje parameterkombination.
- Reproducerbarhet: Ger reproducerbara resultat.

**Nackdelar med GridSearchCV**
- Beräkningsintensiv: Kan vara mycket tidskrävande för stora parameterrutnät eller stora dataset.
- Begränsad till definierade värden: Kan missa optimala värden som ligger mellan de definierade punkterna i rutnätet.

*GridSearchCV* är ett kraftfullt verktyg för hyperparameterinställning, särskilt när du har en god uppfattning om vilka parameterområden som är relevanta för ditt problem. För mer omfattande sökningar eller när du är osäker på parameterområdena kan RandomizedSearchCV vara ett bättre alternativ.

---

Låt oss ta ett enkelt exempel till där vi använder ***Random Forest*** för att förutsäga klasser baserat på data. Vi kan justera antalet träd i skogen och maxdjupet på varje träd.

1. Skapa en random Forest-modell:

In [5]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# Ladda datasetet (iris-datasetet är ett enkelt klassificeringsproblem)
iris_data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

# Skapa en enkel Random Forest-modell
model = RandomForestClassifier()
model.fit(X_train, y_train)

2. Definiera hyperparametrar att justera:

In [8]:
from sklearn.model_selection import GridSearchCV

# Definiera hyperparametrarna vi vill testa
param_grid = {
    'n_estimators': [10, 50, 100],      # Antalet träd i skogen
    'max_depth': [None, 10, 20, 30],    # Maxdjupet på träden
}

3. Utför hyperparameterinställning med GridSearchCV:

In [9]:
# Skapa en GridSearchCV-objekt
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5)

# Träna modellen med olika kombinationer av hyperparametrar
grid_search.fit(X_train, y_train)

# Hitta de bästa hyperparametrarna
print("Bästa hyperparametrar:", grid_search.best_params_)

Bästa hyperparametrar: {'max_depth': 10, 'n_estimators': 100}


4. Utvärdera den optimerade modellen:

In [10]:
# Använd de bästa hyperparametrarna för att förutsäga på testdata
best_model = grid_search.best_estimator_
print("Testnoggrannhet:", best_model.score(X_test, y_test))

Testnoggrannhet: 1.0


***Nyckelpunkter:***

- Hyperparameterinställning hjälper till att förbättra modellens prestanda genom att hitta de optimala inställningarna.
- Två vanliga metoder för detta i Scikit-learn är ***GridSearchCV*** och ***RandomizedSearchCV***.
- Det är viktigt att använda korsvalidering för att säkerställa att resultatet generaliserar väl till nya data.

Hyperparameterinställning är kritiskt när du har byggt din modell och vill finjustera den för att få ut bästa möjliga prestanda.