![image.png](attachment:image.png)

### Hiperparametry modelu:

1. Definicja:
   - Hiperparametry to parametry, które są ustawiane przed rozpoczęciem procesu uczenia modelu.
   - W przeciwieństwie do parametrów modelu, hiperparametry nie są uczone z danych, ale muszą być określone przez osobę projektującą model.

2. Rola hiperparametrów:
   - Kontrolują zachowanie i strukturę modelu uczenia maszynowego.
   - Wpływają na proces uczenia, szybkość konwergencji i zdolność modelu do generalizacji.

3. Przykłady hiperparametrów dla różnych algorytmów:

   a) Dla sieci neuronowych:
      - Liczba warstw ukrytych i neuronów w każdej warstwie
      - Współczynnik uczenia (learning rate)
      - Funkcje aktywacji
      - Współczynnik regularyzacji
      - Rozmiar partii (batch size)
      - Liczba epok

   b) Dla drzew decyzyjnych i lasów losowych:
      - Maksymalna głębokość drzewa
      - Minimalna liczba próbek wymagana do podziału węzła
      - Liczba drzew w lesie losowym

4. Metody doboru hiperparametrów:

   a) Ręczny dobór:
      - Wymaga dużej wiedzy dziedzinowej i doświadczenia
      - Często jest procesem czasochłonnym i iteracyjnym

   b) Przeszukiwanie siatki (Grid Search):
      - Systematyczne przeszukiwanie predefiniowanej siatki wartości hiperparametrów
      - Gwarantuje znalezienie najlepszej kombinacji, ale może być obliczeniowo kosztowne

   c) Przeszukiwanie losowe (Random Search):
      - Losowe próbkowanie z przestrzeni hiperparametrów
      - Często bardziej efektywne niż Grid Search, szczególnie gdy nie wszystkie hiperparametry są równie ważne

5. Wpływ hiperparametrów na wydajność modelu:
   - Underfitting vs. Overfitting: Niewłaściwy dobór hiperparametrów może prowadzić do niedopasowania lub przeuczenia modelu
   - Kompromis między złożonością modelu a jego zdolnością do generalizacji
   - Wpływ na czas treningu i wymagania obliczeniowe

6. Dobre praktyki w doborze hiperparametrów:
   - Używanie walidacji krzyżowej do oceny wydajności modelu dla różnych kombinacji hiperparametrów
   - Rozpoczynanie od szerokiego zakresu wartości i stopniowe zawężanie
   - Uwzględnienie ograniczeń obliczeniowych i czasowych przy wyborze metody doboru hiperparametrów

7. Narzędzia i biblioteki do optymalizacji hiperparametrów:
   - Scikit-learn: GridSearchCV, RandomizedSearchCV
   - Optuna: Zaawansowana biblioteka do optymalizacji hiperparametrów
   - Keras Tuner: Dla modeli deep learning w Keras/TensorFlow

#### Przykłady hiperparametrów dla różnych algorytmów uczenia maszynowego w języku Python

1. Regresja liniowa:

```python
from sklearn.linear_model import LinearRegression

model = LinearRegression(
    fit_intercept=True,  # Czy dopasować wyraz wolny
    normalize=False,     # Czy normalizować cechy
    n_jobs=-1            # Liczba rdzeni CPU do użycia (-1 oznacza wszystkie)
)
```

2. Drzewo decyzyjne:

```python
from sklearn.tree import DecisionTreeClassifier

model = DecisionTreeClassifier(
    criterion='gini',     # Funkcja do mierzenia jakości podziału ('gini' lub 'entropy')
    max_depth=None,       # Maksymalna głębokość drzewa
    min_samples_split=2,  # Minimalna liczba próbek wymagana do podziału węzła
    min_samples_leaf=1,   # Minimalna liczba próbek wymagana w liściu
    max_features=None,    # Liczba cech do rozważenia przy szukaniu najlepszego podziału
    random_state=42       # Ziarno losowości dla powtarzalności wyników
)
```

3. Random Forest:

```python
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(
    n_estimators=100,     # Liczba drzew w lesie
    criterion='gini',     # Funkcja do mierzenia jakości podziału
    max_depth=None,       # Maksymalna głębokość drzewa
    min_samples_split=2,  # Minimalna liczba próbek wymagana do podziału węzła
    min_samples_leaf=1,   # Minimalna liczba próbek wymagana w liściu
    max_features='auto',  # Liczba cech do rozważenia przy szukaniu najlepszego podziału
    bootstrap=True,       # Czy używać bootstrappingu przy budowie drzew
    n_jobs=-1,            # Liczba rdzeni CPU do użycia
    random_state=42       # Ziarno losowości
)
```

4. Support Vector Machine (SVM):

```python
from sklearn.svm import SVC

model = SVC(
    C=1.0,                # Parametr regularyzacji
    kernel='rbf',         # Typ jądra ('linear', 'poly', 'rbf', 'sigmoid')
    degree=3,             # Stopień wielomianu (dla kernel='poly')
    gamma='scale',        # Współczynnik jądra dla 'rbf', 'poly' i 'sigmoid'
    class_weight=None,    # Wagi klas
    probability=False,    # Czy włączyć estymację prawdopodobieństwa
    random_state=42       # Ziarno losowości
)
```

5. K-Najbliższych Sąsiadów (KNN):

```python
from sklearn.neighbors import KNeighborsClassifier

model = KNeighborsClassifier(
    n_neighbors=5,        # Liczba sąsiadów do rozważenia
    weights='uniform',    # Wagi punktów ('uniform' lub 'distance')
    algorithm='auto',     # Algorytm do obliczania najbliższych sąsiadów
    leaf_size=30,         # Rozmiar liścia (wpływa na szybkość budowy drzewa)
    p=2,                  # Parametr potęgi dla metryki Minkowskiego
    metric='minkowski',   # Metryka do obliczania odległości
    n_jobs=-1             # Liczba rdzeni CPU do użycia
)
```

6. Gradient Boosting:

```python
from sklearn.ensemble import GradientBoostingClassifier

model = GradientBoostingClassifier(
    n_estimators=100,     # Liczba etapów boosting
    learning_rate=0.1,    # Szybkość uczenia się
    max_depth=3,          # Maksymalna głębokość drzew
    min_samples_split=2,  # Minimalna liczba próbek wymagana do podziału węzła
    min_samples_leaf=1,   # Minimalna liczba próbek wymagana w liściu
    subsample=1.0,        # Część próbek do użycia w każdej iteracji
    max_features=None,    # Liczba cech do rozważenia przy szukaniu najlepszego podziału
    random_state=42       # Ziarno losowości
)
```

Optymalizacja hiperparametrów:

Możesz użyć GridSearchCV lub RandomizedSearchCV do automatycznego wyszukiwania najlepszych hiperparametrów:

```python
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier

param_grid = {
    'n_estimators': [100, 200, 300],
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': [2, 5, 10],
    'min_samples_leaf': [1, 2, 4]
}

rf = RandomForestClassifier(random_state=42)

grid_search = GridSearchCV(
    estimator=rf,
    param_grid=param_grid,
    cv=5,
    n_jobs=-1,
    verbose=2
)

grid_search.fit(X_train, y_train)

print("Najlepsze parametry:", grid_search.best_params_)
print("Najlepszy wynik:", grid_search.best_score_)
```

Te przykłady pokazują, jak ustawić i optymalizować hiperparametry dla różnych algorytmów uczenia maszynowego w Pythonie. Warto pamiętać, że dobór odpowiednich hiperparametrów często zależy od specyfiki danych i problemu, który rozwiązujemy.

**Parametry modelu**: wartości, które model dostosowuje w trakcie uczenia.


Parametry modelu:

1. Definicja:
   - Parametry modelu to zmienne wewnętrzne, które model ustala podczas procesu treningu.
   - Są to wartości, które model dostosowuje, aby lepiej dopasować się do danych treningowych.

2. Rola parametrów:
   - Definiują zachowanie modelu i jego zdolność do przewidywania lub klasyfikacji.
   - Reprezentują "wiedzę" nabytą przez model z danych treningowych.

3. Przykłady parametrów dla różnych modeli:

   a) Regresja liniowa:
      - Współczynniki (wagi) dla każdej cechy
      - Wyraz wolny (bias)

   b) Sieci neuronowe:
      - Wagi połączeń między neuronami
      - Biasy neuronów

   c) Drzewa decyzyjne:
      - Warunki podziału w węzłach
      - Wartości przewidywane w liściach


4. Proces uczenia parametrów:

   a) Inicjalizacja:
      - Parametry są zwykle inicjowane losowo lub zgodnie z określoną strategią.

   b) Optymalizacja:
      - Podczas treningu parametry są iteracyjnie aktualizowane.
      - Celem jest minimalizacja funkcji straty (loss function).

   c) Algorytmy optymalizacji:
      - Gradient Descent i jego warianty (np. Stochastic Gradient Descent, Mini-batch Gradient Descent)
      - Algorytmy adaptacyjne (np. Adam, RMSprop, Adagrad)

5. Różnice między parametrami a hiperparametrami:
   - Parametry są uczone z danych, hiperparametry są ustawiane ręcznie lub optymalizowane zewnętrznie.
   - Liczba parametrów wpływa na złożoność modelu, podczas gdy hiperparametry kontrolują proces uczenia.

6. Wymiar parametrów:
   - Liczba parametrów może się znacznie różnić między modelami.
   - Proste modele mogą mieć kilka parametrów, podczas gdy głębokie sieci neuronowe mogą mieć miliony.

7. Regularyzacja parametrów:
   - Techniki takie jak L1 (Lasso) i L2 (Ridge) regularyzacja pomagają kontrolować wartości parametrów.
   - Celem jest zapobieganie przeuczeniu poprzez ograniczenie złożoności modelu.

8. Interpretacja parametrów:
   - W niektórych modelach (np. regresja liniowa) parametry mają bezpośrednią interpretację.
   - W bardziej złożonych modelach (np. głębokie sieci neuronowe) interpretacja parametrów może być trudniejsza.


9. Transfer learning i parametry:
    - W transfer learning, parametry wstępnie wytrenowanego modelu są wykorzystywane jako punkt startowy.
    - Część parametrów może być "zamrożona", a część dostrajana do nowego zadania.

![image.png](attachment:image.png)