![](https://github.com/pycaret/pycaret/raw/master/docs/images/logo.png)

# Czym jest PyCaret?

* `PyCaret` to otwarta biblioteka do uczenia maszynowego w Pythonie, która pozwala na szybkie prototypowanie modeli. 
* `PyCaret` jest zbudowany w oparciu o biblioteki takie jak scikit-learn, XGBoost, LightGBM, CatBoost, spaCy, Optuna, Hyperopt, Ray itp. 
* Pozwala na szybkie tworzenie modeli, wybór najlepszego modelu, strojenie hiperparametrów, porównywanie modeli, analizę wyników i wiele innych.

## importy

Dla klasyfikacji:

```python
from pycaret.classification import (
    setup, 
    compare_models, 
    create_model, 
    plot_model, 
    finalize_model, 
    save_model, 
    load_model, 
    predict_model,
)
```

Dla regresji:

```python
from pycaret.regression import (
    setup, 
    compare_models, 
    create_model, 
    plot_model, 
    finalize_model, 
    save_model, 
    load_model, 
    predict_model,
)
```

Dla klastrowania:

```python
from pycaret.clustering import (
    setup, 
    create_model, 
    plot_model, 
    save_model, 
    load_model, 
    predict_model,
)
```

## `setup` - konfiguracja sesji treningowej

### `setup` - funkcja, która inicjalizuje środowisko w PyCaret i przygotowuje dane do modelowania. 

```python
setup(data=df, target='price', session_id=123)
```

## `create_model` / `compare_models`  (nie dla klastrowania) - tworzenie modelu

### `create_model` - funkcja, która tworzy model i zwraca tabelę z wynikami walidacji krzyżowej (cross-validation).
```python
lr_model = create_model('lr')
```

### `compare_models` - funkcja, która porównuje wszystkie dostępne modele i zwraca tabelę z wynikami walidacji krzyżowej (cross-validation).
```python
best_model = compare_models()
```

## `plot_model` - wizualizacja modelu i jego wyników

### `plot_model` - funkcja, która wizualizuje wyniki modelu.
```python
plot_model(lr_model, plot='feature')
plot_model(lr_model, plot='confusion_matrix')
```

## `finalize_model` - finalizacja modelu (nie dla klastrowania)

### `finalize_model` - funkcja, która finalizuje model, czyli trenuje go na całym zbiorze danych.
```python
final_lr_model = finalize_model(lr_model)
```

## `save_model` - zapis modelu

### `save_model` - funkcja, która zapisuje model do pliku.
```python
save_model(final_lr_model, 'final_lr_model')
```

## `load_model` - wczytanie modelu

### `load_model` - funkcja, która wczytuje model z pliku.
```python
loaded_lr_model = load_model('final_lr_model')
```

## `predict_model` - predykcja na podstawie modelu

### `predict_model` - funkcja, która dokonuje predykcji na podstawie modelu.
```python
predictions = predict_model(loaded_lr_model, data=new_df)
```

## Modele kontra Pipeline?

- **Model**: Odnosi się do konkretnego algorytmu uczenia maszynowego, który jest trenowany na danych, np. `Logistic Regression`, `Random Forest`, `KMeans`, itp. Modele są używane do przewidywania wyników na podstawie danych wejściowych.

- **Pipeline**: To sekwencja operacji, które obejmują pełen proces przetwarzania danych i uruchamianie modelu. Pipeline w PyCaret automatycznie łączy etapy takie jak skalowanie, kodowanie, usuwanie brakujących danych, a na końcu uruchamianie wybranego modelu. Dzięki Pipeline cały proces od surowych danych do gotowego modelu jest spójny i zautomatyzowany.