# ML i DL

Uczenie maszynowe (ML) uczy modele na podstawie danych i etykiet. 

Deep learning (DL) to jego podzbiór wykorzystujący wielowarstwowe sieci neuronowe, które lepiej radzą sobie z obrazami, tekstem czy dźwiękiem kosztem większych wymagań danych i mocy obliczeniowej.

## ✅ Główne zadania ML

1. **Klasyfikacja**

   * Odpowiada na pytanie: *do której klasy należy obiekt?*
   * Przykłady: rozpoznawanie obrazów (kot vs pies), analiza sentymentu tekstu (pozytywny/negatywny).

2. **Regresja**

   * Przewiduje *wartość liczbową (ciągłą)*.
   * Przykłady: przewidywanie cen nieruchomości, prognoza popytu.

3. **Klasteryzacja**

   * Grupuje podobne obiekty bez etykiet.
   * Przykłady: segmentacja klientów, grupowanie dokumentów.

4. **Rekomendacje**

   * Proponują elementy na podstawie wcześniejszych wyborów.
   * Przykłady: filmy w serwisach VOD, produkty w e-commerce.


## Przegląd zastosowań machine learning (ML) i deep learning (DL)

Poniżej znajdziesz szeroki przegląd zastosowań ML/DL wraz z praktycznymi wskazówkami „co do czego się nadaje”. Celem jest szybkie zorientowanie się, jakie typy modeli i technik wybierać do danego problemu.

### Wizja komputerowa (Computer Vision)

Wizja komputerowa to dział sztucznej inteligencji, który zajmuje się tym, aby **komputery „widziały” i rozumiały obrazy czy filmy w podobny sposób jak człowiek**.
Wyobraź sobie, że pokazujesz komputerowi zdjęcie kota – wizja komputerowa pozwala mu powiedzieć: *„to jest kot”*, a czasem nawet *„to jest kot rasy syjamskiej, siedzący na kanapie”*.

---

#### Typowe zadania:

* **Klasyfikacja obrazów** – odpowiedź na pytanie *„co znajduje się na obrazie?”*.
  Np. zdjęcie psa → model mówi: „to pies”.

* **Detekcja obiektów** – nie tylko *co* jest na obrazie, ale też *gdzie*.
  Np. zdjęcie ulicy → model rysuje ramki wokół samochodów i pieszych.

* **Segmentacja semantyczna / instancji** – komputer koloruje każdy piksel obrazu według tego, do czego należy.
  Semantyczna: wszystkie samochody mają ten sam kolor.
  Instancji: każdy samochód ma inny kolor.

* **Rozpoznawanie twarzy, emocji** – wykrywanie kto jest na zdjęciu, albo jaka emocja jest wyrażona.

* **OCR (Optical Character Recognition)** – odczyt tekstu z obrazów, np. ze skanu faktury.

* **Image captioning** – komputer sam tworzy opis zdjęcia.
  Np. „Na obrazku jest dziewczynka trzymająca balon”.

* **VQA (Visual Question Answering)** – zadawanie pytań o obraz.
  Np. pytasz: „Ile jest psów na zdjęciu?” → model odpowiada: „dwa”.

* **Super-resolution** – poprawianie rozdzielczości obrazów.

* **Denoising** – usuwanie szumu.

* **Inpainting** – „domalowywanie” brakujących fragmentów obrazu.

* **Medyczne obrazowanie** – wspieranie lekarzy przy analizie RTG, tomografii (TK), rezonansu (MRI).
  Modele wykrywają np. zmiany nowotworowe albo złamania.

---

#### Co się sprawdza (najpopularniejsze metody i modele):

* **CNN (Convolutional Neural Network)** – *splotowe sieci neuronowe*.
To klasyczne modele, które bardzo dobrze analizują obrazy. „Skanują” obraz kawałek po kawałku i uczą się rozpoznawać wzory.

* **ConvNeXt** – nowoczesna wersja CNN, bardziej efektywna.
* **EfficientNet** – sieć zaprojektowana tak, by mieć jak najlepszy stosunek jakości do szybkości działania.

* **Modele do detekcji obiektów**:

* **Faster R-CNN** – łączy klasyfikację i lokalizację obiektów.
* **Mask R-CNN** – dodatkowo potrafi segmentować piksele.
* **YOLO (You Only Look Once)** – bardzo szybki model, popularny w praktyce.
* **RetinaNet** – balansuje dokładność i szybkość.

* **Modele do segmentacji obrazów**:

* **U-Net** – świetny w medycynie, np. do zaznaczania guzów na RTG.
* **DeepLab** – segmentacja w wysokiej jakości.
* **Mask R-CNN** – także w tej kategorii.

* **Transformery w wizji** (inspiracja z NLP – języka):

* **ViT (Vision Transformer)** – traktuje obraz jak zbiór „kawałków” i analizuje je podobnie jak tekst.
* **Swin Transformer** – lepiej radzi sobie z dużymi obrazami.
* **SAM (Segment Anything Model)** – model od Meta, który potrafi segmentować dowolne obiekty z obrazu.

* **Modele generatywne**:

* **GAN (Generative Adversarial Network)** – sieci „rywalizujące”, które tworzą realistyczne obrazy.
* **VAE (Variational Autoencoder)** – model kompresujący i odtwarzający obrazy.
* **Diffusion Models (np. Stable Diffusion)** – najnowsze, bardzo mocne modele generujące obrazy na podstawie opisu tekstowego.

---

#### Kiedy nie używać Deep Learningu?

Nie zawsze warto sięgać po skomplikowane sieci neuronowe.
Jeśli zadanie jest proste i masz mało danych:

* np. chcesz policzyć średnicę ziaren ryżu na zdjęciu,
* albo odróżnić jabłko od pomarańczy na podstawie kilku cech geometrycznych (masa, kolor).

Wtedy lepiej sprawdzi się klasyczne ML:

* **SVM (Support Vector Machine)** – metoda klasyfikacji.
* **Drzewa decyzyjne, Gradient Boosting (GBM, XGBoost, LightGBM)**.
* Do tego **ręcznie wyciągnięte cechy** (np. kolor średni, kształt, tekstura).

| Problem | Dane wejściowe | Typowe modele |
| --- | --- | --- |
| Klasyfikacja obrazów | Zdjęcia | CNN, Vision Transformer |
| Detekcja obiektów | Obrazy z bbox | Faster R-CNN, YOLO |
| Segmentacja | Obrazy z maskami | U-Net, DeepLab |


### Przetwarzanie języka naturalnego (NLP)

**Przetwarzanie języka naturalnego (ang. Natural Language Processing, NLP)** to dziedzina sztucznej inteligencji, której celem jest to, aby komputery potrafiły rozumieć, analizować i generować język ludzki – zarówno w mowie, jak i w piśmie. Dzięki NLP możliwe jest np. automatyczne tłumaczenie, wykrywanie spamu w mailach czy prowadzenie rozmowy z chatbotem.

---

#### Typowe zadania:

* **Klasyfikacja tekstu** – przypisanie tekstu do jednej z kategorii.
  Przykłady: wykrywanie spamu w wiadomościach e-mail, analiza sentymentu recenzji filmowych (pozytywna/negatywna), kategoryzacja artykułów według tematyki.

* **NER (Named Entity Recognition) / Tagowanie sekwencji** – rozpoznawanie i oznaczanie nazw własnych w tekście.
  Np. w zdaniu „Jan Kowalski mieszka w Warszawie” model wykrywa, że *Jan Kowalski* to osoba, a *Warszawa* to miejsce.

* **Tłumaczenie maszynowe** – automatyczne tłumaczenie tekstu z jednego języka na inny (np. Google Translate).

* **Streszczanie i parafrazy** – generowanie krótszej wersji tekstu lub wyrażanie tej samej treści innymi słowami.

* **Odpowiadanie na pytania (QA, Question Answering)** – systemy, które potrafią znaleźć odpowiedź na pytanie w tekście.
  Rozwinięciem tego podejścia jest **RAG (Retrieval-Augmented Generation)**, gdzie model nie tylko odpowiada, ale także korzysta z zewnętrznej bazy wiedzy, aby podać precyzyjne informacje.

* **Chatboty i asystenci (LLM, Large Language Models)** – systemy prowadzące rozmowy z użytkownikiem, udzielające informacji czy wykonujące zadania.

* **Analiza dokumentów** – szczególnie ważne przy dużych i skomplikowanych plikach (kontrakty prawne, raporty, faktury). Modele NLP potrafią wydobywać kluczowe informacje, streszczać długie fragmenty lub odpowiadać na pytania dotyczące treści dokumentu.

---

#### Co się sprawdza:

* **Transformery / LLM (Large Language Models)** – to obecnie standard w NLP.
  Modele takie jak **BERT, RoBERTa, DeBERTa** świetnie nadają się do klasyfikacji tekstu, analizy sentymentu, NER i innych zadań wymagających „rozumienia” treści.

* **Generatywne modele językowe (LLM)** – np. **GPT, LLaMA, Mistral, T5**.
  Są używane do generacji tekstu, odpowiedzi na pytania, tworzenia streszczeń czy tłumaczeń. Dzięki nim powstały współczesne chatboty i asystenci AI.

* **Klasyczne metody NLP** – w przypadku mniejszych zbiorów danych nadal skuteczne są prostsze podejścia:

  * **Logistyczna regresja (logreg)** czy **SVM (Support Vector Machine)**,
  * reprezentacje tekstu oparte na **TF-IDF** (częstość słów z uwzględnieniem ich unikalności) lub **n-gramy** (ciągi kolejnych słów).

---

#### Kiedy nie używać Deep Learningu?

Nie zawsze opłaca się sięgać po duże modele językowe.

* Jeśli mamy **bardzo mało danych** albo problem jest prosty, lepiej wykorzystać reguły oparte na **wyrażeniach regularnych (regex)** czy proste heurystyki.
  Przykład: wykrywanie numerów PESEL w tekście – zamiast trenować model, wystarczy odpowiedni regex.

---

| Problem | Dane wejściowe | Typowe modele |
| --- | --- | --- |
| Klasyfikacja tekstu | Dokumenty, wiadomości | BERT, logistyczna regresja + TF-IDF |
| QA / chatboty | Pytania, dialog | GPT, T5 |
| Tłumaczenie | Parowane zdania | Transformer, seq2seq |


### Mowa, audio, sygnały

Przetwarzanie mowy i sygnałów dźwiękowych to dziedzina sztucznej inteligencji, która zajmuje się **rozumieniem, analizą i generowaniem dźwięku**. W odróżnieniu od NLP, gdzie punktem wyjścia jest tekst, tutaj bazą są **sygnały akustyczne** (fale dźwiękowe) lub inne dane sekwencyjne (np. sygnały biomedyczne).

#### Typowe zadania:

* **Rozpoznawanie mowy (ASR, Automatic Speech Recognition)** – zamiana dźwięku na tekst.
  Przykład: dyktujesz wiadomość, a system zapisuje ją jako tekst.

* **Synteza mowy (TTS, Text-to-Speech)** – odwrotny proces: zamiana tekstu na naturalnie brzmiącą mowę.
  Przykład: głosowe odpowiedzi w asystentach takich jak Siri czy Google Assistant.

* **Klasyfikacja dźwięków** – rozpoznawanie i kategoryzowanie odgłosów.
  Przykłady: identyfikacja gatunków ptaków po śpiewie, wykrywanie odgłosów awarii maszyn, rozpoznawanie odgłosów kroków czy strzałów.

* **Biomedyczne sygnały (EEG/ECG)** – analiza fal mózgowych, pracy serca czy innych sygnałów z organizmu w celu diagnozy i monitorowania stanu zdrowia.

* **Analiza wibracji i sygnałów technicznych** – np. monitorowanie maszyn przemysłowych w celu wykrywania anomalii i przewidywania awarii.

---

#### Co się sprawdza:

* **Modele sekwencyjne i transformerowe** – dobrze radzą sobie z długimi sygnałami audio.

  * **wav2vec 2.0** – model od Facebook AI, który nauczył się reprezentować mowę bez potrzeby ręcznej transkrypcji dużych zbiorów.
  * **Whisper** (OpenAI) – uniwersalny model do rozpoznawania mowy w wielu językach.
  * **Conformer** – architektura łącząca transformatory i konwolucje, świetna do ASR.

* **CNN (Convolutional Neural Networks) / TDNN (Time-Delay Neural Networks)** – dobre przy analizie krótszych fragmentów dźwięku, np. przy klasyfikacji krótkich odgłosów.

* **Augmentacje audio** – techniki zwiększania różnorodności danych, aby modele były bardziej odporne na szumy.

  * **SpecAugment** – metoda modyfikacji spektrogramów (graficznej reprezentacji dźwięku), np. poprzez zakrywanie fragmentów.

| Problem | Dane wejściowe | Typowe modele |
| --- | --- | --- |
| Rozpoznawanie mowy | Pliki audio | Wav2Vec2, Whisper |
| Synteza mowy | Tekst | Tacotron, VITS |
| Klasyfikacja dźwięków | Spektrogramy | CNN, CRNN |


### Szeregi czasowe i prognozowanie

**Szeregi czasowe** to dane uporządkowane w czasie. Mogą to być np. ceny akcji z kolejnych dni, liczba zamówień co godzinę, zużycie prądu w ciągu tygodnia czy odczyty z czujników w maszynach przemysłowych.
**Prognozowanie szeregów czasowych** polega na przewidywaniu przyszłych wartości oraz na wykrywaniu nietypowych zdarzeń (anomalii).

Wyobraź sobie firmę energetyczną, która chce wiedzieć, ile prądu zużyją mieszkańcy miasta jutro wieczorem – to właśnie klasyczne zadanie prognozowania szeregów czasowych.

---

#### Typowe zadania:

* **Prognoza popytu i sprzedaży** – np. ile produktów sprzeda się w przyszłym tygodniu w sklepie internetowym.
* **Prognoza obciążenia i zapotrzebowania** – np. ile energii elektrycznej będzie potrzebne w danym regionie o konkretnej godzinie.
* **Prognoza cen** – np. przewidywanie cen akcji, kryptowalut czy surowców.
* **Monitorowanie sensorów i maszyn** – przewidywanie przyszłych odczytów czujników w systemach przemysłowych.
* **Detekcja anomalii** – wychwytywanie nietypowych zdarzeń, np. nagłego wzrostu temperatury w silniku czy spadku napięcia w sieci.
* **Predykcja awarii** – przewidywanie, kiedy maszyna lub system może ulec uszkodzeniu, aby wcześniej zaplanować konserwację.

---

#### Co się sprawdza (najpopularniejsze metody i modele):

* **Modele klasyczne** – proste i szybkie, dobre jako punkt odniesienia (baseline):

    * **ARIMA (AutoRegressive Integrated Moving Average)** – statystyczny model prognozowania uwzględniający zależności w czasie.
    * **Prophet** (Meta/Facebook) – łatwy w użyciu, dobrze radzi sobie z trendami i sezonowością (np. dzienną, tygodniową, roczną).

* **Modele oparte na cechach czasowych** – gdy z daty wyciągamy dodatkowe informacje (dzień tygodnia, pora roku, święta) i trenujemy klasyczne modele ML:

* **XGBoost, LightGBM, CatBoost** – algorytmy gradient boosting, które świetnie sprawdzają się w zastosowaniach biznesowych i często dominują w konkursach.

* **Deep Learning (DL)** – szczególnie dla dużych i złożonych danych:

 * **LSTM (Long Short-Term Memory)** – sieci rekurencyjne, które dobrze „pamiętają” dłuższe zależności w czasie.
 * **GRU (Gated Recurrent Unit)** – prostsza i szybsza wersja LSTM.
 * **Temporal Convolutional Networks (TCN)** – sieci konwolucyjne przetwarzające dane sekwencyjne.
 * **Transformers** – coraz częściej stosowane w szeregach czasowych, zwłaszcza gdy trzeba analizować **wiele serii jednocześnie** i uchwycić **bardzo długie zależności w czasie**.

---
#### Kiedy nie używać Deep Learningu?

* Jeśli masz **mało danych** albo prognozujesz krótkie serie, klasyczne modele (ARIMA, Prophet) i boosting zwykle są wystarczające.
* Jeśli ważna jest **interpretowalność** modelu – łatwiej wyjaśnić prognozę z ARIMA czy LightGBM niż z LSTM czy Transformerów.
* Deep learning wymaga dużo mocy obliczeniowej i danych – jeśli tego brakuje, proste modele mogą być skuteczniejsze i tańsze.

| Problem | Dane | Typowe modele |
| --- | --- | --- |
| Prognoza obrotów | Historia sprzedaży | ARIMA, LSTM, Prophet |
| Wykrywanie anomalii | Czujniki IoT | Autoencoder, Isolation Forest |
| Planowanie zapasów | Zamówienia dzienne | Gradient Boosting, N-BEATS |


### Dane tabelaryczne (Tabular Data)

**Dane tabelaryczne** to najczęściej spotykany format w biznesie – w arkuszach Excel, bazach danych czy systemach CRM.
Każdy wiersz odpowiada obiektowi (np. klientowi, transakcji, produktowi), a kolumny to jego cechy (wiek, kraj, cena, liczba zakupów).

Wyobraź sobie tabelę klientów sklepu internetowego:
dla każdego klienta mamy **wiek, płeć, liczbę zakupów i średnią wartość koszyka**. Na tej podstawie możemy próbować przewidzieć, czy klient zrobi kolejne zakupy lub jak duże będzie miał wydatki.

---

#### Typowe zadania:

* **Klasyfikacja klientów (CRM, churn prediction)** – np. czy klient odejdzie w najbliższym miesiącu.
* **Ocena ryzyka kredytowego** – czy klient spłaci kredyt.
* **Prognoza wartości** – np. cena nieruchomości na podstawie jej cech.
* **Detekcja oszustw (fraud detection)** – wykrywanie podejrzanych transakcji.
* **Analizy scoringowe** – przypisywanie punktów ryzyka, jakości lub wartości.

---

#### Co się sprawdza (najpopularniejsze metody i modele):

* **Gradient boosting na drzewach decyzyjnych** – złoty standard dla tabular:

   * **XGBoost** – bardzo popularny, wydajny model.
   * **LightGBM** – szybszy i bardziej pamięciooszczędny.
   * **CatBoost** – dobrze radzi sobie z danymi kategorycznymi.

Te modele często wygrywają konkursy Kaggle i w praktyce są **state-of-the-art (SOTA)** dla danych tabelarycznych.

* **Uczenie głębokie (Deep Learning)** – ma sens w pewnych warunkach:

    * **TabNet, TabTransformer** – architektury specjalnie zaprojektowane dla tabular.
    * **Sieci w pełni połączone (MLP)** – dla bardzo dużych zbiorów danych.
    * Szczególnie przydatne, gdy łączymy różne typy danych: np. **tekst + obrazy + liczby**.

<div class="alert alert-info">


**Czy MLP mają sens dla danych tabelarycznych?**

👉 Ogólnie: **nie zawsze** – w praktyce klasyczne modele oparte na drzewach (XGBoost, LightGBM, CatBoost) biją MLP na głowę przy małych i średnich zbiorach tabularnych. Ale są sytuacje, gdzie sieci neuronowe **zaczynają wygrywać**.

---
 ✅ Kiedy MLP mogą działać dobrze?

1. **Bardzo duże zbiory danych** (miliony rekordów)

   * Boostingi potrafią się wtedy „nasycać”, a sieci neuronowe dzięki ogromnej liczbie parametrów potrafią lepiej uogólniać.

2. **Wysoka liczba cech i złożone zależności**

   * MLP potrafi uchwycić interakcje nieliniowe pomiędzy cechami, których boosting nie zawsze wychwyci wprost.

3. **Multimodalne dane** (łączenie różnych źródeł)

   * Jeśli oprócz tabeli masz też **teksty, obrazy czy sygnały czasowe**, MLP (lub inne sieci głębokie) mogą łączyć te różne reprezentacje.

4. **End-to-end learning**

   * Możesz trenować model bezpośrednio z danymi surowymi (np. embeddings kategorii + liczby), bez czasochłonnego feature engineering.

5. **Dostęp do GPU**

   * Przy dużych zbiorach MLP skalują się lepiej na GPU niż boosting na CPU.

---

❌ Kiedy boostingi są lepsze niż MLP?

* **Małe i średnie zbiory (np. <100k rekordów)** – boosting jest dużo stabilniejszy.
* **Dane głównie kategoryczne/liczbowe** – CatBoost i LightGBM radzą sobie znakomicie bez dużych nakładów na tuning.
* **Konkursy Kaggle/tabular benchmarks** – tam drzewiaste modele zwykle wygrywają.

---

Podsumowanie

* **Domyślnie → boosting (XGBoost, LightGBM, CatBoost).**
* **MLP / Deep Learning → sens, gdy mamy:**

  * *bardzo duże dane*,
  * *różne typy danych (multimodalne)*,
  * *dużą moc obliczeniową*.
    
</div>


---

#### Kiedy nie używać Deep Learningu?

Deep learning nie zawsze jest najlepszy:

* Przy **małych i średnich zbiorach danych** – łatwo wtedy o przeuczenie, a boosting na drzewach działa lepiej i szybciej.
* Gdy cechy są dobrze opisane i uporządkowane – klasyczne modele ML są prostsze i bardziej interpretable.

Lepsze będą wtedy:

* **Drzewa decyzyjne** – łatwe do interpretacji.
* **Random Forest** – dobry kompromis między skutecznością a prostotą.
* **Logistic Regression, SVM** – skuteczne dla prostych klasyfikacji.

| Problem | Dane | Typowe modele |
| --- | --- | --- |
| Scoring kredytowy | Wartości liczbowe/kategoryczne | XGBoost, CatBoost |
| Churn | Dane klientów | LightGBM, sieć tabularna |
| Wycenianie polis | Historia roszczeń | GLM, GBM |


### Rekomendacje i personalizacja

**Systemy rekomendacyjne** to rozwiązania, które pomagają użytkownikowi znaleźć najbardziej interesujące treści lub produkty.
Wyobraź sobie sklep internetowy: zamiast przeglądać tysiące artykułów, widzisz listę „Produkty dla Ciebie” – to właśnie efekt działania systemu rekomendacyjnego.

Podobnie na platformach streamingowych (np. filmy, muzyka) czy w mediach społecznościowych – rekomendacje decydują, jakie treści pojawią się na Twojej stronie głównej.

---

#### Typowe zadania:

* **Ranking produktów lub treści** – układanie listy w kolejności dopasowania do użytkownika (np. sortowanie filmów w serwisie streamingowym).
* **Predykcja klikalności (CTR prediction)** – przewidywanie, czy użytkownik kliknie w reklamę lub artykuł.
* **„Użytkownicy podobni do…”** – znajdowanie grup osób o zbliżonych preferencjach.
* **Rekomendacje spersonalizowane** – np. dobór playlist muzycznych, produktów w koszyku czy artykułów w aplikacji newsowej.

---

#### Co się sprawdza (najpopularniejsze metody i modele):

* **Metody klasyczne**:

    * **Collaborative filtering (ALS – Alternating Least Squares)** – bazuje na macierzy użytkownicy–produkty, dobrze działa, gdy mamy dużo interakcji (ocen, kliknięć).

* **Deep Learning**:

    * **Wide & Deep** – łączy modele liniowe (wide) z głębokimi (deep), balansując między dopasowaniem a generalizacją.
    * **DeepFM** – rozszerza wide&deep, dobrze znajduje interakcje między cechami.
    * **Transformers dla sekwencji kliknięć** – analizują historię działań użytkownika jak sekwencję zdarzeń (podobnie jak zdania w NLP).

* **Praktyczne elementy ekosystemu rekomendacji**:

    * **Feature stores** – centralne repozytoria cech, żeby system działał spójnie online i offline.
    * **Duże zbiory logów** – kluczowe do trenowania, bo interakcje użytkowników generują olbrzymie ilości danych.
    * **Negatywne próbkowanie** – technika uczenia, w której model dostaje przykłady zarówno kliknięte, jak i niekliknięte, żeby nauczyć się rozróżniać.
    * **A/B testy** – absolutna podstawa przy wdrażaniu systemów rekomendacyjnych, pozwalają sprawdzić, czy nowy model faktycznie poprawia zaangażowanie użytkowników.

---

#### Kiedy nie używać Deep Learningu?

* Jeśli baza interakcji jest **mała** – proste metody (np. collaborative filtering) sprawdzą się lepiej.
* Gdy potrzebujesz **prostego i szybkiego baseline’u** – często wystarczy macierz użytkownicy–produkty lub model liniowy.
* Deep learning ma sens dopiero wtedy, gdy masz **bardzo dużo danych** (miliony użytkowników, miliardy kliknięć).

| Problem | Dane | Typowe modele |
| --- | --- | --- |
| Filmy dla użytkownika | Oceny, kliknięcia | Matrix Factorization, Two-Tower |
| Produkty | Historia zakupów | LightFM, DeepFM |
| Kontent | Logi odsłon | Transformers, seq2seq |


### Modele generatywne

**Modele generatywne** to algorytmy sztucznej inteligencji, które potrafią **tworzyć nowe dane podobne do tych, na których były uczone**.
Mogą generować tekst, obrazy, muzykę, a nawet wideo czy dane syntetyczne do testów.

Wyobraź sobie, że prosisz komputer: *„Napisz wiersz w stylu Mickiewicza”* albo *„Stwórz obraz psa w czapce astronauty na Księżycu”*. Dzięki modelom generatywnym to jest możliwe.

---

#### Typowe zadania:

* **Generowanie tekstu** – np. czaty, artykuły, streszczenia (LLM).
* **Generowanie obrazów** – np. obrazy ze Stable Diffusion, DALL·E czy MidJourney.
* **Generowanie muzyki i wideo** – modele komponujące utwory lub tworzące krótkie klipy filmowe.
* **Tworzenie danych syntetycznych** – np. uzupełnianie brakujących danych w tabelach albo wzbogacanie zbiorów treningowych.
* **Uzupełnianie braków (inpainting)** – „domalowywanie” fragmentów zdjęcia.
* **Style transfer** – np. zamiana zdjęcia w obraz olejny albo nadanie tekstowi stylu poetyckiego.
* **Super-resolution** – zwiększanie rozdzielczości obrazu.

---

#### Co się sprawdza (najpopularniejsze metody i modele):

* **Modele dyfuzyjne (Diffusion Models)** – obecnie najpotężniejsze do obrazów i multimediów.

    * **Stable Diffusion** – generowanie obrazów na podstawie opisu tekstowego.
    * Działają przez stopniowe usuwanie szumu i odtwarzanie struktury obrazu.

* **GAN (Generative Adversarial Network)** – sieci rywalizujące: generator tworzy dane, a dyskryminator ocenia, czy są prawdziwe.

    * Świetne do tworzenia realistycznych obrazów, wideo czy deepfake’ów.

* **VAE (Variational Autoencoder)** – kompresuje dane do ukrytej reprezentacji i odtwarza je, co pozwala generować nowe warianty.

* **Modele autoregresyjne** – szczególnie w tekście:

    * **LLM (Large Language Models)** – np. GPT, LLaMA, Mistral, Gemini.
    * Generują sekwencję token po tokenie, przewidując kolejne słowo.

---

#### Kiedy uważać?

Modele generatywne są bardzo potężne, ale:

* Mogą **halucynować** – wymyślać fakty, które brzmią wiarygodnie, ale są fałszywe.
* Mogą tworzyć **treści wrażliwe lub niepożądane** – dlatego wymagają filtrów i kontroli.
* Ich **ewaluacja** powinna być dopasowana do zadania – nie wystarczy sprawdzić dokładności, trzeba ocenić jakość, spójność, zgodność z kontekstem i bezpieczeństwo.



### Uczenie ze wzmocnieniem (RL)

**Uczenie ze wzmocnieniem (ang. Reinforcement Learning, RL)** to podejście w sztucznej inteligencji, w którym agent (program/algorytm) **uczy się poprzez interakcję ze środowiskiem**. Zamiast mieć gotowe poprawne odpowiedzi (jak w klasyfikacji czy regresji), agent próbuje różnych działań i na podstawie **nagrody (reward)** lub **kary (penalty)** stopniowo odkrywa, które strategie są najlepsze.

Można to porównać do nauki jazdy na rowerze: nikt nie mówi ci dokładnie, jak poruszać nogami i balansować ciałem. Uczysz się sam, próbując, popełniając błędy i stopniowo dostajesz „nagrody” (utrzymujesz równowagę, jedziesz dalej).

---

#### Typowe zadania:

* **Sterowanie i gry** – np. nauka grania w szachy, Go, Atari, StarCraft. Agent próbuje różnych ruchów, a nagrodą jest wygrana partia.

* **Robotyka** – uczenie robota chodzenia, chwytania przedmiotów czy poruszania się po pomieszczeniu.

* **Optymalizacja decyzji** – np. systemy rekomendacyjne, które uczą się, jakie produkty polecać, żeby zwiększyć sprzedaż.

* **Autonomiczne pojazdy** – samochód uczy się prowadzić, testując różne działania i obserwując efekty (utrzymanie pasa, unikanie kolizji).

* **Zarządzanie zasobami** – np. w energetyce czy IT: RL może optymalizować zużycie energii, alokację serwerów albo przepustowość sieci.

---

#### Kluczowe pojęcia:

* **Agent** – „uczeń”, który podejmuje decyzje.
* **Środowisko (environment)** – świat, w którym działa agent.
* **Stan (state)** – opis aktualnej sytuacji.
* **Akcja (action)** – ruch, który agent może wykonać.
* **Nagroda (reward)** – informacja zwrotna, czy dana akcja była dobra czy zła.
* **Polityka (policy)** – strategia, czyli sposób wybierania akcji w danych stanach.
* **Wartość (value)** – przewidywana suma nagród, jakie agent otrzyma w przyszłości.

---

#### Co się sprawdza:

* **Q-learning** – klasyczna metoda, w której agent uczy się przypisywać wartości do par (stan, akcja).
* **Deep Q-Networks (DQN)** – połączenie Q-learningu z sieciami neuronowymi, co pozwala rozwiązywać bardziej złożone problemy (np. gry Atari).
* **Policy Gradient** – metody, w których agent bezpośrednio uczy się polityki (strategii).
* **Actor-Critic** – połączenie podejścia wartości (critic) i polityki (actor), często stosowane w praktyce.
* **Zaawansowane algorytmy** – np. PPO (Proximal Policy Optimization), A3C (Asynchronous Advantage Actor-Critic), które świetnie działają w skomplikowanych środowiskach.

---

#### Kiedy nie używać RL?

Uczenie ze wzmocnieniem jest bardzo potężne, ale też trudne:

* wymaga **dużej liczby prób** (często milionów kroków interakcji ze środowiskiem),
* może być **niestabilne i trudne do dostrojenia**,
* bywa nieopłacalne, jeśli można zastosować prostsze podejścia (np. klasyfikację, regresję czy reguły).

Przykład: jeśli chcemy przewidzieć, czy klient kupi produkt, prościej zastosować klasyfikację niż uczyć agenta RL, który testuje różne strategie marketingowe od zera.

| Środowisko | Cel | Przykłady |
| --- | --- | --- |
| Gry | Maks. wynik | Atari, AlphaGo |
| Robotyka | Sterowanie ruchem | roboty manipulacyjne |
| Optymalizacja | Minimalizacja kosztu | systemy logistyczne |


### Grafy i sieci (Graph Neural Networks, GNN)

**Grafy** to struktury danych, w których elementy (węzły) połączone są relacjami (krawędziami).
Przykłady grafów to **sieci społeczne** (osoby i ich znajomości), **sieci finansowe** (transakcje między firmami), czy **struktury chemiczne** (atomy i wiązania w molekułach).

**Graph Neural Networks (GNN)** pozwalają modelom uczyć się nie tylko na podstawie cech poszczególnych obiektów, ale także na podstawie ich **relacji i kontekstu w całej sieci**.

---

#### Typowe zadania:

* **Detekcja nadużyć i powiązań** – np. wykrywanie fraudów w sieciach płatniczych dzięki analizie relacji między kontami.
* **Rekomendacje oparte na grafach** – np. „użytkownicy podobni do Ciebie kupili…” z wykorzystaniem powiązań między produktami i użytkownikami.
* **Chemia i bioinformatyka** – analiza molekuł jako grafów atomów, przewidywanie właściwości leków.
* **Analiza sieci społecznych** – wykrywanie społeczności, influencerów czy przewidywanie powstania nowych połączeń (link prediction).

---

#### Co się sprawdza (najpopularniejsze metody i modele):

🔹 **Graph Neural Networks (GNN)** – sieci neuronowe specjalnie zaprojektowane do pracy na grafach:

* **GCN (Graph Convolutional Network)** – przenosi ideę konwolucji na strukturę grafu.
* **GraphSAGE** – uczy się reprezentacji węzłów na podstawie sąsiadów, skalowalny do dużych grafów.
* **GAT (Graph Attention Network)** – wykorzystuje mechanizm uwagi (attention), żeby różnie ważyć znaczenie sąsiadów.

🔹 **Metody osadzania (embedding)** – tworzą wektorowe reprezentacje węzłów lub całych grafów, które można używać w klasycznych modelach ML:

* **DeepWalk** – uczy się embeddingów węzłów na podstawie losowych przejść po grafie.
* **node2vec** – rozszerzenie DeepWalk, które lepiej kontroluje balans między eksploracją lokalną i globalną w grafie.

---

#### Kiedy nie używać GNN?

* Jeśli dane mają **prostą tabelaryczną strukturę**, a relacje nie odgrywają dużej roli – lepiej sprawdzą się klasyczne modele ML.
* GNN wymagają **dużych grafów** i odpowiedniej mocy obliczeniowej – dla małych problemów mogą być przesadą.
* Modele osadzania (node2vec, DeepWalk) często wystarczą jako prostsze i szybsze podejście.

| Problem | Dane | Modele |
| --- | --- | --- |
| Rekomendacje oparte na grafie | Graf relacji użytkownik–produkt | GraphSAGE, GAT |
| Analiza ryzyka | Graf transakcji finansowych | GCN, GNN z uwagą |
| Chemia | Molekuły jako grafy | Message Passing Neural Network |


### Zastosowania branżowe (przykłady)

#### Medycyna

* **Wsparcie diagnostyki obrazowej** – wykrywanie zmian na zdjęciach RTG, rezonansach czy tomografii.
  📌 *Case study:* Szpital wdrożył system analizy RTG klatki piersiowej. Model wykrywa potencjalne zmiany (np. guz, zapalenie płuc) i oznacza je dla radiologa. Lekarz podejmuje decyzję szybciej, bo AI wskazuje obszary wymagające uwagi.

* **Triaż pacjentów** – automatyczne przypisywanie priorytetów w izbie przyjęć.
  📌 *Case study:* W izbie przyjęć chatbot zbiera od pacjenta podstawowe informacje o objawach. Model ML szacuje ryzyko i decyduje, czy pacjent powinien być przyjęty natychmiast, czy może poczekać.

* **Transkrypcja i podsumowania wizyt** – automatyczne notatki z rozmów lekarz–pacjent.
  📌 *Case study:* Lekarz prowadzi rozmowę, a system ASR + NLP generuje streszczenie: objawy, diagnoza, zalecenia. Lekarz jedynie zatwierdza dokumentację.

* **Przewidywanie readmisji** – szacowanie ryzyka powrotu pacjenta do szpitala.
  📌 *Case study:* Model analizuje historię chorób, wyniki badań i zalecenia przy wypisie. Pacjenci z wysokim ryzykiem dostają dodatkowe wsparcie i częstsze kontrole.

---

#### Przemysł / IoT

* **Predykcja awarii** – monitorowanie maszyn i prognozowanie usterek.
  📌 *Case study:* Fabryka produkująca turbiny instaluje sensory IoT. Model analizuje wibracje i temperaturę, przewidując zużycie łożysk. Dzięki temu serwis odbywa się przed awarią.

* **Kontrola jakości wizyjna** – automatyczne wykrywanie defektów na liniach produkcyjnych.
  📌 *Case study:* Kamera na linii montażowej rejestruje każdy produkt. System CV wykrywa rysy i defekty w czasie rzeczywistym, zatrzymując wadliwy element przed dalszą obróbką.

* **Optymalizacja energii** – inteligentne sterowanie urządzeniami i procesami.
  📌 *Case study:* Zakład przemysłowy używa modeli prognozujących zapotrzebowanie na energię. System wyłącza część maszyn w godzinach szczytu, obniżając koszty.

---

#### Finanse

* **Scoring kredytowy** – ocena wiarygodności kredytowej klientów.
  📌 *Case study:* Bank korzysta z gradient boosting (XGBoost) do analizy danych klientów. Klienci z wysokim scoringiem otrzymują decyzję kredytową w kilka minut bez angażowania analityka.

* **AML (Anti-Money Laundering)** – wykrywanie podejrzanych transakcji.
  📌 *Case study:* Model GNN analizuje sieci powiązań transakcyjnych. Nietypowe wzorce (łańcuchy przelewów między spółkami-słupami) automatycznie trafiają do działu compliance.

* **Detekcja fraudów** – analiza schematów płatności w celu wychwycenia oszustw.
  📌 *Case study:* System monitoruje transakcje kartowe w czasie rzeczywistym. W razie podejrzeń blokuje płatność i wysyła klientowi SMS z prośbą o potwierdzenie.

* **Prognozy rynkowe** – przewidywanie trendów giełdowych i kursów walut.
  📌 *Case study:* Fundusz inwestycyjny używa modelu LSTM do przewidywania krótkoterminowych trendów kursu EUR/USD i dostosowuje portfel inwestycji.

* **Chatboty obsługi klienta** – automatyczne odpowiedzi na pytania klientów.
  📌 *Case study:* Bankowy chatbot odpowiada na pytania o saldo, limity kart, a w razie problemów przekierowuje rozmowę do konsultanta.

---

#### Handel i marketing

* **Rekomendacje produktów** – dobór ofert dopasowanych do klienta.
  📌 *Case study:* Sklep internetowy wdrożył model transformerowy, który analizuje sekwencje kliknięć. Klient po wejściu na stronę od razu widzi listę produktów „dla Ciebie”.

* **Personalizacja mailingów** – dynamiczne treści w e-mailach.
  📌 *Case study:* System wybiera w mailingu różne zdjęcia i teksty w zależności od profilu klienta – fani sportu dostają promocje na sprzęt, a miłośnicy elektroniki na nowe gadżety.

* **Prognozy popytu** – planowanie sprzedaży i zapasów.
  📌 *Case study:* Sieć handlowa prognozuje sprzedaż produktów na podstawie historii i sezonowości. Dzięki temu unika braków towarów i strat z powodu nadmiaru.

* **Dynamic pricing** – automatyczne dostosowywanie cen.
  📌 *Case study:* Platforma rezerwacyjna hoteli ustala ceny w zależności od lokalnego popytu i wydarzeń. Podczas koncertu w mieście ceny rosną, a poza sezonem spadają.

---

#### Media

* **Klasyfikacja treści** – kategoryzowanie artykułów, zdjęć czy filmów.
  📌 *Case study:* Portal newsowy automatycznie oznacza artykuły etykietami „polityka”, „sport”, „rozrywka”. To ułatwia rekomendacje i wyszukiwanie.

* **Moderacja treści** – wykrywanie naruszeń regulaminu.
  📌 *Case study:* Serwis społecznościowy używa NLP i CV do filtrowania komentarzy oraz zdjęć. Posty oznaczone przez AI trafiają do moderatora.

* **Generowanie opisów** – np. podpisy do zdjęć.
  📌 *Case study:* Agencja prasowa korzysta z modelu Vision+Language. Do zdjęcia z wydarzenia generowany jest opis: „Premier przemawia podczas szczytu w Brukseli”.

* **Tłumaczenia** – automatyczne przekłady treści.
  📌 *Case study:* Serwis streamingowy udostępnia serial w kilkunastu językach dzięki modelom tłumaczeniowym (MarianMT, M2M-100).

---

#### Administracja / sektor publiczny

* **OCR dokumentów** – automatyczne odczytywanie i digitalizacja.
  📌 *Case study:* Urząd gminy skanuje papierowe wnioski. OCR zamienia je w tekst, który trafia bezpośrednio do systemu obiegu dokumentów.

* **Kategoryzacja pism** – przypisywanie spraw do działów.
  📌 *Case study:* Model NLP klasyfikuje wnioski jako „podatki”, „budownictwo”, „świadczenia socjalne”. Trafiają od razu do odpowiedniego urzędnika.

* **Chatboty informacyjne** – odpowiadają mieszkańcom.
  📌 *Case study:* Mieszkaniec pyta przez stronę miasta: „Jak złożyć wniosek o dowód osobisty?”. Chatbot odsyła do formularza i podaje listę wymaganych dokumentów.


## „Co do czego się nadaje” – praktyczna ściąga doboru modeli

- Obrazy (klasyfikacja/detekcja/segmentacja): CNN/ViT; mało danych – transfer learning (fine‑tuning pre‑trained)
- Tekst (klasyfikacja/QA/streszczanie): BERT/T5/LLM; mało danych – logreg/SVM + TF‑IDF jako baseline
- ASR/TTS: Whisper, wav2vec 2.0, Tacotron/HiFi‑GAN
- Szeregi czasowe: Prophet/ARIMA (baseline), GBM, następnie LSTM/Transformers przy większej skali
- Tabular: najpierw XGBoost/LightGBM/CatBoost; DL gdy łączysz multimodalne dane lub masz bardzo duże zbiory
- Rekomendacje: matrix factorization → DeepFM/Wide&Deep → sekwencyjne Transformers
- Anomalie: izolacyjne lasy (IF), One‑Class SVM, autoenkodery, probabilistyczne (VAE)
- Grafy: GNN gdy relacje między obiektami są kluczowe

Dodatkowe wskazówki:
- Zawsze zacznij od prostego baseline’u (regresja/logreg, GBM) i dopiero potem przechodź do DL.
- Transfer learning i gotowe wektory (obrazy: ImageNet, tekst: BERT/fastText) często kluczowe przy małej liczbie próbek.


## Jak wybierać model? Krótka procedura

### Zdefiniuj typ problemu

Najpierw jasno określ, co chcesz osiągnąć:

* **Klasyfikacja** – przewidywanie kategorii (np. spam / nie-spam).
* **Regresja** – przewidywanie wartości liczbowej (np. cena mieszkania).
* **Detekcja / segmentacja** – znajdowanie obiektów na obrazach.
* **QA (Question Answering)** – odpowiadanie na pytania na podstawie tekstu.
* **Ranking / rekomendacje** – porządkowanie wyników względem użytkownika.
* **Generacja** – tworzenie tekstów, obrazów czy dźwięków.

---

### Sprawdź dane

Zrozum charakterystykę danych:

* **Struktura** – obraz, tekst, dane tabelaryczne, graf, sygnał.
* **Rozmiar** – mały zbiór (setki przykładów) vs. bardzo duży (miliony).
* **Jakość** – szumy, brakujące wartości, błędne etykiety.
* **Balans klas** – czy wszystkie etykiety są reprezentowane porównywalnie.

---

### Ustal metryki biznesowe

Zanim zaczniesz trenować, określ co znaczy „dobrze”:

* **Klasyfikacja**: F1, ROC-AUC, Precision, Recall.
* **Regresja**: MAE, RMSE, R².
* **Ranking / rekomendacje**: Precision@K, nDCG.
* **Generacja**: BLEU, ROUGE, METEOR, albo metryki subiektywne (np. ocena użytkownika).

---

### Zbuduj prosty baseline

Nie zaczynaj od najbardziej złożonych sieci – prosty punkt odniesienia jest kluczowy:

* **Tabular**: gradient boosting (XGBoost, LightGBM, CatBoost).
* **Tekst**: TF-IDF + logreg/SVM.
* **Obrazy**: prosta regresja logistyczna na cechach z modelu pre-trained (np. ResNet).

---

### Gdy baseline za słaby → Deep Learning dopasowany do modalności

* **Obrazy**: CNN, ViT (Vision Transformer).
* **Tekst**: BERT/LLM, T5, GPT.
* **Ciągi czasowe**: LSTM, GRU, Transformer.
* **Grafy**: GCN, GraphSAGE, GAT.

---

### Walidacja i higiena eksperymentu

* **Cross-validation** lub dedykowane podziały (np. time series split).
* **Unikanie data leakage** – dane z przyszłości albo informacje ze zbioru testowego nie mogą trafiać do treningu.
* **Rzetelna ocena** – nie opieraj się tylko na accuracy, jeśli problem jest niezbalansowany.

---

### Uprość wdrożenie

Nawet najlepszy model nie ma sensu, jeśli nie da się go efektywnie używać:

* **Rozmiar modelu** – czy mieści się w pamięci?
* **Latencja** – czy odpowiada szybko (np. <100 ms w chatbotach)?
* **Koszty** – GPU/CPU, inference w chmurze.
* **Optymalizacja**:

  * *Destylacja* – mniejszy model uczony przez większy.
  * *KV-cache* – przyspiesza generację w LLM.
  * *Quantization* – redukuje rozmiar kosztem minimalnej utraty jakości.

### Przykład: prognozowanie sprzedaży


### Zdefiniuj typ problemu

Cel: **przewidzieć sprzedaż produktów w kolejnych dniach**.
➡️ Typ: **regresja (time series forecasting)**.

---

### Sprawdź dane

Masz dane historyczne:

* cechy czasowe (dzień tygodnia, święta, promocje),
* cechy produktu (kategoria, cena),
* dane o pogodzie i kampaniach reklamowych.
  ➡️ Dane są dość obszerne (miliony wierszy), ale pojawiają się brakujące wartości (np. brak odnotowanej sprzedaży).

---

### Ustal metryki biznesowe

Firma chce **unikać braków w magazynie**.
➡️ Metryka: **MAE (Mean Absolute Error)** dla prognozy liczby sztuk.
Dodatkowo: **MAPE** (żeby rozumieć błąd w %).

---

### Zbuduj baseline

* Prosty model: **Prophet / ARIMA** dla każdej serii produktowej.
* Alternatywnie: **LightGBM** z cechami kalendarzowymi i lagami (sprzedaż z ostatnich dni).
  ➡️ Szybko sprawdzasz, czy nawet prosty model daje zadowalającą prognozę.

---

### Gdy baseline za słaby → Deep Learning

Jeśli MAE nadal jest wysokie:

* **LSTM / GRU** – do modelowania sekwencji sprzedaży.
* **Temporal Convolutional Networks (TCN)** – do dłuższych zależności czasowych.
* **Transformery do szeregów czasowych** (np. Informer, TFT) – szczególnie przy wielu produktach i dużych zbiorach danych.

---

### Walidacja i higiena eksperymentu

* Użyj **time series split** (nie shuffle, żeby nie mieszać przyszłości z przeszłością).
* Sprawdź, czy model nie podgląda danych z przyszłości (np. feature leakage z agregatów).
* Oceń wyniki nie tylko na średnim MAE, ale też na produktach kluczowych biznesowo.

---

### Uprość wdrożenie

* Czy model może działać codziennie dla tysięcy produktów?
* Jeśli Transformer jest za wolny → distylacja lub prostszy GBM z dobrze dobranymi cechami.
* Jeżeli deployment jest w chmurze → policz koszty inference (czy GPU się opłaca).

---

📌 **Efekt końcowy:**
Sklep zaczyna od **LightGBM baseline**, który daje szybkie i zaskakująco dobre wyniki.

Dla najważniejszych produktów eksperymentuje z **Transformerem**, a tam gdzie koszty są zbyt duże – zostaje przy GBM.



## Kiedy nie używać deep learningu?

- Bardzo mało danych, prosta struktura → klasyczne ML lub nawet reguły
- Silne ograniczenia latency/zasobów na urządzeniu i brak możliwości kompresji → model lekki (GBM, logreg)
- Problem zrozumiałości (compliance) → modele interpretowalne (drzewa, GLM) lub techniki XAI (SHAP, LIME) do DL


## Zasoby i biblioteki

- PyTorch, TensorFlow/Keras – główne frameworki DL
- Hugging Face Transformers/Datasets – NLP i multi‑modal
- timm, ultralytics/YOLO, detectron2, mmcv/mmdetection – CV
- xgboost, lightgbm, catboost – tabular
- prophet, darts, gluonts – szeregi czasowe
- pytorch‑geometric, dgl – GNN
- mlflow, wandb – śledzenie eksperymentów; onnx/torch‑tensorrt – wdrażanie i przyspieszanie


## Podsumowanie

- Dobór techniki zależy od typu danych, ilości przykładów i ograniczeń wdrożeniowych.
- Zaczynaj od prostych baseline’ów i stopniowo zwiększaj złożoność.
- Transfer learning, dobre walidacje i właściwe metryki często dają większy zwrot niż „nowa architektura”.





## Słowniczek – ściąga

| Pojęcie                   | Definicja                                                                          |
| ------------------------- | ---------------------------------------------------------------------------------- |
| **ML (Machine Learning)** | Uczenie maszynowe.                                                                 |
| **DL (Deep Learning)**    | Uczenie głębokie, poddziedzina ML.                                                 |
| **model**                 | Algorytm rozwiązujący konkretny problem. W tym też często sieć neuronowa           |
| **sieć neuronowa (NN)**   | Podstawowy budulec DL – uczy się z danych wykonywać zadania (np. klasyfikację).    |
| **warstwa wejściowa**     | Pierwsza warstwa sieci, przyjmuje dane.                                            |
| **warstwa wyjściowa**     | Ostatnia warstwa sieci, zwraca wynik (np. prawdopodobieństwa klas).                |
| **warstwy ukryte**        | Wszystkie warstwy pomiędzy wejściem a wyjściem; tam dzieje się „magia” obliczeń.   |
| **funkcja aktywacyjna**   | Nadaje sieci nieliniowość, umożliwia uczenie się złożonych zależności.             |
| **optymalizator**         | Algorytm modyfikujący wagi w procesie uczenia.                                     |
| **framework ML**          | Biblioteka do budowania/uczenia sieci (np. TensorFlow, PyTorch).                   |
| **funkcja błędu (loss)**  | Określa, jak bardzo wynik modelu różni się od wartości oczekiwanej.                |
| **forward propagation**   | Przekazywanie danych od wejścia do wyjścia.                                        |
| **backpropagation**       | Mechanizm uczenia – korekta wag na podstawie błędu.                                |
| **Gradient Descent**      | Metoda optymalizacji wag polegająca na „schodzeniu” po zboczu funkcji błędu w dół. |




## Nasze zajęcia

Na zajęciach praktycznych wykorzystamy te koncepcje w prostych przykładach:

* użyjemy **sieci neuronowych do regresji i klasyfikacji**,
* popracujemy także na **danych tabelarycznych** – mimo że deep learning nie zawsze jest tu najlepszym wyborem, to na ich przykładzie łatwo pokazać podstawowe mechanizmy,
* zastosujemy sieci do **rozpoznawania pisma ręcznego (MNIST)**,
* spróbujemy także swoich sił w problemach z danymi sekwencyjnymi - takimi jak NLP czy serie czasowe. 
