# Kluczowe pojęcia i krótkie opisy

- **Machine Learning** – dziedzina nauki dająca komputerom możliwość uczenia się bez konieczności ich jawnego programowania.  

- **Training Set (dane uczące)** – przykładowe dane używane do trenowania modelu, składające się z próbek (sample).  

- **Accuracy** – konkretna miara wydajności modelu, często stosowana w zadaniach klasyfikacyjnych.  

- **Data Mining** – analizowanie zbioru danych w celu poszukiwania ukrytych wzorców.  

- **NLP (Natural Language Processing)** – przetwarzanie języka naturalnego; dziedzina AI zajmująca się analizą, rozumieniem i generowaniem ludzkiego języka przez komputery.  

- **RNN (Recurrent Neural Network)** – rekurencyjna sieć neuronowa; sieć przetwarzająca dane sekwencyjne (np. tekst, dźwięk) poprzez zapamiętywanie wcześniejszych stanów.  

- **CNN (Convolutional Neural Network)** – konwolucyjna sieć neuronowa; model szczególnie skuteczny w rozpoznawaniu obrazów dzięki operacjom splotu.  

- **NLU (Natural Language Understanding)** – rozumienie języka naturalnego; poddziedzina NLP skupiająca się na interpretacji znaczenia wypowiedzi.  

- **DBSCAN (Density-Based Spatial Clustering of Applications with Noise)** – algorytm grupowania na podstawie gęstości punktów; wykrywa skupiska danych i odrzuca szum.  

- **MNIST (Modified National Institute of Standards and Technology dataset)** – popularny zbiór danych zawierający ręcznie pisane cyfry, używany do trenowania i testowania modeli ML.  

- **Transformator (Transformer)** – architektura sieci neuronowych oparta na mechanizmie uwagi (attention); podstawa modeli językowych, takich jak GPT czy BERT.  

- **Redukcja wymiarowości (Dimensionality Reduction)** – proces upraszczania danych przez zmniejszenie liczby cech przy zachowaniu najważniejszych informacji.  

- **Splot (Convolution)** – operacja matematyczna w CNN, która wyłapuje lokalne wzorce w danych (np. krawędzie na obrazie).  

- **Regresja liniowa (Linear Regression)** – metoda przewidywania wartości ciągłych poprzez dopasowanie prostej linii do danych.  

- **Regresja wielomianowa (Polynomial Regression)** – rozszerzenie regresji liniowej, w której zależność między zmiennymi jest opisana wielomianem.  

- **Random Forest Regression (Regresja lasu losowego)** – metoda oparta na wielu drzewach decyzyjnych, uśredniająca ich wyniki w celu zwiększenia dokładności.  

- **Decision Tree** to model uczenia maszynowego używany zarówno w **klasyfikacji**, jak i **regresji**.  Działa podobnie do procesu podejmowania decyzji przez człowieka — zadaje kolejne pytania, aż dojdzie do odpowiedzi.

- **SVM (Support Vector Machine)** – maszyna wektorów nośnych; algorytm klasyfikacji i regresji, który znajduje granicę maksymalnie oddzielającą klasy.  


# Wykorzystanie ML

- Problemy, ktore wymagaja czestego dostrajania algorytmu lub korzystanie z dlugich list regul.

- Zlozonoe problemy, ktorych nie da sie rozwiazac tradycyjnymi metodami

- Zmiennych srodowisk ( `model ml` moze sie dostosowac szybko do nowych danych i byc aktualizowany z latwoscia w dowolnym momencie )

- Do analizy ogromnej ilosci danych

# Rodzaje systemów ML


- **Nadzorowanie w fazie uczenia** - (uczenie nadzorowane, nienadzorowane, półnadzorowane, samonadzorowane, wzmocnienie itd.)

- **Uczenie się w czasie rzeczywistym** - (u. przyrostowe, wsadowe)

- **Sposób pracy** - proste porównanie nowych punktów danychze znanymi punktami, lub wykrywanie wzorców w `training set` i tworzenie modelu predykcyjnego 


## Uczenie nadzorowane (Supervised Learning)

#### Etykieta (Label) i Cel (Target)

- **Etykieta (Label)** – to **prawidłowa odpowiedź** w danych uczących, której model używa do nauki.  
- **Cel (Target)** – to **wartość, którą model ma przewidzieć** podczas działania na nowych danych.  
W praktyce oba pojęcia często oznaczają to samo – wynik, do którego model dąży.

#### 🔹 Przykład:

| Powierzchnia (m²) | Liczba pokoi | Lokalizacja | **Cena (etykieta / target)** |
|--------------------|--------------|--------------|------------------------------|
| 60                 | 3            | Centrum      | 520 000 zł                   |

➡️ **Cechy (features):** powierzchnia, liczba pokoi, lokalizacja  
➡️ **Etykieta / Cel:** czy email jest spamem czy nie -> SPAM / NOT SPAM

---


Uczenie nadzorowane to rodzaj uczenia maszynowego, w którym model uczy się na podstawie **danych oznaczonych (z etykietami)**.  
Każdy przykład w danych zawiera:
- **wejście/cechy (features)** – czyli dane wejściowe, np. liczba pokoi, lokalizacja, temperatura, słowa w zdaniu,  
- **wyjście (label lub target value)** – czyli oczekiwany wynik, np. cena domu, gatunek kwiatu, klasa obrazu.  

Celem jest nauczenie modelu zależności między wejściem a wyjściem, tak aby mógł **przewidywać etykiety (lub wartości)** dla nowych, nieznanych danych.  

---

### 🔹 Regresja (Regression)

Regresja to typ uczenia nadzorowanego, w którym celem jest **przewidywanie wartości liczbowych (ciągłych)** — tzw. **wartości docelowej (target value)**.  
Model stara się znaleźć zależność matematyczną między cechami (features) a wartością, którą chcemy przewidzieć.

#### Jak to działa:
Model analizuje dane wejściowe i dopasowuje funkcję (np. prostą lub krzywą), która najlepiej opisuje zależność między zmiennymi.  
Podczas treningu minimalizuje różnicę między przewidywaną a rzeczywistą wartością (np. za pomocą błędu MSE – Mean Squared Error).

#### Przykłady praktyczne:
- **Prognozowanie cen nieruchomości** na podstawie powierzchni, lokalizacji i liczby pokoi.  
- **Przewidywanie zużycia energii** lub wody w budynkach.  
- **Szacowanie przyszłej sprzedaży** produktów lub przychodów firmy.  
- **Prognozowanie pogody** – np. temperatury lub opadów.  
- **Przewidywanie kursów akcji lub kryptowalut** w czasie.  
- **Modelowanie wzrostu populacji** lub trendów gospodarczych.

#### Popularne algorytmy:
- Regresja liniowa (Linear Regression)  
- Regresja wielomianowa (Polynomial Regression)  
- Random Forest Regression  
- Support Vector Regression (SVR)  
- Sieci neuronowe (Neural Networks)

---

### 🔹 Klasyfikacja (Classification)

Klasyfikacja to rodzaj uczenia nadzorowanego, w którym celem jest **przypisanie danych do jednej lub wielu kategorii (klas)**.  
Model nie przewiduje liczby, lecz **etykietę** — np. „kot” / „pies”, „spam” / „nie spam”.

#### Jak to działa:
Model uczy się rozróżniać wzorce w danych, tak aby dla nowych przykładów mógł zdecydować, do której klasy należą.  
Podczas uczenia minimalizuje liczbę błędnych przypisań (np. za pomocą funkcji strat cross-entropy).

#### Przykłady praktyczne:
- **Filtracja spamu** – rozpoznawanie, czy e-mail to spam czy wiadomość prawidłowa.  
- **Rozpoznawanie obrazów** – np. identyfikacja obiektów (samochód, człowiek, drzewo).  
- **Diagnostyka medyczna** – klasyfikacja, czy pacjent ma daną chorobę na podstawie wyników badań.  
- **Analiza nastrojów (sentiment analysis)** – określenie, czy opinia jest pozytywna, neutralna, czy negatywna.  
- **Wykrywanie oszustw finansowych** – klasyfikacja transakcji jako prawdziwe lub podejrzane.  
- **Rozpoznawanie mowy lub tekstu** – np. komendy głosowe lub analiza języka naturalnego.  

#### Popularne algorytmy:
- Logistic Regression  
- Decision Tree  
- Random Forest  
- k-NN (k-Nearest Neighbors)  
- SVM (Support Vector Machine)  
- Naive Bayes  
- Sieci neuronowe (CNN, RNN)

---

### 🔹 Proces uczenia modelu:
1. **Przygotowanie danych** – zebranie i oznaczenie danych (features + labels).  
2. **Podział danych** – na zbiór uczący (*training set*) i testowy (*test set*).  
3. **Trenowanie modelu** – model uczy się zależności między wejściami a wyjściami.  
4. **Walidacja i testowanie** – sprawdzenie, jak dobrze model działa na nowych danych.  
5. **Ewaluacja wyników** – np. przy użyciu metryk: *accuracy, precision, recall, MSE, R²*.

---

### 🔹 Zastosowania w realnym świecie:
- Systemy rekomendacji (Netflix, Amazon, Spotify).  
- Asystenci głosowi (rozumienie mowy i komend).  
- Systemy wykrywania oszustw bankowych.  
- Ocena ryzyka kredytowego i scoring klientów.  
- Wykrywanie defektów w produkcji przemysłowej.  
- Automatyczne rozpoznawanie obrazu w kamerach bezpieczeństwa.  
- Prognozowanie cen, popytu, trendów i sprzedaży.  


## Uczenie nienadzorowane (Unsupervised Learning)

Uczenie nienadzorowane to rodzaj uczenia maszynowego, w którym model uczy się na podstawie **danych nieoznaczonych (bez etykiet)**.  
Celem jest odkrywanie ukrytych wzorców, struktur i zależności w danych wejściowych, bez wcześniejszego informowania modelu, jakie są „prawidłowe” odpowiedzi. Model samodzielnie grupuje, redukuje lub identyfikuje anomalie.

---

### 🔹 Klastrowanie / Analiza Skupień (Clustering)

Klastrowanie, często nazywane **Analizą Skupień**, to typ uczenia nienadzorowanego, w którym celem jest **grupowanie podobnych punktów danych w klastry (grupy)**.  
Model samodzielnie identyfikuje wewnętrzne struktury w danych, tak aby punkty w tym samym klastrze były do siebie podobne (wysoka spójność wewnątrzklastrowa), a punkty z różnych klastrów – jak najbardziej różne (niska spójność międzyklastrowa).

#### Jak to działa:
Algorytmy klastrowania analizują cechy danych i na podstawie ich podobieństwa (często mierzonego odległością w przestrzeni cech, np. odległością euklidesową) przypisują je do grup. Nie potrzebują z góry określonych kategorii czy etykiet. Liczba klastrów może być z góry narzucona (np. K-Means) lub odkryta przez algorytm (np. DBSCAN).

#### Przykłady praktyczne:
- **Segmentacja klientów** – grupowanie klientów na podstawie zachowań zakupowych, danych demograficznych, historii przeglądania. Pozwala to firmom na tworzenie spersonalizowanych kampanii marketingowych i strategii produktowych.
- **Analiza danych genetycznych i medycznych** – grupowanie genów, próbek DNA, komórek lub pacjentów, aby odkryć podobieństwa i różnice, które mogą wskazywać na wspólne cechy, podtypy chorób lub reakcje na leczenie.
- **Organizacja i eksploracja dokumentów lub artykułów** – automatyczne grupowanie tekstów o podobnej tematyce bez ich wcześniejszego tagowania. Ułatwia to wyszukiwanie, przeglądanie i odkrywanie nowych tematów w dużych zbiorach danych tekstowych.
- **Detekcja miast w danych geograficznych** – grupowanie punktów danych lokalizacji (np. z GPS), aby zidentyfikować obszary o wysokim zagęszczeniu, co może odpowiadać miastom lub obszarom miejskim.
- **Kompresja i segmentacja obrazów** – grupowanie podobnych pikseli lub obszarów obrazu na podstawie koloru, tekstury czy jasności, co może być wykorzystane do kompresji, analizy obiektów lub edycji obrazu.
- **Wstępna analiza danych** – odkrywanie naturalnych grup w zbiorze danych, co może dostarczyć cennych insightów przed zastosowaniem algorytmów nadzorowanych lub w celu lepszego zrozumienia danych.

#### Popularne algorytmy:
- K-Means
- Hierarchical Clustering (klastrowanie hierarchiczne)
- DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
- Gaussian Mixture Models (GMM)
- Agglomerative Clustering
- Mean-Shift

---

### 🔹 Redukcja Wymiarowości (Dimensionality Reduction)

Redukcja wymiarowości to typ uczenia nienadzorowanego, który ma na celu **zmniejszenie liczby cech (zmiennych) w zbiorze danych**, jednocześnie zachowując jak najwięcej istotnych informacji.  
Pomaga to w wizualizacji danych, usuwaniu szumu, kompresji danych i przyspieszaniu pracy innych algorytmów.

#### Jak to działa:
Model znajduje sposoby na reprezentowanie danych w przestrzeni o niższej liczbie wymiarów, tworząc nowe, syntetyczne cechy (tzw. komponenty lub embeddingi), które są kombinacją oryginalnych cech. Metody te mogą być liniowe (np. PCA) lub nieliniowe (np. t-SNE, UMAP), zdolne do wykrywania bardziej złożonych struktur.

#### Przykłady praktyczne:
- **Wizualizacja danych wielowymiarowych** – przekształcenie danych z setek czy tysięcy wymiarów do 2 lub 3 wymiarów, aby móc je wykreślić i zrozumieć strukturę, dostrzec klastry lub anomalie. Jest to kluczowy krok w eksploracyjnej analizie danych.
- **Kompresja obrazów i dźwięku** – redukcja liczby pikseli, kanałów kolorów lub próbek sygnału przy zachowaniu akceptowalnej jakości wizualnej/słuchowej, co zmniejsza wymagania dotyczące przechowywania i przesyłania danych.
- **Przygotowanie danych do uczenia nadzorowanego** – zmniejszenie liczby cech wejściowych dla klasyfikatorów lub regresorów, aby zapobiec nadmiernemu dopasowaniu (overfitting), zmniejszyć złożoność obliczeniową i poprawić generalizację modelu.
- **Redukcja szumu (denoising)** – usunięcie zbędnych, redundantnych lub mało istotnych cech, które mogą wprowadzać szum do modelu i pogarszać jego wydajność.
- **Uczenie embeddingów** – tworzenie niskowymiarowych, gęstych reprezentacji (wektorów) dla złożonych obiektów, takich jak słowa (word embeddings), obrazy czy użytkownicy, które zachowują semantyczne lub strukturalne relacje.

#### Popularne algorytmy:
- PCA (Principal Component Analysis – Analiza Składowych Głównych)
- t-SNE (t-Distributed Stochastic Neighbor Embedding)
- UMAP (Uniform Manifold Approximation and Projection)
- Autoenkodery (Autoencoders – w sieciach neuronowych)
- NMF (Non-negative Matrix Factorization)
- LLE (Locally Linear Embedding)

---

### 🔹 Wizualizacja (Visualization)

Wizualizacja danych w kontekście uczenia nienadzorowanego to proces **graficznego przedstawiania złożonych danych**, aby ułatwić zrozumienie ich struktury, wzorców, klastrów, anomalii i relacji między cechami, często po przeprowadzeniu redukcji wymiarowości. Choć nie jest to algorytm uczenia maszynowego per se, jest to nieodzowne narzędzie do interpretacji wyników nienadzorowanych modeli.

#### Jak to działa:
Wykorzystuje się różne techniki graficzne (wykresy punktowe, mapy cieplne, dendrogramy, wykresy 3D) do przedstawienia danych w sposób, który jest łatwy do odbioru przez człowieka. Często wizualizacja jest efektem zastosowania metod redukcji wymiarowości, które transformują dane do 2 lub 3 wymiarów, umożliwiając ich wykreślenie.

#### Przykłady praktyczne:
- **Wizualizacja klastrów** – przedstawienie punktów danych w 2D/3D, gdzie punkty należące do tego samego klastra są oznaczone tym samym kolorem lub kształtem. Pozwala to na ocenę jakości klastrowania i zrozumienie, jakie cechy charakteryzują poszczególne grupy.
- **Odkrywanie anomalii** – punkty danych, które są wizualnie odseparowane od głównych skupisk, mogą wskazywać na anomalie.
- **Eksploracja danych** – szybkie dostrzeżenie relacji między zmiennymi, wykrycie brakujących danych, obserwacja rozkładów cech czy identyfikacja korelacji.
- **Ocena jakości redukcji wymiarowości** – sprawdzenie, czy metoda redukcji wymiarowości skutecznie zachowała strukturę danych, np. czy klastry są nadal dobrze rozdzielone po projekcji na niższe wymiary.
- **Komunikacja wyników** – prezentowanie złożonych analiz szerszej publiczności w przystępny i intuicyjny sposób.

#### Popularne techniki i narzędzia:
- Wykresy punktowe (Scatter Plots)
- Macierze wykresów punktowych (Scatter Plot Matrices)
- Wykresy 3D
- Mapy cieplne (Heatmaps)
- Dendrogramy (dla klastrowania hierarchicznego)
- Wykresy radarowe
- Biblioteki Python: Matplotlib, Seaborn, Plotly, Altair
- Narzędzia: Tableau, Power BI, Qlik Sense

---

### 🔹 Wykrywanie Anomalii (Anomaly Detection)

Wykrywanie anomalii to typ uczenia nienadzorowanego, który ma na celu **identyfikację punktów danych, które znacznie odbiegają od większości danych** (tzw. odstępstw lub outlierów).  
Anomalie często wskazują na nietypowe, interesujące lub problematyczne zdarzenia.

#### Jak to działa:
Model uczy się "normalnego" wzorca danych, a następnie identyfikuje punkty, które są na tyle różne od tego wzorca, że można je uznać za anomalie. Nie potrzebuje wcześniejszych etykiet anomalii (choć może być wspierane przez nadzór). Podejścia obejmują metody statystyczne, oparte na gęstości, odległości czy modelach uczenia maszynowego.

#### Przykłady praktyczne:
- **Wykrywanie oszustw finansowych** – identyfikacja nietypowych transakcji kartą kredytową, które mogą wskazywać na oszustwo, lub podejrzanych roszczeń ubezpieczeniowych.
- **Monitorowanie sieci komputerowych** – wykrywanie nietypowego ruchu sieciowego, który może sygnalizować atak hakerski, złośliwe oprogramowanie lub naruszenie bezpieczeństwa.
- **Diagnostyka usterek maszyn i konserwacja predykcyjna** – monitorowanie danych z sensorów maszyn (np. wibracje, temperatura, zużycie energii) w celu wykrycia nietypowych wzorców wskazujących na zbliżającą się awarię lub potrzebę serwisu.
- **Kontrola jakości w produkcji przemysłowej** – automatyczna identyfikacja produktów z wadami, które odbiegają od normy, na podstawie danych z kamer lub sensorów.
- **Monitorowanie zdrowia pacjentów** – wykrywanie nietypowych odczytów z urządzeń medycznych (np. EKG, glukometr, smartwatche), które mogą wskazywać na nagły problem zdrowotny lub pogorszenie stanu.
- **Analiza danych z sensorów IoT** – wykrywanie nieprawidłowości w odczytach z czujników w inteligentnych domach, miastach czy rolnictwie, np. awarii sprzętu czy nietypowych warunków środowiskowych.

#### Popularne algorytmy:
- Isolation Forest
- One-Class SVM (Support Vector Machine dla jednej klasy)
- Local Outlier Factor (LOF)
- DBSCAN (może być używany do wykrywania punktów nieprzypisanych do klastrów)
- Autoenkodery (wersje do wykrywania anomalii, gdzie duży błąd rekonstrukcji wskazuje na anomalię)
- K-Nearest Neighbors (k-NN) na podstawie odległości do sąsiadów
- Statystyczne metody: 3-Sigma Rule, Box Plots

---

### 🔹 Uczenie Reguł Asocjacyjnych (Association Rule Learning)

Uczenie reguł asocjacyjnych to typ uczenia nienadzorowanego, który ma na celu **odkrywanie interesujących relacji i zależności między zmiennymi w dużych zbiorach danych**, często w kontekście danych transakcyjnych.

#### Jak to działa:
Model szuka często występujących razem zestawów elementów (np. produktów w koszyku zakupowym) i na ich podstawie generuje reguły typu "Jeśli kupiono X, to prawdopodobnie kupiono też Y". Mierzy się wsparcie (support), ufność (confidence) i lift, aby ocenić istotność tych reguł.

#### Przykłady praktyczne:
- **Analiza koszyka zakupowego (Market Basket Analysis)** – identyfikacja produktów, które często są kupowane razem (np. "Klienci, którzy kupują pieluchy, często kupują też piwo", "Jeśli klient kupi kawę i cukier, prawdopodobnie kupi też mleko"). Pomaga to w układaniu towarów w sklepach, ofertach promocyjnych, cross-sellingu czy rekomendacjach online.
- **Optymalizacja układu sklepu internetowego lub fizycznego** – umieszczanie często kupowanych razem produktów w pobliżu siebie w celu zwiększenia sprzedaży.
- **Systemy rekomendacji** – sugerowanie produktów na podstawie tego, co inni klienci z podobnymi preferencjami kupili (np. "Często kupowane razem z tym produktem").
- **Analiza danych medycznych** – odkrywanie powiązań między objawami, diagnozami, wynikami badań i lekami, które mogą wspierać badania medyczne i decyzje kliniczne.
- **Zarządzanie zapasami** – przewidywanie popytu na produkty komplementarne, aby zoptymalizować stany magazynowe.
- **Wykrywanie wzorców w danych sekwencyjnych** – znajdowanie często występujących sekwencji zdarzeń lub czynności (np. w logach systemowych).

#### Popularne algorytmy:
- Apriori
- FP-Growth (Frequent Pattern Growth)
- ECLAT

---

### 🔹 Proces uczenia modelu nienadzorowanego:
1. **Przygotowanie danych** – zebranie, wstępne oczyszczenie i ewentualne przekształcenie danych (bez etykiet).  
2. **Wybór algorytmu** – w zależności od celu (klastrowanie, redukcja, anomalia, reguły asocjacyjne).  
3. **Trenowanie modelu** – model samodzielnie odkrywa struktury i wzorce w danych.  
4. **Ocena, interpretacja i wizualizacja wyników** – analiza odkrytych wzorców (np. wizualizacja klastrów, analiza komponentów, identyfikacja anomalii, interpretacja reguł).  
5. **Dostosowanie parametrów** – iteracyjne poprawianie modelu i algorytmu w celu uzyskania optymalnych i sensownych wyników.

---

### 🔹 Zastosowania w realnym świecie:
- Segmentacja rynku i personalizacja ofert marketingowych.
- Wizualizacja i eksploracja złożonych zbiorów danych dla lepszego zrozumienia.
- Kompresja danych, optymalizacja przechowywania i przesyłania.
- Wykrywanie oszustw, błędów, usterek i zagrożeń bezpieczeństwa.
- Ulepszanie systemów rekomendacyjnych poprzez odkrywanie ukrytych powiązań.
- Uczenie się cech (feature learning) dla innych modeli nadzorowanych (jako pre-processing).
- Wstępne badanie danych i generowanie hipotez przed zastosowaniem bardziej zaawansowanych technik.

## Uczenie Pół-nadzorowane (Semi-supervised Learning)

Uczenie pół-nadzorowane to rodzaj uczenia maszynowego, który łączy w sobie elementy **uczenia nadzorowanego** i **nienadzorowanego**. Model uczy się na podstawie **niewielkiej ilości danych oznaczonych (z etykietami)** oraz **dużej ilości danych nieoznaczonych (bez etykiet)**.  
Jest to szczególnie przydatne w sytuacjach, gdy etykietowanie danych jest kosztowne, czasochłonne lub wymaga specjalistycznej wiedzy.

#### Dlaczego Semi-supervised Learning?
- **Ograniczone etykiety:** Wiele realnych problemów ma dostęp do dużej ilości danych, ale tylko niewielka ich część jest etykietowana.
- **Wykorzystanie nieoznaczonych danych:** Dane nieoznaczone zawierają cenne informacje o strukturze rozkładu danych, które mogą pomóc modelowi lepiej uogólniać.
- **Zmniejszenie kosztów:** Redukuje potrzebę ręcznego etykietowania ogromnych zbiorów danych.

---

### 🔹 Uczenie oparte na spójności (Consistency Regularization / Self-training)

Uczenie oparte na spójności to podejście, w którym model jest trenowany tak, aby jego przewidywania dla danych nieoznaczonych były **spójne** nawet po niewielkich perturbacjach danych wejściowych lub samego modelu. Self-training jest pokrewną techniką, gdzie model "etykietuje" dane nieoznaczone.

#### Jak to działa:
1.  **Self-training:** Model jest początkowo trenowany na małym zbiorze danych oznaczonych. Następnie używa się go do przewidywania etykiet dla danych nieoznaczonych. Te "pseudo-etykiety" są dodawane do zbioru treningowego (często z wysoką pewnością), a model jest ponownie trenowany. Proces może być iteracyjny.
2.  **Consistency Regularization:** Model jest trenowany tak, aby jego wyjścia dla nieoznaczonych danych były podobne, nawet jeśli te dane zostaną lekko zmienione (np. dodanie szumu, drobne transformacje obrazu). Dodaje się człon regularyzacyjny do funkcji straty, który karze za niespójne przewidywania.

#### Przykłady praktyczne:
- **Klasyfikacja obrazów z ograniczonymi etykietami** – np. rozpoznawanie gatunków zwierząt, gdzie mamy tylko kilka zdjęć z etykietami, ale tysiące nieoznaczonych. Model uczy się na etykietowanych, a następnie generuje pseudo-etykiety dla reszty.
- **Analiza tekstu (NLP)** – klasyfikacja sentymentu, wykrywanie spamu, gdzie dostępnych jest wiele nieoznaczonych tekstów, ale etykietowanie jest kosztowne.
- **Rozpoznawanie mowy** – poprawa dokładności modeli rozpoznawania mowy poprzez wykorzystanie dużych zbiorów nieoznaczonych nagrań audio.
- **Diagnostyka medyczna** – wspomaganie klasyfikacji chorób na podstawie obrazów medycznych (np. MRI, RTG), gdzie etykietowanie wymaga ekspertów.
- **Systemy rekomendacji** – wykorzystanie nieoznaczonych danych o interakcjach użytkowników do poprawy rekomendacji.

#### Popularne algorytmy/techniki:
- Pseudo-Labeling
- Mean Teacher
- Pi-Model
- Temporal Ensembling
- MixMatch, FixMatch (zaawansowane techniki consistency regularization)

---

### 🔹 Uczenie oparte na grafach (Graph-based Semi-supervised Learning)

Uczenie oparte na grafach wykorzystuje strukturę grafu, gdzie punkty danych są wierzchołkami, a krawędzie reprezentują podobieństwo między nimi. Informacje z etykietowanych wierzchołków są "rozprzestrzeniane" na nieoznaczone wierzchołki wzdłuż krawędzi grafu.

#### Jak to działa:
Tworzy się graf, w którym każdy punkt danych jest węzłem. Krawędzie łączą podobne punkty danych, a ich wagi odzwierciedlają stopień podobieństwa. Etykiety z nielicznych oznaczonych węzłów są propagowane przez graf do nieoznaczonych węzłów, zakładając, że podobne węzły powinny mieć podobne etykiety.

#### Przykłady praktyczne:
- **Klasyfikacja dokumentów** – tworzenie grafu, gdzie dokumenty są węzłami, a krawędzie łączą podobne dokumenty. Etykiety z kilku oznaczonych dokumentów są propagowane na resztę.
- **Analiza sieci społecznościowych** – klasyfikacja użytkowników (np. identyfikacja botów, segmentacja grup interesu) na podstawie ich połączeń i aktywności, gdzie tylko niewielka część użytkowników jest etykietowana.
- **Bioinformatyka** – klasyfikacja białek lub genów na podstawie ich interakcji i podobieństwa sekwencji.
- **Wykrywanie oszustw** – budowanie grafu transakcji lub użytkowników i propagowanie informacji o znanych oszustwach na powiązane, nieoznaczone węzły.
- **Segmentacja obrazów** – tworzenie grafu z pikseli lub superpikseli obrazu i propagowanie etykiet z kilku oznaczonych regionów na resztę.

#### Popularne algorytmy/techniki:
- Label Propagation (Propagacja etykiet)
- Label Spreading
- Graph Convolutional Networks (GCNs) – w kontekście głębokiego uczenia na grafach

---

### 🔹 Uczenie oparte na modelach generatywnych (Generative Models for Semi-supervised Learning)

Uczenie oparte na modelach generatywnych zakłada, że dane pochodzą z pewnego rozkładu, który można modelować. Modele te próbują nauczyć się tego rozkładu, co pozwala im wykorzystać zarówno dane oznaczone, jak i nieoznaczone.

#### Jak to działa:
Model generatywny (np. GMM, VAE, GAN) uczy się wspólnego rozkładu prawdopodobieństwa dla danych wejściowych i etykiet. Dane nieoznaczone pomagają modelowi lepiej zrozumieć strukturę danych wejściowych, co z kolei poprawia jego zdolność do klasyfikacji danych oznaczonych.

#### Przykłady praktyczne:
- **Klasyfikacja obrazów** – wykorzystanie VAE lub GAN do nauczenia się reprezentacji obrazów, co pomaga w klasyfikacji nawet z ograniczonymi etykietami.
- **Rozpoznawanie wzorców** – budowanie modelu, który potrafi generować nowe przykłady danych, co świadczy o zrozumieniu ich struktury.
- **Segmentacja obrazów** – modele generatywne mogą pomóc w nauczeniu się, jak wyglądają różne regiony obrazu, nawet jeśli tylko niewielka ich część jest etykietowana.

#### Popularne algorytmy/techniki:
- Gaussian Mixture Models (GMM)
- Variational Autoencoders (VAEs)
- Generative Adversarial Networks (GANs) w trybie pół-nadzorowanym (SGAN)

---

### 🔹 Uczenie oparte na redukcji wymiarowości (Dimensionality Reduction for Semi-supervised Learning)

Chociaż redukcja wymiarowości jest techniką nienadzorowaną, może być wykorzystana w kontekście pół-nadzorowanym, aby znaleźć reprezentację danych, która jest optymalna zarówno dla struktury danych (nienadzorowane), jak i dla zadania klasyfikacji (nadzorowane).

#### Jak to działa:
Niektóre algorytmy redukcji wymiarowości mogą uwzględniać dostępne etykiety, aby znaleźć projekcję, która nie tylko zmniejsza wymiarowość, ale także maksymalizuje separację klas. Inne metody nienadzorowane (np. PCA) mogą być użyte jako pre-processing, a następnie na zredukowanych danych stosuje się techniki pół-nadzorowane.

#### Przykłady praktyczne:
- **Wizualizacja danych z etykietami i bez** – użycie t-SNE lub UMAP do wizualizacji danych, gdzie punkty z etykietami są wyróżnione, co pomaga w ocenie, czy struktura danych wspiera separację klas.
- **Poprawa wydajności klasyfikatorów** – redukcja wymiarowości danych wejściowych przed zastosowaniem algorytmu pół-nadzorowanego lub nadzorowanego, co może zmniejszyć szum i poprawić generalizację.
- **Uczenie reprezentacji** – tworzenie niskowymiarowych embeddingów, które są użyteczne zarówno dla zadań nienadzorowanych (np. klastrowanie), jak i nadzorowanych (np. klasyfikacja).

#### Popularne algorytmy/techniki:
- Semi-supervised PCA (SSPCA)
- Linear Discriminant Analysis (LDA) – choć głównie nadzorowane, może być adaptowane
- Manifold Learning (np. Isomap, LLE) w połączeniu z etykietami
- Autoenkodery z dodatkową funkcją straty dla etykiet

---

### 🔹 Proces uczenia modelu pół-nadzorowanego:
1. **Przygotowanie danych** – zebranie danych, podział na mały zbiór oznaczony i duży zbiór nieoznaczony.  
2. **Wybór algorytmu** – w zależności od dostępnych danych i problemu (np. self-training, graph-based).  
3. **Trenowanie modelu** – model uczy się, wykorzystując zarówno etykiety, jak i strukturę danych nieoznaczonych.  
4. **Walidacja i testowanie** – ocena modelu na zbiorze testowym (z etykietami).  
5. **Ewaluacja wyników** – przy użyciu metryk klasyfikacji (accuracy, precision, recall, F1-score).

---

### 🔹 Zastosowania w realnym świecie:
- **Rozpoznawanie obrazów i wideo** – klasyfikacja obiektów, segmentacja, detekcja twarzy, gdzie etykietowanie każdego piksela jest niemożliwe.
- **Przetwarzanie języka naturalnego (NLP)** – klasyfikacja tekstu, analiza sentymentu, rozpoznawanie encji, gdzie dostępnych jest wiele nieoznaczonych tekstów.
- **Bioinformatyka** – klasyfikacja danych genetycznych, analiza ekspresji genów, gdzie etykietowanie próbek jest kosztowne.
- **Diagnostyka medyczna** – wspomaganie klasyfikacji chorób na podstawie obrazów medycznych lub danych pacjentów.
- **Wykrywanie oszustw i anomalii** – wykorzystanie nieoznaczonych danych do lepszego zrozumienia "normalnego" zachowania i skuteczniejszego wykrywania odstępstw.
- **Personalizacja i systemy rekomendacji** – wykorzystanie nieoznaczonych danych o zachowaniach użytkowników do poprawy rekomendacji.
- **Uczenie robotów** – roboty mogą uczyć się na podstawie niewielkiej liczby demonstracji (etykiet) i dużej liczby nieoznaczonych interakcji ze środowiskiem.


## Uczenie Samonadzorowane (Self-supervised Learning - SSL)

Uczenie samonadzorowane to rodzaj uczenia maszynowego, w którym model uczy się na podstawie **danych nieoznaczonych**, ale generuje **własne "pseudo-etykiety"** z tych danych, aby rozwiązać tzw. **zadanie pretekstowe (pretext task)**.  
Celem nie jest rozwiązanie samego zadania pretekstowego, lecz nauczenie modelu **ogólnych, użytecznych reprezentacji (embeddingów)** danych, które mogą być następnie wykorzystane do rozwiązywania innych, bardziej złożonych zadań (tzw. **zadań downstream**), często z użyciem uczenia nadzorowanego.

#### Dlaczego Self-supervised Learning?
- **Brak etykiet:** Podobnie jak w uczeniu nienadzorowanym, SSL nie wymaga ręcznie etykietowanych danych.
- **Bogatsze reprezentacje:** W przeciwieństwie do tradycyjnego uczenia nienadzorowanego (np. klastrowania), SSL często prowadzi do nauki bardziej semantycznie bogatych i ogólnych reprezentacji, które są bardzo skuteczne w transfer learningu.
- **Skalowalność:** Możliwość wykorzystania ogromnych, nieoznaczonych zbiorów danych (np. miliardów obrazów, terabajtów tekstu) do wstępnego trenowania.
- **Most między unsupervised a supervised:** Umożliwia wykorzystanie nienadzorowanych danych do "rozgrzania" modelu, który następnie jest dostrajany (fine-tuned) na małym zbiorze danych oznaczonych.

---

### 🔹 Zadania Pretekstowe (Pretext Tasks)

Zadania pretekstowe to specjalnie zaprojektowane zadania, które model rozwiązuje na danych nieoznaczonych, aby nauczyć się użytecznych reprezentacji. Model generuje własne etykiety dla tych zadań.

#### Jak to działa:
Dane wejściowe są modyfikowane w kontrolowany sposób (np. maskowanie części obrazu, tasowanie zdań), a model jest trenowany, aby przewidzieć oryginalny stan lub brakującą część. Rozwiązując te "sztuczne" problemy, model uczy się rozumieć strukturę, kontekst i semantykę danych.

#### Przykłady praktyczne:
- **Przewidywanie brakujących fragmentów obrazu (Image Inpainting/Context Prediction):** Model otrzymuje obraz z zamaskowanym fragmentem i musi przewidzieć, co się tam znajdowało. Uczy się relacji przestrzennych i semantycznych obiektów.
- **Przewidywanie względnej pozycji fragmentów obrazu (Relative Patch Prediction):** Model otrzymuje centralny fragment obrazu i kilka innych fragmentów, a jego zadaniem jest przewidzenie, gdzie te inne fragmenty znajdowały się względem centralnego. Uczy się relacji przestrzennych.
- **Kolorowanie obrazów czarno-białych (Colorization):** Model otrzymuje obraz czarno-biały i musi przewidzieć jego kolory. Uczy się rozpoznawać obiekty i ich typowe barwy.
- **Generowanie następnego słowa/maskowanie słów (Next Word Prediction/Masked Language Modeling):** W NLP, model otrzymuje sekwencję słów i musi przewidzieć następne słowo (np. GPT) lub zamaskowane słowa w zdaniu (np. BERT). Uczy się gramatyki, składni i semantyki języka.
- **Przewidywanie rotacji obrazu (Rotation Prediction):** Model otrzymuje obraz obrócony o losowy kąt i musi przewidzieć ten kąt. Uczy się rozpoznawania obiektów niezależnie od ich orientacji.
- **Kontrastowe uczenie się (Contrastive Learning):** Model uczy się, aby podobne przykłady (np. różne augmentacje tego samego obrazu) miały podobne reprezentacje, a niepodobne przykłady – różne. Jest to obecnie jedna z najskuteczniejszych metod SSL.

#### Popularne algorytmy/techniki (przykłady zadań pretekstowych):
- **Dla obrazów:** Jigsaw Puzzles, Rotation Prediction, Context Prediction, Colorization, SimCLR, MoCo, BYOL (ostatnie trzy to metody kontrastowe).
- **Dla tekstu:** Masked Language Modeling (BERT), Next Sentence Prediction (BERT), Next Token Prediction (GPT), ELECTRA.

---

### 🔹 Transfer Learning (Przenoszenie Wiedzy)

Transfer Learning to kluczowy element i główna zaleta uczenia samonadzorowanego. Polega na **przenoszeniu wiedzy (nauczenia się reprezentacji) z jednego zadania (zadania pretekstowego SSL) do innego, często bardziej złożonego zadania (zadania downstream)**.

#### Jak to działa:
1.  **Pre-training (Wstępne trenowanie):** Model (np. duża sieć neuronowa) jest trenowany na ogromnym zbiorze danych nieoznaczonych, rozwiązując zadanie pretekstowe SSL. W tym etapie model uczy się ogólnych, niskopoziomowych i wysokopoziomowych cech danych (np. krawędzie, tekstury, kształty dla obrazów; gramatyka, semantyka dla tekstu).
2.  **Fine-tuning (Dostrajanie):** Nauczenie reprezentacje (wagi i bias sieci) są następnie wykorzystywane jako punkt wyjścia dla nowego zadania (np. klasyfikacji obrazów, analizy sentymentu), które ma dostęp do małego zbioru danych oznaczonych. Zazwyczaj dodaje się nową, małą warstwę wyjściową, która jest trenowana na danych oznaczonych, a reszta modelu jest albo zamrożona, albo trenowana z bardzo małym współczynnikiem uczenia.

#### Przykłady praktyczne:
- **Rozpoznawanie obiektów na obrazach medycznych:** Wstępne trenowanie modelu na miliardach ogólnych obrazów (np. ImageNet, ale bez etykiet, używając SSL), a następnie dostrajanie go na małym zbiorze obrazów medycznych (np. RTG klatki piersiowej) z etykietami.
- **Klasyfikacja tekstu w rzadkich językach:** Wstępne trenowanie modelu językowego (np. BERT) na ogromnym korpusie tekstu w języku angielskim (lub innym bogatym w dane), a następnie dostrajanie go na małym zbiorze danych w rzadkim języku do zadania klasyfikacji.
- **Personalizacja asystentów głosowych:** Wstępne trenowanie modelu na ogólnych danych audio, a następnie dostrajanie go do rozpoznawania mowy konkretnego użytkownika.
- **Wykrywanie oszustw:** Wstępne trenowanie modelu na dużej ilości nieoznaczonych danych transakcyjnych, aby nauczyć się "normalnych" wzorców, a następnie dostrajanie go do wykrywania oszustw na małym zbiorze etykietowanych transakcji.

#### Korzyści z Transfer Learningu w SSL:
- **Lepsza wydajność:** Modele osiągają znacznie lepsze wyniki, nawet z małą ilością danych oznaczonych.
- **Szybszy trening:** Wstępnie wytrenowany model szybciej konwerguje podczas dostrajania.
- **Mniejsze zapotrzebowanie na dane:** Zmniejsza potrzebę posiadania ogromnych, etykietowanych zbiorów danych dla każdego nowego zadania.

---

### 🔹 Porównanie Self-supervised Learning (SSL) z Unsupervised Learning (UL)

Chociaż SSL jest formą uczenia nienadzorowanego, istnieje kluczowa różnica w ich celach i metodologii:

| Cecha                  | Uczenie Nienadzorowane (Unsupervised Learning - UL)                               | Uczenie Samonadzorowane (Self-supervised Learning - SSL)                               |
| :--------------------- | :-------------------------------------------------------------------------------- | :------------------------------------------------------------------------------------- |
| **Cel główny**         | Odkrywanie ukrytych struktur w danych (np. klastry, redukcja wymiarowości).       | Uczenie się ogólnych, użytecznych reprezentacji danych do **transferu wiedzy**.        |
| **Etykiety**           | Brak etykiet.                                                                     | Brak ręcznych etykiet. Model **generuje własne "pseudo-etykiety"** z danych.            |
| **Zadanie**            | Bezpośrednie rozwiązanie problemu (np. klastrowanie klientów).                    | Rozwiązanie **zadania pretekstowego**, które jest środkiem do celu (nauki reprezentacji). |
| **Wyjście**            | Klastry, zredukowane wymiary, wykryte anomalie.                                   | **Reprezentacje (embeddingi)** danych, które są wejściem dla kolejnych zadań.          |
| **Zastosowanie**       | Segmentacja, wizualizacja, detekcja anomalii, analiza koszyka.                    | **Pre-training** dla zadań nadzorowanych (klasyfikacja, detekcja obiektów, NLP).       |
| **Typowe algorytmy**   | K-Means, PCA, DBSCAN, Isolation Forest, Apriori.                                  | BERT, GPT, SimCLR, MoCo, BYOL (często oparte na głębokich sieciach neuronowych).       |
| **Złożoność modelu**   | Często prostsze modele, choć mogą być też głębokie autoenkodery.                   | Zazwyczaj **głębokie sieci neuronowe** (transformery, konwolucyjne).                   |

**Kluczowa różnica:**
UL skupia się na **bezpośrednim odkrywaniu wzorców** w danych. SSL natomiast skupia się na **uczeniu się reprezentacji**, które są tak dobre, że mogą być **przeniesione** do innych zadań, często nadzorowanych, znacząco poprawiając ich wydajność, nawet przy małej ilości etykiet. SSL jest często postrzegane jako sposób na "rozgrzanie" dużych modeli głębokiego uczenia, aby były bardziej efektywne w późniejszym dostrajaniu.

---

### 🔹 Proces uczenia modelu samonadzorowanego:
1. **Przygotowanie danych** – zebranie dużego zbioru danych nieoznaczonych.  
2. **Definicja zadania pretekstowego** – zaprojektowanie zadania, które pozwoli modelowi nauczyć się użytecznych reprezentacji.  
3. **Trenowanie modelu (Pre-training)** – model uczy się rozwiązywać zadanie pretekstowe, generując własne pseudo-etykiety.  
4. **Ekstrakcja reprezentacji** – po pre-treningu, warstwy modelu (z wyjątkiem warstwy wyjściowej zadania pretekstowego) są wykorzystywane do ekstrakcji embeddingów.  
5. **Dostrajanie (Fine-tuning)** – na małym zbiorze danych oznaczonych, model jest dostrajany do właściwego zadania (downstream task).  
6. **Ewaluacja wyników** – ocena modelu na zbiorze testowym dla zadania downstream.

---

### 🔹 Zastosowania w realnym świecie:
- **Przetwarzanie języka naturalnego (NLP):** Modele takie jak BERT, GPT-3/4, T5 są trenowane samonadzorowanie na ogromnych korpusach tekstu, a następnie dostrajane do tłumaczenia maszynowego, generowania tekstu, analizy sentymentu, odpowiadania na pytania.
- **Wizja komputerowa:** Modele trenowane samonadzorowanie (np. SimCLR, MoCo) na miliardach obrazów, a następnie dostrajane do klasyfikacji obrazów, detekcji obiektów, segmentacji, rozpoznawania twarzy, nawet z bardzo małą ilością etykiet.
- **Rozpoznawanie mowy:** Wstępne trenowanie na dużych zbiorach audio, a następnie dostrajanie do transkrypcji mowy, identyfikacji mówcy.
- **Bioinformatyka:** Uczenie reprezentacji sekwencji DNA/RNA/białek, które mogą być następnie użyte do przewidywania funkcji białek, wykrywania mutacji.
- **Robotyka:** Uczenie się reprezentacji środowiska i interakcji na podstawie nieoznaczonych danych z sensorów, co pomaga robotom w nawigacji i manipulacji.
- **Medycyna:** Wstępne trenowanie na dużych zbiorach nieoznaczonych obrazów medycznych, a następnie dostrajanie do diagnozy chorób.

## Uczenie ze Wzmocnieniem (Reinforcement Learning - RL)

Uczenie ze wzmocnieniem to zupełnie inny paradygmat uczenia maszynowego, w którym system uczący, zwany w tym kontekście **agentem**, może **obserwować środowisko**, **wybierać i wykonywać akcje**, a w zamian otrzymuje **nagrody** (lub kary w postaci negatywnych nagród).  
Agent musi samodzielnie nauczyć się, jaka jest najlepsza strategia, zwana **polityką (policy)**, aby z czasem uzyskać jak najwięcej nagród. Polityka definiuje, jaką akcję agent powinien wybrać w danej sytuacji.

#### Dlaczego Reinforcement Learning?
- **Interakcja ze środowiskiem:** RL jest idealne do problemów, gdzie system musi podejmować sekwencję decyzji w dynamicznym środowisku.
- **Brak etykiet:** Nie wymaga ręcznie etykietowanych danych wejścia-wyjścia; uczy się na podstawie prób i błędów oraz otrzymywanych nagród.
- **Optymalizacja długoterminowa:** Skupia się na maksymalizacji skumulowanej nagrody w czasie, a nie tylko na natychmiastowych korzyściach.
- **Autonomiczne systemy:** Umożliwia tworzenie systemów, które uczą się adaptować i optymalizować swoje zachowanie w złożonych scenariuszach.

---

### 🔹 Agent i Środowisko (Agent and Environment)

W uczeniu ze wzmocnieniem, interakcja odbywa się między **agentem** a **środowiskiem**.

#### Jak to działa:
- **Agent:** To system uczący się, który podejmuje decyzje. Obserwuje stan środowiska, wybiera akcję do wykonania i otrzymuje nagrodę (lub karę) oraz nowy stan środowiska.
- **Środowisko:** To świat, w którym działa agent. Reaguje na akcje agenta, zmieniając swój stan i dostarczając nagrody.

#### Przykłady praktyczne:
- **Robot kroczący:** Robot (agent) obserwuje swoje położenie i równowagę (stan środowiska), wykonuje ruchy nogami (akcje), a otrzymuje nagrody za utrzymanie równowagi i poruszanie się do przodu, a kary za upadek.
- **Gra w Go (AlphaGo):** Program AlphaGo (agent) obserwuje planszę (stan środowiska), wykonuje ruch (akcję), a otrzymuje nagrody za wygrane partie i kary za przegrane.
- **Autonomiczny samochód:** Samochód (agent) obserwuje drogę, inne pojazdy, znaki (stan środowiska), wykonuje akcje (przyspieszanie, hamowanie, skręcanie), a otrzymuje nagrody za bezpieczną jazdę i dotarcie do celu, a kary za kolizje czy naruszenia przepisów.
- **System zarządzania energią:** System (agent) obserwuje zużycie energii, ceny, prognozy pogody (stan środowiska), podejmuje decyzje o włączeniu/wyłączeniu urządzeń (akcje), a otrzymuje nagrody za oszczędności i kary za przekroczenie limitów.

---

### 🔹 Akcje, Stany i Nagrody (Actions, States, and Rewards)

To podstawowe elementy, które definiują interakcję agenta ze środowiskiem.

#### Jak to działa:
- **Akcje (Actions):** Decyzje, które agent może podjąć w danym stanie środowiska. Mogą być dyskretne (np. "idź w lewo", "kup") lub ciągłe (np. "przyspiesz o 0.5 m/s²").
- **Stany (States):** Reprezentacja aktualnej sytuacji środowiska, którą agent może obserwować. Stan zawiera wszystkie istotne informacje potrzebne agentowi do podjęcia decyzji.
- **Nagrody (Rewards):** Sygnał zwrotny od środowiska, który informuje agenta o jakości jego ostatniej akcji. Nagrody są kluczowe dla uczenia się polityki. Celem agenta jest maksymalizacja skumulowanej nagrody w czasie.

#### Przykłady praktyczne:
- **Gra w szachy:**
    - **Akcje:** Wykonanie ruchu figurą.
    - **Stany:** Układ figur na szachownicy.
    - **Nagrody:** +1 za wygraną, -1 za przegraną, 0 za remis lub ruchy pośrednie.
- **Zarządzanie magazynem:**
    - **Akcje:** Zamówienie towaru, wysyłka towaru.
    - **Stany:** Poziom zapasów, prognozy popytu.
    - **Nagrody:** + za zysk ze sprzedaży, - za koszty magazynowania, - za brak towaru.
- **Sterowanie robotem przemysłowym:**
    - **Akcje:** Ruch ramienia robota w określonym kierunku.
    - **Stany:** Pozycja ramienia, położenie obiektu.
    - **Nagrody:** + za prawidłowe chwycenie obiektu, - za upuszczenie obiektu.

---

### 🔹 Polityka (Policy)

Polityka to **strategia** agenta, która definiuje, jaką akcję powinien wybrać w danej sytuacji (stanie środowiska). Jest to "mózg" agenta, który kieruje jego zachowaniem.

#### Jak to działa:
Polityka może być deterministyczna (dla danego stanu zawsze wybiera tę samą akcję) lub stochastyczna (dla danego stanu wybiera akcję z pewnym prawdopodobieństwem). Celem uczenia ze wzmocnieniem jest znalezienie optymalnej polityki, która maksymalizuje oczekiwaną skumulowaną nagrodę.

#### Przykłady praktyczne:
- **Polityka AlphaGo:** AlphaGo nauczyło się swojej zwycięskiej polityki poprzez analizę milionów gier i rozgrywanie wielu gier przeciwko sobie. Polityka ta definiowała, jaki ruch wykonać w każdej możliwej konfiguracji planszy Go.
- **Polityka robota kroczącego:** Polityka robota może definiować, jak poruszać nogami w zależności od aktualnego stanu równowagi i prędkości, aby utrzymać się na nogach i iść do przodu.
- **Polityka systemu rekomendacji:** Polityka może decydować, jaki produkt zarekomendować użytkownikowi w zależności od jego historii przeglądania i zakupów, aby zmaksymalizować prawdopodobieństwo zakupu.

---

### 🔹 Proces uczenia modelu (Reinforcement Learning):
1. **Definicja środowiska i nagród** – określenie, jak agent będzie wchodził w interakcje ze światem i jakie nagrody będzie otrzymywał.  
2. **Inicjalizacja polityki** – początkowa, często losowa, strategia agenta.  
3. **Interakcja ze środowiskiem** – agent obserwuje stan, wybiera akcję zgodnie z polityką, wykonuje ją, otrzymuje nagrodę i nowy stan.  
4. **Aktualizacja polityki** – na podstawie otrzymanych nagród, agent modyfikuje swoją politykę, aby w przyszłości podejmować lepsze decyzje.  
5. **Iteracja** – proces interakcji i aktualizacji powtarza się wielokrotnie, aż agent nauczy się optymalnej polityki.  
6. **Zastosowanie polityki** – po nauczeniu, agent stosuje wyuczoną politykę do rozwiązywania problemu (np. AlphaGo stosujące wyuczoną politykę w grze przeciwko mistrzowi).

---

### 🔹 Zastosowania w realnym świecie:
- **Robotyka:** Uczenie robotów chodzenia, manipulacji obiektami, nawigacji w złożonych środowiskach.
- **Gry:** Tworzenie agentów AI, którzy potrafią grać w gry (szachy, Go, gry wideo) na poziomie mistrzowskim lub ponadludzkim (np. AlphaGo, AlphaStar, OpenAI Five).
- **Autonomiczne pojazdy:** Uczenie samochodów, jak bezpiecznie i efektywnie jeździć, unikać przeszkód, parkować.
- **Systemy rekomendacji:** Optymalizacja rekomendacji produktów, filmów czy muzyki w celu maksymalizacji zaangażowania użytkownika.
- **Zarządzanie zasobami:** Optymalizacja zużycia energii w centrach danych, zarządzanie ruchem w sieciach telekomunikacyjnych.
- **Finanse:** Optymalizacja strategii handlowych, zarządzanie portfelem inwestycyjnym.
- **Medycyna:** Optymalizacja planów leczenia, dawkowania leków w czasie.

## Uczenie Wsadowe (Batch Learning)

Uczenie wsadowe to paradygmat uczenia maszynowego, w którym system **nie jest zdolny do uczenia się przyrostowego**. Oznacza to, że model musi być **trenowany przy użyciu wszystkich dostępnych danych jednocześnie**.  
Proces ten zazwyczaj wymaga znacznych zasobów obliczeniowych i czasu, dlatego jest typowo przeprowadzany **offline**. Po wytrenowaniu system jest uruchamiany w środowisku produkcyjnym i działa, stosując wyuczoną wiedzę, bez dalszego uczenia się.

#### Dlaczego Batch Learning?
- **Prostota implementacji:** Jest to często najprostszy sposób na trenowanie modeli, szczególnie dla problemów, gdzie dane są stabilne.
- **Stabilność modelu:** Model jest trenowany na całym zbiorze danych, co często prowadzi do stabilniejszych i bardziej uogólniających wyników, jeśli dane nie zmieniają się szybko.
- **Kontrolowane środowisko:** Idealne dla środowisk, gdzie model jest regularnie aktualizowany w kontrolowany sposób.

---

### 🔹 Uczenie Offline (Offline Learning)

Uczenie offline to charakterystyczna cecha uczenia wsadowego. Oznacza, że model jest **trenowany raz, poza środowiskiem produkcyjnym**, a następnie jest wdrażany i działa, stosując to, czego się nauczył, bez dalszego uczenia się w czasie rzeczywistym.

#### Jak to działa:
1.  **Trenowanie:** Model jest trenowany na kompletnym zbiorze danych.
2.  **Wdrożenie:** Wytrenowany model jest uruchamiany w środowisku produkcyjnym.
3.  **Działanie:** Model dokonuje przewidywań lub klasyfikacji, ale nie aktualizuje swoich wag ani nie uczy się na podstawie nowych danych, które napływają po wdrożeniu.

#### Przykłady praktyczne:
- **Systemy rekomendacji produktów:** Model jest trenowany raz dziennie lub raz w tygodniu na wszystkich danych o zakupach, a następnie używany do rekomendowania produktów.
- **Klasyfikacja spamu:** Model jest trenowany na zbiorze znanych wiadomości spamowych i nie-spamowych, a następnie używany do filtrowania nowych wiadomości e-mail. Jeśli pojawi się nowy typ spamu, system nie nauczy się go automatycznie.
- **Diagnostyka medyczna:** Model trenowany na historycznych danych pacjentów do diagnozowania chorób. Nowe przypadki są klasyfikowane na podstawie tego modelu, ale model nie uczy się z nich w locie.
- **Ocena ryzyka kredytowego:** Model jest trenowany na historycznych danych kredytowych, a następnie używany do oceny nowych wniosków kredytowych.

---

### 🔹 Aktualizacja Modelu i Rozkład Danych (Model Update and Data Drift)

W systemach uczenia wsadowego, aby model mógł uwzględnić nowe dane (np. nowy typ spamu, zmieniające się preferencje klientów), konieczne jest **ponowne wytrenowanie nowej wersji systemu od podstaw**.

#### Jak to działa:
1.  **Zebranie nowych danych:** Zbierane są nowe dane, które pojawiły się od ostatniego treningu.
2.  **Połączenie danych:** Nowe dane są łączone ze starym, pełnym zbiorem danych.
3.  **Ponowne trenowanie:** Nowa wersja systemu jest trenowana od zera na całym, zaktualizowanym zbiorze danych.
4.  **Wymiana systemu:** Stary system w produkcji jest zatrzymywany i zastępowany nową, świeżo wytrenowaną wersją.

#### Rozkład Modelu (Data Drift):
**Data Drift** (dryf danych) odnosi się do zjawiska, w którym **statystyczne właściwości danych wejściowych zmieniają się w czasie**. Jeśli dane, na których model został wytrenowany, różnią się znacząco od danych, które napływają w produkcji, wydajność modelu może drastycznie spaść.

- **Wyzwanie dla Batch Learning:** Uczenie wsadowe jest szczególnie wrażliwe na dryf danych, ponieważ model nie uczy się przyrostowo. Jeśli dane zmieniają się szybko (np. ceny akcji, trendy w mediach społecznościowych), model trenowany raz dziennie lub raz w tygodniu może szybko stać się nieaktualny i mało skuteczny.
- **Konieczność częstych aktualizacji:** Aby przeciwdziałać dryfowi danych, systemy wsadowe muszą być regularnie aktualizowane poprzez ponowne trenowanie. Jednak ten proces jest kosztowny i czasochłonny.

#### Przykłady praktyczne:
- **Prognozowanie cen akcji:** Rynek akcji zmienia się bardzo dynamicznie. Model trenowany wsadowo raz dziennie może szybko stracić na dokładności z powodu dryfu danych.
- **Wykrywanie trendów w mediach społecznościowych:** Język i tematyka w mediach społecznościowych ewoluują błyskawicznie. Model do analizy sentymentu wymagałby bardzo częstych aktualizacji.
- **Systemy rekomendacji:** Preferencje użytkowników zmieniają się. Model rekomendujący filmy, trenowany raz na miesiąc, może nie być w stanie dostosować się do nowych hitów czy zmieniających się gustów.

---

### 🔹 Ograniczenia i Wyzwania (Limitations and Challenges)

Uczenie wsadowe, choć proste, ma szereg ograniczeń, które sprawiają, że nie jest odpowiednie dla wszystkich scenariuszy.

#### Jak to działa:
Ograniczenia wynikają głównie z konieczności trenowania na całym zbiorze danych i braku zdolności do uczenia się przyrostowego.

#### Przykłady praktyczne:
- **Czas i zasoby obliczeniowe:** Trenowanie na pełnym zbiorze danych może zająć wiele godzin i wymagać dużej mocy obliczeniowej (CPU, pamięć, przestrzeń dyskowa, I/O). Codzienne trenowanie dużego modelu może być bardzo kosztowne.
- **Szybko zmieniające się dane:** Jeśli system musi szybko adaptować się do nowych danych (np. przewidywanie cen akcji, wykrywanie nowych typów oszustw), uczenie wsadowe jest zbyt wolne. Nowy system trenowany co 24 godziny lub co tydzień może być już nieaktualny.
- **Ogromne zbiory danych:** Jeśli ilość danych jest zbyt duża, trenowanie na całym zbiorze może być wręcz niemożliwe ze względu na ograniczenia pamięciowe i obliczeniowe.
- **Ograniczone zasoby na urządzeniu:** W przypadku systemów działających na urządzeniach z ograniczonymi zasobami (np. aplikacje na smartfony, łaziki marsjańskie), przechowywanie ogromnych zbiorów danych treningowych i zużywanie zasobów na codzienne, wielogodzinne trenowanie jest niewykonalne.
- **Brak autonomii:** Systemy wsadowe nie uczą się autonomicznie w środowisku produkcyjnym; wymagają interwencji (ponownego trenowania) w celu adaptacji.

---

### 🔹 Proces uczenia modelu (Batch Learning):
1. **Zebranie pełnego zbioru danych** – wszystkie dostępne dane są gromadzone.  
2. **Trenowanie modelu** – model jest trenowany na całym zbiorze danych.  
3. **Ocena i walidacja** – model jest testowany na zbiorze walidacyjnym/testowym.  
4. **Wdrożenie do produkcji** – wytrenowany model jest uruchamiany i dokonuje przewidywań.  
5. **Monitorowanie wydajności** – śledzenie, jak model radzi sobie w produkcji.  
6. **Aktualizacja (jeśli potrzebna)** – jeśli wydajność spada lub pojawiają się nowe dane, proces wraca do kroku 1 (zbieranie danych + nowe dane) i model jest ponownie trenowany od zera.

---

### 🔹 Zastosowania w realnym świecie:
- **Systemy rekomendacji offline:** Generowanie rekomendacji na podstawie historycznych danych, aktualizowanych cyklicznie.
- **Klasyfikacja spamu:** Filtrowanie wiadomości e-mail na podstawie modelu trenowanego na zbiorze znanych spamu.
- **Analiza obrazów:** Klasyfikacja obrazów w bazach danych, gdzie nowe obrazy są dodawane okresowo.
- **Ocena ryzyka kredytowego:** Modele oceniające zdolność kredytową, aktualizowane co kwartał lub co pół roku.
- **Prognozowanie sprzedaży:** Prognozy sprzedaży produktów na podstawie danych historycznych, aktualizowane co miesiąc.
- **Wykrywanie oszustw (w niektórych scenariuszach):** Modele wykrywające oszustwa, które są regularnie trenowane na nowych danych, ale nie uczą się w czasie rzeczywistym.

## Uczenie Przyrostowe (Online Learning)

Uczenie przyrostowe to paradygmat uczenia maszynowego, w którym system jest **trenowany przyrostowo**, poprzez dostarczanie mu instancji danych **sekwencyjnie**, pojedynczo lub w małych grupach zwanych **mini-partiami (mini-batches)**.  
Każdy krok uczenia jest szybki i tani, co pozwala systemowi **uczyć się na bieżąco (on the fly)**, w miarę napływania nowych danych.

#### Dlaczego Online Learning?
- **Szybka adaptacja:** Idealne dla systemów, które otrzymują dane w ciągłym strumieniu i muszą szybko adaptować się do zmian (np. ceny akcji, trendy).
- **Ograniczone zasoby:** Dobra opcja, jeśli masz ograniczone zasoby obliczeniowe, ponieważ system nie potrzebuje przechowywać wszystkich danych treningowych po ich przetworzeniu.
- **Ogromne zbiory danych:** Umożliwia trenowanie na zbiorach danych, które nie mieszczą się w pamięci głównej jednej maszyny (out-of-core learning).
- **Autonomia:** System może uczyć się autonomicznie w środowisku produkcyjnym.

---

### 🔹 Uczenie Przyrostowe i Strumienie Danych (Incremental Learning and Data Streams)

Uczenie przyrostowe jest kluczowe dla systemów, które muszą adaptować się do danych napływających w sposób ciągły.

#### Jak to działa:
Model jest aktualizowany małymi krokami, przetwarzając pojedyncze instancje danych lub małe mini-partie. Po przetworzeniu dane te mogą zostać odrzucone, co oszczędza pamięć.

#### Przykłady praktyczne:
- **Prognozowanie cen akcji:** System uczy się na bieżąco na podstawie napływających danych o transakcjach, szybko adaptując się do zmian rynkowych.
- **Filtry spamu:** Filtr spamu może uczyć się na bieżąco o nowych typach spamu, gdy tylko pojawiają się nowe wiadomości.
- **Systemy rekomendacji w czasie rzeczywistym:** Adaptacja rekomendacji w miarę, jak użytkownik przegląda nowe produkty lub ocenia treści.
- **Monitorowanie sieci komputerowych:** Wykrywanie nowych typów ataków lub anomalii w ruchu sieciowym w miarę ich pojawiania się.
- **Robotyka:** Robot może uczyć się nowych umiejętności lub adaptować się do zmieniającego się środowiska w czasie rzeczywistym.

---

### 🔹 Uczenie Poza Pamięcią (Out-of-core Learning)

Uczenie poza pamięcią to zastosowanie algorytmów uczenia przyrostowego do trenowania systemów na **ogromnych zbiorach danych, które nie mieszczą się w pamięci głównej jednej maszyny**.

#### Jak to działa:
Algorytm ładuje część danych (mini-partię), wykonuje krok treningowy na tych danych, a następnie powtarza proces, aż przetworzy wszystkie dane. Chociaż jest to forma uczenia przyrostowego, często odbywa się offline (tj. nie na systemie działającym na żywo), dlatego nazwa "online learning" może być myląca w tym kontekście – lepiej myśleć o tym jako o uczeniu przyrostowym.

#### Przykłady praktyczne:
- **Przetwarzanie bardzo dużych zbiorów danych tekstowych:** Trenowanie modeli językowych na korpusach tekstu, które są zbyt duże, aby zmieścić się w pamięci RAM.
- **Analiza danych z sensorów IoT:** Przetwarzanie terabajtów danych z czujników, gdzie dane są ładowane i przetwarzane w małych fragmentach.
- **Big Data w chmurze:** Trenowanie modeli na ogromnych zbiorach danych przechowywanych w rozproszonych systemach plików, gdzie dane są strumieniowane do algorytmu.

---

### 🔹 Współczynnik Uczenia (Learning Rate)

Współczynnik uczenia (learning rate) to kluczowy parametr w systemach uczenia przyrostowego, który określa, **jak szybko system powinien adaptować się do zmieniających się danych**.

#### Jak to działa:
- **Wysoki współczynnik uczenia:**
    - **Zalety:** System szybko adaptuje się do nowych danych.
    - **Wady:** Ma tendencję do szybkiego zapominania starych danych. Może być również bardziej wrażliwy na szum w nowych danych lub na sekwencje niereprezentatywnych punktów danych (outlierów).
    - **Kiedy używać:** Gdy dane zmieniają się bardzo szybko i chcemy, aby model reagował natychmiast, nawet kosztem zapominania przeszłości (np. bardzo dynamiczne rynki finansowe).
- **Niski współczynnik uczenia:**
    - **Zalety:** System ma większą inercję, uczy się wolniej, ale jest mniej wrażliwy na szum w nowych danych lub na pojedyncze odstępstwa. Lepiej zachowuje wiedzę o starych danych.
    - **Wady:** Wolniejsza adaptacja do istotnych zmian w danych.
    - **Kiedy używać:** Gdy dane są stosunkowo stabilne, ale chcemy, aby model stopniowo adaptował się do subtelnych zmian, jednocześnie zachowując wiedzę o ogólnych wzorcach (np. filtr spamu, który nie powinien zapominać o starych typach spamu).

#### Przykłady praktyczne:
- **Filtr spamu:** Chcemy, aby filtr spamu uczył się o nowych typach spamu, ale nie zapominał o starych. Zbyt wysoki współczynnik uczenia mógłby sprawić, że filtr oznaczałby tylko najnowsze rodzaje spamu, ignorując te, które pojawiły się wcześniej.
- **System rekomendacji:** Jeśli współczynnik uczenia jest zbyt wysoki, system może zbyt szybko zmieniać rekomendacje na podstawie kilku ostatnich interakcji, ignorując długoterminowe preferencje użytkownika.
- **Sterowanie robotem:** Zbyt wysoki współczynnik uczenia może sprawić, że robot będzie reagował zbyt gwałtownie na drobne zakłócenia, co może prowadzić do niestabilności.

---

### 🔹 Wyzwania i Monitorowanie (Challenges and Monitoring)

Uczenie przyrostowe niesie ze sobą pewne wyzwania, zwłaszcza w kontekście jakości danych.

#### Jak to działa:
Jeśli do systemu zostaną dostarczone złe dane (np. z wadliwego sensora, celowe spamowanie), wydajność systemu może stopniowo spadać. W systemach działających na żywo klienci szybko to zauważą.

#### Przykłady praktyczne:
- **Wadliwy sensor robota:** Jeśli sensor robota zacznie działać nieprawidłowo, dostarczając błędne dane, robot może nauczyć się złych zachowań, co doprowadzi do awarii.
- **Spamowanie wyszukiwarki:** Osoby próbujące manipulować wynikami wyszukiwania mogą dostarczać "złe" dane, które mogą sprawić, że algorytm wyszukiwarki zacznie promować nieistotne treści.
- **Złośliwe ataki na systemy AI:** Atakujący mogą celowo dostarczać zniekształcone dane, aby "otruć" model i obniżyć jego wydajność lub zmusić go do błędnych decyzji.

#### Rozwiązania:
- **Ścisłe monitorowanie:** Konieczne jest ciągłe monitorowanie wydajności systemu.
- **Wyłączanie uczenia:** W przypadku wykrycia spadku wydajności, należy szybko wyłączyć uczenie (i ewentualnie przywrócić system do poprzedniego, działającego stanu).
- **Monitorowanie danych wejściowych:** Stosowanie algorytmów wykrywania anomalii (np. z uczenia nienadzorowanego) do monitorowania danych wejściowych i reagowania na nietypowe dane.

---

### 🔹 Proces uczenia modelu (Online Learning):
1. **Inicjalizacja modelu** – model jest inicjowany (często na małym zbiorze danych lub losowo).  
2. **Ciągłe dostarczanie danych** – system otrzymuje instancje danych sekwencyjnie (pojedynczo lub w mini-partiach).  
3. **Krok uczenia** – dla każdej instancji/mini-partii, model aktualizuje swoje wagi.  
4. **Odrzucanie danych** – po przetworzeniu, dane mogą zostać odrzucone (opcjonalnie, jeśli nie ma potrzeby ich ponownego użycia).  
5. **Ciągłe monitorowanie** – wydajność systemu jest stale monitorowana, a dane wejściowe sprawdzane pod kątem anomalii.  
6. **Adaptacja** – model nieustannie adaptuje się do nowych danych i zmieniających się warunków.

---

### 🔹 Zastosowania w realnym świecie:
- **Systemy rekomendacji w czasie rzeczywistym:** Adaptacja rekomendacji na platformach e-commerce, streamingowych.
- **Filtry spamu i wykrywanie oszustw:** Szybka adaptacja do nowych wzorców spamu lub oszustw.
- **Prognozowanie finansowe:** Modele przewidujące ruchy na giełdzie, kursy walut.
- **Personalizacja interfejsów użytkownika:** Dostosowywanie wyglądu i funkcji aplikacji do indywidualnych preferencji użytkownika w czasie rzeczywistym.
- **Robotyka i sterowanie autonomiczne:** Roboty uczące się nawigacji, manipulacji obiektami, adaptujące się do nieprzewidywalnych środowisk.
- **Systemy monitorowania zdrowia:** Analiza danych z urządzeń noszonych (wearables) i adaptacja do zmieniającego się stanu zdrowia użytkownika.
- **Optymalizacja reklam:** Dynamiczne dostosowywanie wyświetlanych reklam na podstawie bieżących interakcji użytkownika.

## Uczenie z Przykładu (Instance-based Learning)

Uczenie z przykładu to paradygmat uczenia maszynowego, w którym system **nie buduje jawnego modelu** na podstawie danych treningowych. Zamiast tego, **zapamiętuje wszystkie (lub większość) przykłady treningowe** i uogólnia na nowe przypadki, porównując je z zapamiętanymi przykładami za pomocą **miary podobieństwa**.  
Można to bardzo prosto opisać jako **"kucie na blachę"** przez maszynę danych treningowych, a następnie podejmowanie decyzji na podstawie tego, co "zapamiętała" i jak bardzo nowy przypadek jest podobny do tych zapamiętanych.

#### Dlaczego Instance-based Learning?
- **Prostota koncepcyjna:** Jest to jedna z najbardziej intuicyjnych form uczenia się.
- **Brak jawnego modelu:** Nie ma potrzeby budowania złożonego modelu matematycznego, co może być zaletą w niektórych scenariuszach.
- **Elastyczność:** Może adaptować się do złożonych granic decyzyjnych, ponieważ nie narzuca sztywnej struktury modelu.
- **Łatwość aktualizacji:** Dodawanie nowych danych treningowych jest proste – wystarczy je zapamiętać.

---

### 🔹 Zapamiętywanie Danych (Learning by Heart)

Najbardziej trywialną formą uczenia się z przykładu jest po prostu **zapamiętywanie danych treningowych**.

#### Jak to działa:
System przechowuje wszystkie przykłady treningowe. Kiedy pojawia się nowa instancja, system porównuje ją z zapamiętanymi przykładami.

#### Przykłady praktyczne:
- **Filtr spamu (bardzo podstawowy):** System zapamiętuje wszystkie wiadomości e-mail, które zostały oznaczone przez użytkowników jako spam. Nowa wiadomość jest oznaczana jako spam tylko wtedy, gdy jest **identyczna** z którąś z zapamiętanych wiadomości spamowych. To nie jest najlepsze rozwiązanie, ale pokazuje podstawową ideę.
- **Bazy danych przypadków:** W systemach eksperckich, gdzie system przechowuje historyczne przypadki i ich rozwiązania, a następnie szuka identycznego przypadku dla nowej sytuacji.

---

### 🔹 Uogólnianie przez Podobieństwo (Generalization by Similarity)

Prawdziwa moc uczenia z przykładu objawia się, gdy system uogólnia na nowe przypadki, wykorzystując **miarę podobieństwa** do porównywania ich z zapamiętanymi przykładami.

#### Jak to działa:
Zamiast szukać identycznych przykładów, system szuka przykładów **bardzo podobnych**. Nowa instancja jest klasyfikowana lub przewidywana na podstawie etykiet (lub wartości) najbardziej podobnych zapamiętanych przykładów.

#### Przykłady praktyczne:
- **Filtr spamu (ulepszony):** System nie tylko oznacza e-maile identyczne ze znanym spamem, ale także te, które są **bardzo podobne**. Miara podobieństwa może polegać na zliczaniu wspólnych słów. Jeśli nowa wiadomość ma wiele wspólnych słów ze znanym spamem, zostanie oznaczona jako spam.
- **Systemy rekomendacji (najbliżsi sąsiedzi):** Jeśli użytkownik ogląda film, system szuka innych użytkowników, którzy oglądali podobne filmy, a następnie rekomenduje filmy, które oglądali ci "sąsiedzi".
- **Rozpoznawanie pisma ręcznego:** Nowy znak jest porównywany z zapamiętanymi przykładami każdego znaku. Jeśli jest najbardziej podobny do zapamiętanych "A", zostanie sklasyfikowany jako "A".
- **Diagnostyka medyczna:** Nowy pacjent jest porównywany z historycznymi pacjentami o podobnych objawach i wynikach badań, a diagnoza jest sugerowana na podstawie diagnoz tych podobnych pacjentów.
- **Klasyfikacja obrazów (np. k-NN):** Nowy obraz jest klasyfikowany jako należący do klasy, do której należy większość jego "najbliższych sąsiadów" w przestrzeni cech.

---

### 🔹 Miara Podobieństwa (Similarity Measure)

Miara podobieństwa jest kluczowym elementem uczenia z przykładu. Definiuje, jak "blisko" są ze sobą dwie instancje danych.

#### Jak to działa:
Miara podobieństwa (lub jej odwrotność – miara odległości) jest funkcją, która przypisuje wartość liczbową parze instancji danych, wskazującą na ich podobieństwo. Im wyższa wartość (dla podobieństwa) lub niższa (dla odległości), tym bardziej podobne są instancje.

#### Przykłady praktyczne:
- **Liczba wspólnych słów:** Dla tekstu, prosta miara podobieństwa to liczba wspólnych słów między dwoma dokumentami.
- **Odległość euklidesowa:** Dla danych liczbowych, odległość euklidesowa w przestrzeni cech jest często używana jako miara niepodobieństwa (im mniejsza odległość, tym większe podobieństwo).
- **Podobieństwo kosinusowe:** Często używane dla wektorów cech (np. w NLP), mierzy kąt między wektorami.
- **Odległość Hamminga:** Dla danych binarnych, zlicza liczbę pozycji, na których dwa ciągi bitów się różnią.
- **Dopasowanie cech:** Dla obrazów, miara podobieństwa może opierać się na dopasowaniu kluczowych punktów lub deskryptorów cech.

---

### 🔹 Proces uczenia modelu (Instance-based Learning):
1. **Zbieranie danych treningowych** – wszystkie dostępne dane są gromadzone.  
2. **Zapamiętywanie danych** – system po prostu przechowuje wszystkie instancje danych treningowych.  
3. **Pojawienie się nowej instancji** – system otrzymuje nową instancję, dla której musi dokonać przewidywania.  
4. **Obliczanie podobieństwa** – system oblicza podobieństwo (lub odległość) między nową instancją a każdą (lub wybranymi) zapamiętaną instancją treningową.  
5. **Uogólnianie** – na podstawie miary podobieństwa, system identyfikuje najbardziej podobne instancje treningowe i wykorzystuje ich etykiety/wartości do przewidywania dla nowej instancji (np. głosowanie większościowe w k-NN).  
6. **Brak jawnego etapu "treningu"** – w tradycyjnym sensie nie ma etapu, w którym model uczy się parametrów; wiedza jest po prostu przechowywana.

---

### 🔹 Zastosowania w realnym świecie:
- **Systemy rekomendacji (k-Nearest Neighbors - k-NN):** Rekomendowanie produktów lub treści na podstawie tego, co lubią "najbliżsi sąsiedzi" użytkownika.
- **Klasyfikacja obrazów:** Klasyfikacja obrazów poprzez porównanie ich z bazą danych oznaczonych obrazów.
- **Diagnostyka medyczna:** Wspomaganie diagnozy poprzez wyszukiwanie podobnych przypadków pacjentów.
- **Wykrywanie oszustw:** Identyfikacja transakcji podobnych do znanych oszukańczych transakcji.
- **Wyszukiwanie podobieństw:** Wyszukiwanie podobnych dokumentów, obrazów, produktów w dużych bazach danych.
- **Systemy eksperckie oparte na przypadkach (Case-Based Reasoning - CBR):** Rozwiązywanie nowych problemów poprzez adaptację rozwiązań z podobnych, historycznych problemów.

## Uczenie z Modelu (Model-based Learning)

Uczenie z modelu to paradygmat uczenia maszynowego, w którym system **buduje model matematyczny** na podstawie danych treningowych, a następnie wykorzystuje ten model do **przewidywania** dla nowych przypadków.  
W przeciwieństwie do uczenia z przykładu, gdzie system zapamiętuje konkretne przypadki, tutaj system **uogólnia** poprzez stworzenie abstrakcyjnego modelu, który opisuje zależności w danych.

#### Dlaczego Model-based Learning?
- **Efektywność:** Model może dokonywać przewidywań bez konieczności przechowywania wszystkich danych treningowych.
- **Uogólnianie:** Model może przewidywać dla przypadków, które nie są identyczne z żadnym przypadkiem treningowym.
- **Interpretowalność:** Modele matematyczne często pozwalają na zrozumienie zależności między zmiennymi.
- **Skalowalność:** Może działać na dużych zbiorach danych bez problemów z pamięcią.

---

### 🔹 Budowanie Modelu (Model Building)

Proces budowania modelu polega na znalezieniu **matematycznej funkcji**, która najlepiej opisuje zależność między cechami wejściowymi a wartością docelową.

#### Jak to działa:
1. **Wybór typu modelu** – decyzja o strukturze matematycznej (np. funkcja liniowa, wielomianowa).
2. **Trenowanie modelu** – znalezienie parametrów modelu, które najlepiej dopasowują się do danych treningowych.
3. **Walidacja** – sprawdzenie, jak dobrze model radzi sobie z nowymi danymi.

#### Przykłady praktyczne:
- **Regresja liniowa:** Model opisuje zależność między ceną domu a jego powierzchnią za pomocą prostej linii: `cena = θ₀ + θ₁ × powierzchnia`
- **Regresja wielomianowa:** Model opisuje bardziej złożone zależności za pomocą krzywej wielomianowej.
- **Drzewa decyzyjne:** Model opisuje zależności za pomocą hierarchii reguł if-then.
- **Sieci neuronowe:** Model opisuje złożone, nieliniowe zależności za pomocą połączonych węzłów.

---

### 🔹 Wybór Modelu (Model Selection)

Wybór modelu to proces **decydowania o strukturze matematycznej**, która będzie najlepiej opisywać dane.

#### Jak to działa:
Na podstawie analizy danych (np. wykresów rozrzutu, korelacji) wybieramy typ funkcji, która prawdopodobnie najlepiej opisze zależność w danych.

#### Przykłady praktyczne:
- **Dane liniowe:** Jeśli wykres rozrzutu pokazuje liniową zależność, wybieramy model liniowy.
- **Dane wykładnicze:** Jeśli zależność jest wykładnicza, wybieramy model wykładniczy.
- **Dane cykliczne:** Jeśli dane mają charakter cykliczny (np. sezonowość), wybieramy model sinusoidalny.
- **Złożone dane:** Jeśli zależność jest bardzo złożona, wybieramy model nieliniowy (np. sieć neuronową).

---

### 🔹 Parametry Modelu (Model Parameters)

Parametry modelu to **wartości liczbowe**, które definiują konkretną instancję wybranego typu modelu.

#### Jak to działa:
Każdy typ modelu ma swoje charakterystyczne parametry. Algorytm treningowy znajduje wartości tych parametrów, które najlepiej dopasowują model do danych treningowych.

#### Przykłady praktyczne:
- **Model liniowy:** `y = θ₀ + θ₁x` ma parametry θ₀ (przecięcie z osią Y) i θ₁ (nachylenie linii).
- **Model kwadratowy:** `y = θ₀ + θ₁x + θ₂x²` ma parametry θ₀, θ₁, θ₂.
- **Sieć neuronowa:** Ma tysiące parametrów (wagi i bias) w różnych warstwach.

---

### 🔹 Funkcja Kosztu (Cost Function)

Funkcja kosztu to **miara jakości** modelu, która określa, jak bardzo przewidywania modelu odbiegają od rzeczywistych wartości w danych treningowych.

#### Jak to działa:
Funkcja kosztu oblicza różnicę między przewidywaniami modelu a rzeczywistymi wartościami. Celem treningu jest **minimalizacja** tej funkcji kosztu.

#### Przykłady praktyczne:
- **Mean Squared Error (MSE):** Średnia kwadratów różnic między przewidywaniami a rzeczywistymi wartościami.
- **Mean Absolute Error (MAE):** Średnia wartości bezwzględnych różnic.
- **Cross-entropy:** Używana w klasyfikacji, mierzy różnicę między rozkładami prawdopodobieństwa.

---

### 🔹 Trenowanie Modelu (Model Training)

Trenowanie modelu to proces **znajdowania optymalnych parametrów** poprzez minimalizację funkcji kosztu.

#### Jak to działa:
Algorytm treningowy (np. Gradient Descent) iteracyjnie dostosowuje parametry modelu, aby zmniejszyć różnicę między przewidywaniami a rzeczywistymi wartościami.

#### Przykłady praktyczne:
- **Regresja liniowa:** Algorytm znajduje θ₀ i θ₁, które minimalizują MSE.
- **Sieci neuronowe:** Algorytm backpropagation dostosowuje wagi w sieci.
- **Drzewa decyzyjne:** Algorytm znajduje optymalne podziały węzłów.

---

### 🔹 Przewidywanie (Prediction/Inference)

Po wytrenowaniu modelu można go używać do **przewidywania wartości** dla nowych przypadków.

#### Jak to działa:
Nowe dane wejściowe są podawane do wytrenowanego modelu, który oblicza przewidywaną wartość na podstawie wyuczonych parametrów.

#### Przykłady praktyczne:
- **Prognozowanie cen:** Podanie powierzchni nowego domu do modelu, który zwraca przewidywaną cenę.
- **Klasyfikacja obrazów:** Podanie nowego obrazu do modelu, który zwraca prawdopodobieństwo przynależności do każdej klasy.
- **Rekomendacje:** Podanie preferencji użytkownika do modelu, który zwraca ocenę dla różnych produktów.

---

### 🔹 Przykład: Czy pieniądze czynią ludzi szczęśliwymi?

Rozważmy przykład z książki, gdzie chcemy zbadać zależność między PKB per capita a poziomem zadowolenia z życia.

#### Dane:
| Kraj | PKB per capita (USD) | Zadowolenie z życia |
|------|---------------------|-------------------|
| Węgry | 12,240 | 4.9 |
| Korea | 27,195 | 5.8 |
| Francja | 37,675 | 6.5 |
| Australia | 50,962 | 7.3 |
| USA | 55,805 | 7.2 |

#### Analiza:
Po wykreśleniu danych widzimy **liniową tendencję** - zadowolenie z życia rośnie wraz ze wzrostem PKB per capita.

#### Model:
Wybieramy **model liniowy**: `zadowolenie_z_życia = θ₀ + θ₁ × PKB_per_capita`

#### Trenowanie:
Algorytm regresji liniowej znajduje optymalne parametry:
- θ₀ = 4.85
- θ₁ = 4.91 × 10⁻⁵

#### Przewidywanie:
Dla Cypru z PKB per capita = $22,587:
`zadowolenie_z_życia = 4.85 + 22,587 × 4.91 × 10⁻⁵ = 5.96`

---

### 🔹 Porównanie z Uczeniem z Przykładu:

| Cecha | Uczenie z Przykładu | Uczenie z Modelu |
|-------|-------------------|------------------|
| **Przechowywanie danych** | Wszystkie przykłady treningowe | Tylko parametry modelu |
| **Przewidywanie** | Porównanie z zapamiętanymi przykładami | Obliczenie na podstawie modelu |
| **Pamięć** | Wymaga dużo pamięci | Wymaga mało pamięci |
| **Szybkość przewidywania** | Wolne (porównanie z wszystkimi przykładami) | Szybkie (obliczenie matematyczne) |
| **Uogólnianie** | Ograniczone do podobnych przypadków | Może przewidywać dla nowych przypadków |

---

### 🔹 Proces uczenia modelu (Model-based Learning):
1. **Analiza danych** – zbadanie struktury i zależności w danych treningowych.  
2. **Wybór modelu** – decyzja o typie funkcji matematycznej (liniowa, wielomianowa, itp.).  
3. **Definicja funkcji kosztu** – określenie miary jakości modelu.  
4. **Trenowanie modelu** – znalezienie optymalnych parametrów poprzez minimalizację funkcji kosztu.  
5. **Walidacja modelu** – sprawdzenie jakości modelu na danych testowych.  
6. **Przewidywanie** – użycie wytrenowanego modelu do przewidywania dla nowych przypadków.

---

### 🔹 Zastosowania w realnym świecie:
- **Prognozowanie cen nieruchomości** na podstawie powierzchni, lokalizacji i innych cech.
- **Klasyfikacja obrazów** – rozpoznawanie obiektów na zdjęciach.
- **Systemy rekomendacji** – przewidywanie ocen użytkowników dla produktów.
- **Prognozowanie sprzedaży** – przewidywanie popytu na produkty.
- **Diagnostyka medyczna** – przewidywanie prawdopodobieństwa chorób na podstawie objawów.
- **Analiza sentymentu** – klasyfikacja emocji w tekście.
- **Optymalizacja procesów** – znajdowanie optymalnych parametrów procesów przemysłowych.


In [None]:
# Przykład implementacji uczenia z modelu - Regresja liniowa
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.neighbors import KNeighborsRegressor

# Tworzenie przykładowych danych (PKB per capita vs zadowolenie z życia)
data = {
    'Country': ['Hungary', 'Korea', 'France', 'Australia', 'USA'],
    'GDP_per_capita': [12240, 27195, 37675, 50962, 55805],
    'Life_satisfaction': [4.9, 5.8, 6.5, 7.3, 7.2]
}

df = pd.DataFrame(data)
print("Dane treningowe:")
print(df)

# Przygotowanie danych
X = df[['GDP_per_capita']].values  # Features (cechy)
y = df['Life_satisfaction'].values  # Target (cel)

print(f"\nX (PKB per capita): {X.flatten()}")
print(f"y (zadowolenie z życia): {y}")

# Wizualizacja danych
plt.figure(figsize=(10, 6))
plt.scatter(X, y, s=100, alpha=0.7, color='blue')
plt.xlabel('PKB per capita (USD)')
plt.ylabel('Zadowolenie z życia')
plt.title('Zależność między PKB per capita a zadowoleniem z życia')
plt.grid(True, alpha=0.3)

# Dodanie nazw krajów do punktów
for i, country in enumerate(df['Country']):
    plt.annotate(country, (X[i][0], y[i]), xytext=(5, 5), textcoords='offset points')

plt.show()


In [None]:
# Trenowanie modelu regresji liniowej
print("=== TRENOWANIE MODELU REGRESJI LINIOWEJ ===")

# Wybór modelu
model = LinearRegression()

# Trenowanie modelu
model.fit(X, y)

# Wyświetlenie parametrów modelu
print(f"Parametry modelu:")
print(f"θ₀ (intercept): {model.intercept_:.2f}")
print(f"θ₁ (slope): {model.coef_[0]:.6f}")

# Równanie modelu
print(f"\nRównanie modelu:")
print(f"zadowolenie_z_życia = {model.intercept_:.2f} + {model.coef_[0]:.6f} × PKB_per_capita")

# Przewidywanie dla Cypru (PKB per capita = $22,587)
cyprus_gdp = [[22587]]
prediction = model.predict(cyprus_gdp)
print(f"\nPrzewidywanie dla Cypru (PKB per capita = $22,587):")
print(f"Przewidywane zadowolenie z życia: {prediction[0]:.2f}")

# Wizualizacja modelu
plt.figure(figsize=(12, 6))

# Wykres rozrzutu danych
plt.subplot(1, 2, 1)
plt.scatter(X, y, s=100, alpha=0.7, color='blue', label='Dane treningowe')
plt.xlabel('PKB per capita (USD)')
plt.ylabel('Zadowolenie z życia')
plt.title('Dane treningowe')
plt.grid(True, alpha=0.3)

# Dodanie nazw krajów
for i, country in enumerate(df['Country']):
    plt.annotate(country, (X[i][0], y[i]), xytext=(5, 5), textcoords='offset points')

# Wykres z modelem
plt.subplot(1, 2, 2)
plt.scatter(X, y, s=100, alpha=0.7, color='blue', label='Dane treningowe')

# Linia regresji
X_line = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)
y_line = model.predict(X_line)
plt.plot(X_line, y_line, 'r-', linewidth=2, label='Model liniowy')

# Przewidywanie dla Cypru
plt.scatter(cyprus_gdp, prediction, s=150, color='red', marker='*', 
           label=f'Cypr: {prediction[0]:.2f}')

plt.xlabel('PKB per capita (USD)')
plt.ylabel('Zadowolenie z życia')
plt.title('Model regresji liniowej')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Ocena jakości modelu
from sklearn.metrics import mean_squared_error, r2_score

# Przewidywania na danych treningowych
y_pred = model.predict(X)

# Metryki
mse = mean_squared_error(y, y_pred)
r2 = r2_score(y, y_pred)

print(f"\n=== OCENA JAKOŚCI MODELU ===")
print(f"Mean Squared Error (MSE): {mse:.4f}")
print(f"R² Score: {r2:.4f}")
print(f"RMSE: {np.sqrt(mse):.4f}")

# Porównanie rzeczywistych i przewidywanych wartości
print(f"\nPorównanie rzeczywistych i przewidywanych wartości:")
comparison_df = df.copy()
comparison_df['Predicted'] = y_pred
comparison_df['Error'] = comparison_df['Life_satisfaction'] - comparison_df['Predicted']
print(comparison_df[['Country', 'Life_satisfaction', 'Predicted', 'Error']])


In [None]:
# Porównanie z uczeniem z przykładu (k-NN)
print("=== PORÓWNANIE Z UCZENIEM Z PRZYKŁADU (k-NN) ===")

# Model k-NN (uczenie z przykładu)
knn_model = KNeighborsRegressor(n_neighbors=3)
knn_model.fit(X, y)

# Przewidywanie dla Cypru
knn_prediction = knn_model.predict(cyprus_gdp)
print(f"Przewidywanie k-NN dla Cypru: {knn_prediction[0]:.2f}")

# Porównanie wyników
print(f"\n=== PORÓWNANIE WYNIKÓW ===")
print(f"Regresja liniowa (model-based): {prediction[0]:.2f}")
print(f"k-NN (instance-based): {knn_prediction[0]:.2f}")
print(f"Różnica: {abs(prediction[0] - knn_prediction[0]):.2f}")

# Wizualizacja porównania
plt.figure(figsize=(15, 5))

# Wykres 1: Dane i model liniowy
plt.subplot(1, 3, 1)
plt.scatter(X, y, s=100, alpha=0.7, color='blue', label='Dane treningowe')
X_line = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)
y_line = model.predict(X_line)
plt.plot(X_line, y_line, 'r-', linewidth=2, label='Model liniowy')
plt.scatter(cyprus_gdp, prediction, s=150, color='red', marker='*', 
           label=f'Cypr: {prediction[0]:.2f}')
plt.xlabel('PKB per capita (USD)')
plt.ylabel('Zadowolenie z życia')
plt.title('Model-based Learning\n(Regresja liniowa)')
plt.legend()
plt.grid(True, alpha=0.3)

# Wykres 2: Dane i k-NN
plt.subplot(1, 3, 2)
plt.scatter(X, y, s=100, alpha=0.7, color='blue', label='Dane treningowe')

# Znalezienie 3 najbliższych sąsiadów dla Cypru
distances, indices = knn_model.kneighbors(cyprus_gdp)
nearest_neighbors = X[indices[0]]
nearest_values = y[indices[0]]

# Podświetlenie najbliższych sąsiadów
plt.scatter(nearest_neighbors, nearest_values, s=150, color='green', 
           marker='s', label='Najbliżsi sąsiedzi', alpha=0.8)

plt.scatter(cyprus_gdp, knn_prediction, s=150, color='red', marker='*', 
           label=f'Cypr: {knn_prediction[0]:.2f}')

plt.xlabel('PKB per capita (USD)')
plt.ylabel('Zadowolenie z życia')
plt.title('Instance-based Learning\n(k-NN, k=3)')
plt.legend()
plt.grid(True, alpha=0.3)

# Wykres 3: Porównanie obu metod
plt.subplot(1, 3, 3)
plt.scatter(X, y, s=100, alpha=0.7, color='blue', label='Dane treningowe')
plt.plot(X_line, y_line, 'r-', linewidth=2, label='Model liniowy')
plt.scatter(nearest_neighbors, nearest_values, s=150, color='green', 
           marker='s', label='Najbliżsi sąsiedzi', alpha=0.8)
plt.scatter(cyprus_gdp, prediction, s=150, color='red', marker='*', 
           label=f'Cypr (lin.): {prediction[0]:.2f}')
plt.scatter(cyprus_gdp, knn_prediction, s=150, color='orange', marker='^', 
           label=f'Cypr (k-NN): {knn_prediction[0]:.2f}')

plt.xlabel('PKB per capita (USD)')
plt.ylabel('Zadowolenie z życia')
plt.title('Porównanie metod')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Analiza najbliższych sąsiadów
print(f"\n=== ANALIZA NAJBLIŻSZYCH SĄSIADÓW (k-NN) ===")
print("Najbliżsi sąsiedzi Cypru:")
for i, (gdp, satisfaction, country) in enumerate(zip(nearest_neighbors.flatten(), 
                                                    nearest_values, 
                                                    df.iloc[indices[0]]['Country'])):
    print(f"{i+1}. {country}: PKB = ${gdp:,.0f}, Zadowolenie = {satisfaction}")

print(f"\nŚrednia zadowolenia z życia najbliższych sąsiadów: {nearest_values.mean():.2f}")
print(f"Przewidywanie k-NN: {knn_prediction[0]:.2f}")

# Porównanie charakterystyk metod
print(f"\n=== CHARAKTERYSTYKI METOD ===")
print("Model-based Learning (Regresja liniowa):")
print("- Buduje matematyczny model zależności")
print("- Szybkie przewidywania (obliczenie matematyczne)")
print("- Może przewidywać dla wartości poza zakresem danych treningowych")
print("- Interpretowalny (można zrozumieć zależność)")

print("\nInstance-based Learning (k-NN):")
print("- Porównuje z zapamiętanymi przykładami")
print("- Wolniejsze przewidywania (obliczanie odległości)")
print("- Ograniczony do zakresu danych treningowych")
print("- Mniej interpretowalny")


In [None]:
# Dodatkowe przykłady różnych typów modeli
print("=== RÓŻNE TYPY MODELI W MODEL-BASED LEARNING ===")

from sklearn.preprocessing import PolynomialFeatures
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor

# Generowanie większego zbioru danych dla lepszej demonstracji
np.random.seed(42)
X_extended = np.linspace(10000, 60000, 50).reshape(-1, 1)
y_extended = 4.5 + 0.00005 * X_extended.flatten() + np.random.normal(0, 0.2, 50)

# Przygotowanie danych
X_train = X_extended[:40]
y_train = y_extended[:40]
X_test = X_extended[40:]
y_test = y_extended[40:]

print(f"Dane treningowe: {len(X_train)} próbek")
print(f"Dane testowe: {len(X_test)} próbek")

# 1. Regresja liniowa
linear_model = LinearRegression()
linear_model.fit(X_train, y_train)
linear_pred = linear_model.predict(X_test)

# 2. Regresja wielomianowa (stopień 2)
poly_features = PolynomialFeatures(degree=2)
X_train_poly = poly_features.fit_transform(X_train)
X_test_poly = poly_features.transform(X_test)

poly_model = LinearRegression()
poly_model.fit(X_train_poly, y_train)
poly_pred = poly_model.predict(X_test_poly)

# 3. Drzewo decyzyjne
tree_model = DecisionTreeRegressor(max_depth=3, random_state=42)
tree_model.fit(X_train, y_train)
tree_pred = tree_model.predict(X_test)

# 4. Random Forest
rf_model = RandomForestRegressor(n_estimators=10, random_state=42)
rf_model.fit(X_train, y_train)
rf_pred = rf_model.predict(X_test)

# Wizualizacja wszystkich modeli
plt.figure(figsize=(15, 10))

# Wykres 1: Dane i modele
plt.subplot(2, 2, 1)
plt.scatter(X_train, y_train, alpha=0.6, color='blue', label='Dane treningowe')
plt.scatter(X_test, y_test, alpha=0.6, color='red', label='Dane testowe')

# Linie dla różnych modeli
X_line = np.linspace(X_train.min(), X_train.max(), 100).reshape(-1, 1)
plt.plot(X_line, linear_model.predict(X_line), 'g-', linewidth=2, label='Regresja liniowa')

X_line_poly = poly_features.transform(X_line)
plt.plot(X_line, poly_model.predict(X_line_poly), 'm-', linewidth=2, label='Regresja wielomianowa')

plt.plot(X_line, tree_model.predict(X_line), 'c-', linewidth=2, label='Drzewo decyzyjne')
plt.plot(X_line, rf_model.predict(X_line), 'y-', linewidth=2, label='Random Forest')

plt.xlabel('PKB per capita (USD)')
plt.ylabel('Zadowolenie z życia')
plt.title('Porównanie różnych modeli')
plt.legend()
plt.grid(True, alpha=0.3)

# Wykres 2: Porównanie błędów
models = ['Regresja liniowa', 'Regresja wielomianowa', 'Drzewo decyzyjne', 'Random Forest']
predictions = [linear_pred, poly_pred, tree_pred, rf_pred]
mse_scores = [mean_squared_error(y_test, pred) for pred in predictions]

plt.subplot(2, 2, 2)
bars = plt.bar(models, mse_scores, color=['green', 'magenta', 'cyan', 'yellow'])
plt.ylabel('Mean Squared Error')
plt.title('Porównanie błędów (MSE)')
plt.xticks(rotation=45)
for bar, score in zip(bars, mse_scores):
    plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.001, 
             f'{score:.3f}', ha='center', va='bottom')
plt.grid(True, alpha=0.3)

# Wykres 3: Rzeczywiste vs przewidywane wartości
plt.subplot(2, 2, 3)
plt.scatter(y_test, linear_pred, alpha=0.6, label='Regresja liniowa')
plt.scatter(y_test, poly_pred, alpha=0.6, label='Regresja wielomianowa')
plt.scatter(y_test, tree_pred, alpha=0.6, label='Drzewo decyzyjne')
plt.scatter(y_test, rf_pred, alpha=0.6, label='Random Forest')

# Linia idealna (rzeczywiste = przewidywane)
min_val = min(y_test.min(), min(pred.min() for pred in predictions))
max_val = max(y_test.max(), max(pred.max() for pred in predictions))
plt.plot([min_val, max_val], [min_val, max_val], 'r--', alpha=0.8, label='Idealna linia')

plt.xlabel('Rzeczywiste wartości')
plt.ylabel('Przewidywane wartości')
plt.title('Rzeczywiste vs Przewidywane')
plt.legend()
plt.grid(True, alpha=0.3)

# Wykres 4: Reszty (błędy)
plt.subplot(2, 2, 4)
residuals = [y_test - pred for pred in predictions]
for i, (residual, model) in enumerate(zip(residuals, models)):
    plt.scatter(X_test, residual, alpha=0.6, label=model)

plt.axhline(y=0, color='r', linestyle='--', alpha=0.8)
plt.xlabel('PKB per capita (USD)')
plt.ylabel('Reszty (błędy)')
plt.title('Analiza reszt')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Podsumowanie wyników
print(f"\n=== PODSUMOWANIE WYNIKÓW ===")
for model, pred, mse in zip(models, predictions, mse_scores):
    r2 = r2_score(y_test, pred)
    print(f"{model}:")
    print(f"  MSE: {mse:.4f}")
    print(f"  R²: {r2:.4f}")
    print(f"  RMSE: {np.sqrt(mse):.4f}")
    print()

print("=== WNIOSKI ===")
print("1. Różne modele mają różne charakterystyki:")
print("   - Regresja liniowa: prosta, interpretowalna")
print("   - Regresja wielomianowa: może modelować krzywe")
print("   - Drzewo decyzyjne: może modelować złożone granice")
print("   - Random Forest: łączy wiele drzew, często lepsza wydajność")
print()
print("2. Wybór modelu zależy od:")
print("   - Charakteru danych (liniowe vs nieliniowe)")
print("   - Interpretowalności vs wydajności")
print("   - Wielkości zbioru danych")
print("   - Złożoności problemu")


# Regresja k-Najbliższych Sąsiadów (k-NN) ze Wzorami Matematycznymi

### Wprowadzenie do Regresji k-Najbliższych Sąsiadów

Regresja k-najbliższych sąsiadów (k-NN) to prosty i intuicyjny algorytm uczenia maszynowego z nadzorem, który można stosować zarówno do zadań klasyfikacyjnych, jak i regresyjnych. W kontekście regresji, celem jest przewidywanie ciągłej wartości wyjściowej (np. ceny domu, temperatury). Jest to metoda **nieparametryczna**, co oznacza, że nie zakłada żadnej konkretnej formy funkcyjnej dla danych, jak na przykład liniowa zależność w regresji liniowej. K-NN jest również algorytmem "uczenia się na podstawie instancji" (instance-based learning), ponieważ nie buduje modelu w fazie trenowania, a zamiast tego przechowuje cały zbiór treningowy i wykonuje obliczenia dopiero w momencie predykcji.

Główna idea opiera się na założeniu, że podobne punkty danych istnieją w bliskiej odległości od siebie. Przewidywana wartość dla nowego, nieznanego punktu danych jest obliczana na podstawie wartości jego "k" najbliższych sąsiadów ze zbioru treningowego.

---

### Jak Działa Algorytm Regresji k-NN?

Proces predykcji przy użyciu regresji k-NN można podzielić na kilka kluczowych kroków:

#### Krok 1: Wybór liczby sąsiadów (k)

Pierwszym krokiem jest wybór hiperparametru `k`, który określa, ilu najbliższych sąsiadów zostanie uwzględnionych podczas dokonywania predykcji. Wybór `k` ma kluczowe znaczenie dla działania modelu:
*   **Małe `k`** (np. `k=1`): Model jest bardzo elastyczny i podatny na szum w danych, co może prowadzić do niestabilnych predykcji.
*   **Duże `k`**: Predykcje stają się bardziej stabilne i wygładzone, ale model może tracić zdolność do wychwytywania lokalnych struktur w danych.

Optymalną wartość `k` często wybiera się za pomocą walidacji krzyżowej. Powszechną heurystyką jest wybór `k` w przybliżeniu równego pierwiastkowi kwadratowemu z liczby punktów danych w zbiorze (`k ≈ √n`).

#### Krok 2: Obliczenie odległości

Aby znaleźć najbliższych sąsiadów dla nowego punktu danych, musimy obliczyć odległość między nim a wszystkimi punktami w zbiorze treningowym. Najczęściej używaną metryką odległości dla zmiennych ciągłych jest **odległość Euklidesowa**.

**Wzór na odległość Euklidesową:**

Dla dwóch punktów, **p** i **q**, w *n*-wymiarowej przestrzeni cech, gdzie **p** = $(p_1, p_2, ..., p_n)$ i **q** = $(q_1, q_2, ..., q_n)$, odległość Euklidesowa $d(p, q)$ jest definiowana jako:

$$
d(p, q) = \sqrt{(q_1 - p_1)^2 + (q_2 - p_2)^2 + ... + (q_n - p_n)^2} = \sqrt{\sum_{i=1}^{n} (q_i - p_i)^2}
$$

Inne popularne metryki odległości to:
*   **Odległość Manhattan:** suma bezwzględnych różnic współrzędnych.
*   **Odległość Minkowskiego:** uogólnienie odległości Euklidesowej i Manhattan.

> **Ważna uwaga:** Algorytm k-NN jest wrażliwy na skalę cech. Jeśli cechy mają różne zakresy wartości (np. wiek w latach i dochód w tysiącach), cecha o większym zakresie będzie dominować w obliczeniach odległości. Dlatego kluczowe jest przeskalowanie danych (np. przez normalizację lub standaryzację) przed zastosowaniem algorytmu.

#### Krok 3: Znalezienie k-najbliższych sąsiadów

Po obliczeniu odległości do wszystkich punktów treningowych, są one sortowane w porządku rosnącym. Następnie wybierane jest `k` punktów o najmniejszych odległościach od nowego punktu.

#### Krok 4: Dokonanie predykcji

W standardowej wersji regresji k-NN, przewidywana wartość dla nowego punktu jest prostą **średnią arytmetyczną** wartości docelowych jego `k` najbliższych sąsiadów.

**Wzór na predykcję w standardowej regresji k-NN:**

Jeśli $y_1, y_2, ..., y_k$ to wartości docelowe `k` najbliższych sąsiadów, to przewidywana wartość $\hat{y}$ dla nowego punktu jest obliczana jako:

$$
\hat{y} = \frac{1}{k} \sum_{i=1}^{k} y_i
$$

---

### Wariant: Ważona Regresja k-NN

Standardowe podejście traktuje wszystkich `k` sąsiadów jednakowo. Intuicyjnym ulepszeniem jest przypisanie większej wagi sąsiadom, którzy są bliżej nowego punktu, a mniejszej tym, którzy są dalej. Nazywa się to ważoną regresją k-NN.

W tym wariancie, predykcja jest **średnią ważoną**, gdzie wagi są zazwyczaj odwrotnością odległości do sąsiada.

**Wzór na wagę:**

Waga $w_i$ dla *i*-tego sąsiada może być zdefiniowana jako:

$$
w_i = \frac{1}{d_i}
$$

gdzie $d_i$ to odległość do *i*-tego sąsiada. Należy uważać na przypadek, gdy odległość wynosi zero; aby uniknąć dzielenia przez zero, można dodać małą stałą $\epsilon$ do mianownika.

**Wzór na predykcję w ważonej regresji k-NN:**

Przewidywana wartość $\hat{y}$ jest obliczana jako:

$$
\hat{y} = \frac{\sum_{i=1}^{k} (w_i \cdot y_i)}{\sum_{i=1}^{k} w_i}
$$

Dzięki temu podejściu, wpływ bliższych sąsiadów na ostateczny wynik jest silniejszy, co często prowadzi do dokładniejszych predykcji.

---

### Podsumowanie

| Aspekt | Opis |
| :--- | :--- |
| **Typ algorytmu** | Uczenie maszynowe z nadzorem, nieparametryczne, oparte na instancjach. |
| **Zadanie** | Regresja (przewidywanie wartości ciągłych). |
| **Krok 1: Wybór k** | Określenie liczby sąsiadów do uwzględnienia. |
| **Krok 2: Metryka odległości** | Najczęściej odległość Euklidesowa do mierzenia podobieństwa. |
| **Krok 3: Znalezienie sąsiadów** | Identyfikacja `k` punktów treningowych o najmniejszej odległości. |
| **Krok 4: Predykcja (standardowa)** | Średnia arytmetyczna wartości docelowych `k` sąsiadów. |
| **Krok 4: Predykcja (ważona)** | Średnia ważona wartości docelowych, gdzie wagi zależą od odległości. |

# Główne Wyzwania w Uczeniu Maszynowym: Złe Dane i Złe Algorytmy

Poniższa notatka podsumowuje kluczowe problemy, na jakie można natrafić podczas budowania systemów uczenia maszynowego, dzieląc je na dwie główne kategorie: problemy z danymi i problemy z algorytmami.

---

## 1. Złe Dane (Bad Data)

Jakość i reprezentatywność danych treningowych jest absolutnie kluczowa. Zasada "śmieci na wejściu, śmieci na wyjściu" (garbage in, garbage out) jest tu fundamentalna.

### A. Błąd Próbkowania (Sampling Bias)

> **W skrócie:** Dane treningowe nie są reprezentatywne dla przypadków, które model napotka w rzeczywistości.

Model uczy się na podstawie danych, które nie odzwierciedlają prawdziwego rozkładu populacji.

*   **Klasyczny przykład: Wybory w USA w 1936 r.**
    *   **Problem:** Sondażownia *Literary Digest* przewidziała wygraną Landona, podczas gdy z dużą przewagą wygrał Roosevelt.
    *   **Przyczyny błędu:**
        1.  **Niereprezentatywne źródła danych:** Adresy do wysyłki ankiet pochodziły z książek telefonicznych i list subskrybentów magazynów. W tamtych czasach posiadanie telefonu czy prenumeraty było domeną ludzi zamożniejszych, którzy częściej głosowali na Republikanów (Landon).
        2.  **Błąd braku odpowiedzi (Nonresponse bias):** Mniej niż 25% osób odesłało ankietę. Odpowiedziały głównie osoby silnie zaangażowane politycznie, co również zaburzyło reprezentatywność próby.

*   **Współczesny przykład: Wideo z muzyką funk**
    *   Jeśli zbiór treningowy zbudujesz, pobierając wyniki wyszukiwania "funk music" z YouTube, wyniki będą przechylone w stronę najpopularniejszych artystów i mogą nie reprezentować całego gatunku.

### B. Dane Niskiej Jakości (Poor-Quality Data)

> **W skrócie:** Dane są pełne błędów, wartości odstających (outlierów) i szumu.

Nawet najlepszy algorytm będzie miał problemy, jeśli dane będą "brudne". Duża część pracy Data Scientista to właśnie czyszczenie danych.

*   **Co robić?**
    *   **Wartości odstające (outliers):** Jeśli niektóre instancje są oczywistymi anomaliami, można je usunąć lub spróbować naprawić ręcznie.
    *   **Brakujące wartości:** Jeśli w niektórych próbkach brakuje cech (np. 5% klientów nie podało wieku), można:
        *   Zignorować całą cechę (atrybut).
        *   Zignorować instancje z brakami.
        *   Uzupełnić braki (np. medianą lub średnią).
        *   Wytrenować jeden model z tą cechą (na danych, które ją mają) i jeden bez niej.

### C. Nieistotne Cechy (Irrelevant Features)

> **W skrócie:** Zbiór danych zawiera zbyt wiele cech, które nie mają znaczenia dla problemu, a za mało tych, które mają.

System będzie w stanie się uczyć tylko, jeśli dane treningowe zawierają wystarczająco dużo **istotnych** cech.

*   **Rozwiązanie: Inżynieria Cech (Feature Engineering)**
    Jest to proces tworzenia dobrego zestawu cech do trenowania. Składa się z:
    1.  **Selekcji cech (Feature Selection):** Wybór najbardziej użytecznych cech spośród już istniejących.
    2.  **Ekstrakcji cech (Feature Extraction):** Łączenie istniejących cech w celu stworzenia nowej, bardziej użytecznej (np. za pomocą algorytmów redukcji wymiarowości).
    3.  **Tworzenia nowych cech:** Poprzez zbieranie nowych danych.

---

## 2. Złe Algorytmy (Bad Algorithms)

Nawet przy idealnych danych, niewłaściwy dobór lub konfiguracja modelu może prowadzić do słabych wyników.

### A. Przeuczenie (Overfitting)

> **W skrócie:** Model działa świetnie na danych treningowych, ale słabo generalizuje i nie radzi sobie z nowymi, nieznanymi danymi.

Model jest zbyt skomplikowany w stosunku do ilości i zaszumienia danych. Uczy się "na pamięć" danych treningowych, włączając w to przypadkowy szum, zamiast uczyć się ogólnych wzorców.

*   **Intuicyjny przykład:** Taksówkarz oszukał Cię w obcym kraju. Dochodzisz do wniosku, że *wszyscy* taksówkarze w tym kraju to złodzieje. To jest właśnie nadmierna generalizacja na podstawie małej próbki.

*   **Przykład techniczny:** Model uczy się, że kraje z literą "w" w nazwie mają wskaźnik satysfakcji z życia > 7 (na podstawie danych treningowych). Ten wzorzec jest przypadkowy i nie sprawdzi się dla innych krajów.

*   **Rozwiązania:**
    1.  **Uprość model:**
        *   Wybierz model z mniejszą liczbą parametrów (np. model liniowy zamiast wielomianu wysokiego stopnia).
        *   Zredukuj liczbę atrybutów w danych.
        *   Nałóż ograniczenia na model (patrz: Regularyzacja).
    2.  **Zbierz więcej danych treningowych.**
    3.  **Zredukuj szum w danych** (napraw błędy, usuń outliery).

*   **Regularyzacja (Regularization):**
    *   To technika **nakładania ograniczeń na model, aby go uprościć** i zmniejszyć ryzyko przeuczenia.
    *   Steruje się nią za pomocą **hiperparametru**.
    *   Przykład: W modelu liniowym można "zmusić" algorytm, by utrzymywał nachylenie prostej bliskie zeru. Model nie dopasuje się idealnie do danych treningowych, ale będzie lepiej generalizował.

### B. Niedouczenie (Underfitting)

> **W skrócie:** Model jest zbyt prosty, aby nauczyć się podstawowej struktury danych. Działa słabo nawet na danych treningowych.

Jest to przeciwieństwo przeuczenia. Rzeczywistość jest bardziej złożona niż możliwości modelu.

*   **Przykład:** Próba opisania skomplikowanego, nieliniowego zjawiska za pomocą prostej regresji liniowej.

*   **Rozwiązania:**
    1.  **Wybierz potężniejszy model** (z większą liczbą parametrów).
    2.  **Dostarcz lepsze cechy** (inżynieria cech).
    3.  **Zmniejsz ograniczenia nałożone na model** (np. zredukuj hiperparametr regularyzacji).

## Zbiór ucząco rozwojowy "train-dev"

Zbiór "train-dev" jest używany, gdy istnieje ryzyko niedopasowania między danymi treningowymi a danymi używanymi w zbiorach walidacyjnym i testowym (które zawsze powinny być jak najbardziej zbliżone do danych używanych po wdrożeniu modelu do produkcji). Zbiór "train-dev" to część zbioru treningowego, która jest odłożona (model nie jest na niej trenowany). Model jest trenowany na pozostałej części zbioru treningowego i oceniany zarówno na zbiorze "train-dev", jak i na zbiorze walidacyjnym. Jeśli model dobrze radzi sobie na zbiorze treningowym, ale nie na zbiorze "train-dev", to model prawdopodobnie nadmiernie dopasowuje się do zbioru treningowego. Jeśli dobrze radzi sobie zarówno na zbiorze treningowym, jak i na zbiorze "train-dev", ale nie na zbiorze walidacyjnym, to prawdopodobnie istnieje znaczne niedopasowanie danych między danymi treningowymi a danymi walidacyjnymi i testowymi, i należy spróbować ulepszyć dane treningowe, aby bardziej przypominały dane walidacyjne i testowe

## Parametry a hiperparametry

🔹 Parametry
Uczy się ich sam model podczas treningu.
Są wewnętrzne — model dopasowuje je do danych.
Przykłady:
w regresji liniowej → współczynniki w i b,
w sieci neuronowej → wagi i biasy neuronów.
📘 My nie ustawiamy parametrów — model sam je „uczy”.
🔹 Hiperparametry
Ustawiamy je my (człowiek lub algorytm optymalizacji) przed treningiem.
Sterują tym, jak model się uczy.
Przykłady:
szybkość uczenia (learning rate),
liczba warstw lub neuronów,
liczba epok,
rozmiar batcha,
k w k-NN,
C w SVM.
📘 Hiperparametry → wpływają na proces uczenia, ale nie są przez model uczone.

## 📘 Zbiory danych w uczeniu maszynowym

#### 🔹 Zbiór uczący (treningowy)
- Używany do **nauki modelu** — model dopasowuje do niego swoje **parametry**.  
- Największa część danych (zwykle ok. 70–80%).  

#### 🔹 Zbiór walidacyjny
- Używany do **dobierania hiperparametrów** i **oceny jakości** modelu podczas treningu.  
- Pomaga wykryć **przeuczenie (overfitting)**.  
- Dane z walidacji **nie są używane do uczenia**.  

#### 🔹 Zbiór testowy
- Używany **na końcu** do **sprawdzenia**, jak dobrze model generalizuje na **nowych danych**.  
- Dane testowe **nie mogą być widziane przez model wcześniej**.  

---

### ⚠️ Błąd generalizacji
- To **różnica między błędem na danych uczących a błędem na danych testowych**.  
- Pokazuje, **jak dobrze model radzi sobie z nowymi, nieznanymi danymi**.  
- Mały błąd generalizacji → model dobrze **uogólnia**.  
- Duży błąd generalizacji → model **przeuczony (overfitting)** lub **niedouczenie (underfitting)**.


## odp. na pytania z 1 rozdzialu

Jasne, oto tekst z dodaną numeracją do każdego akapitu:

1.  Uczenie maszynowe polega na budowaniu systemów, które potrafią uczyć się na podstawie danych. Uczenie się oznacza stawanie się lepszym w wykonywaniu jakiegoś zadania, przy uwzględnieniu określonej miary wydajności.

2.  Uczenie maszynowe jest doskonałe do rozwiązywania złożonych problemów, dla których nie mamy rozwiązania algorytmicznego, do zastępowania długich list ręcznie dostrajanych reguł, do budowania systemów, które dostosowują się do zmieniającego się otoczenia, a wreszcie do pomagania ludziom w uczeniu się (np. eksploracja danych).

3.  Oznaczony zbiór treningowy to zbiór treningowy, który zawiera pożądane rozwiązanie (czyli etykietę) dla każdego przypadku.

4.  Dwa najczęstsze zadania nadzorowane to regresja i klasyfikacja.

5.  Typowe zadania nienadzorowane obejmują klasteryzację, wizualizację, redukcję wymiarowości i uczenie się reguł asocjacyjnych.

6.  Uczenie przez wzmacnianie (Reinforcement Learning) prawdopodobnie sprawdzi się najlepiej, jeśli chcemy, aby robot nauczył się chodzić po różnych nieznanych terenach, ponieważ jest to typowy rodzaj problemu, którym zajmuje się uczenie przez wzmacnianie. Możliwe byłoby wyrażenie tego problemu jako problemu uczenia nadzorowanego lub częściowo nadzorowanego, ale byłoby to mniej naturalne.

7.  Jeśli nie wiesz, jak zdefiniować grupy, możesz użyć algorytmu klastrowania (uczenie nienadzorowane) do posegmentowania klientów na klastry podobnych klientów. Jeśli jednak wiesz, jakie grupy chciałbyś mieć, możesz dostarczyć wiele przykładów każdej grupy do algorytmu klasyfikacyjnego (uczenie nadzorowane), a on sklasyfikuje wszystkich twoich klientów do tych grup.

8.  Wykrywanie spamu to typowy problem uczenia nadzorowanego: algorytm otrzymuje wiele e-maili wraz z ich etykietami (spam lub nie spam).

9.  System uczący się online może uczyć się w sposób przyrostowy, w przeciwieństwie do systemu uczącego się wsadowo. Dzięki temu jest w stanie szybko dostosowywać się zarówno do zmieniających się danych, jak i systemów autonomicznych, oraz trenować na bardzo dużych ilościach danych.

10. Algorytmy "out-of-core" potrafią obsługiwać ogromne ilości danych, które nie mieszczą się w pamięci głównej komputera. Algorytm uczący się "out-of-core" dzieli dane na mini-partie i wykorzystuje techniki uczenia online do nauki na podstawie tych mini-partii.

11. System uczący się oparty na instancjach (instance-based learning) uczy się danych treningowych na pamięć; następnie, gdy otrzyma nową instancję, używa miary podobieństwa, aby znaleźć najbardziej podobne nauczone instancje i wykorzystuje je do tworzenia prognoz.

12. 
🔹 Parametry
Uczy się ich sam model podczas treningu.
Są wewnętrzne — model dopasowuje je do danych.
Przykłady:
w regresji liniowej → współczynniki w i b,
w sieci neuronowej → wagi i biasy neuronów.
📘 My nie ustawiamy parametrów — model sam je „uczy”.
🔹 Hiperparametry
Ustawiamy je my (człowiek lub algorytm optymalizacji) przed treningiem.
Sterują tym, jak model się uczy.
Przykłady:
szybkość uczenia (learning rate),
liczba warstw lub neuronów,
liczba epok,
rozmiar batcha,
k w k-NN,
C w SVM.
📘 Hiperparametry → wpływają na proces uczenia, ale nie są przez model uczone.

13. Algorytmy uczenia oparte na modelu (model-based learning) poszukują optymalnej wartości dla parametrów modelu, tak aby model dobrze generalizował na nowe instancje. Zazwyczaj trenujemy takie systemy poprzez minimalizację funkcji kosztu, która mierzy, jak słabo system radzi sobie z przewidywaniami na danych treningowych, plus kara za złożoność modelu, jeśli model jest regularyzowany. Aby dokonać predykcji, podajemy cechy nowej instancji do funkcji predykcyjnej modelu, używając wartości parametrów znalezionych przez algorytm uczący.

14. Niektóre z głównych wyzwań w uczeniu maszynowym to brak danych, niska jakość danych, niereprezentatywne dane, nieinformacyjne cechy, nadmiernie proste modele, które niedostatecznie dopasowują się do danych treningowych (underfitting), oraz nadmiernie złożone modele, które nadmiernie dopasowują się do danych (overfitting).

15. Jeśli model doskonale radzi sobie na danych treningowych, ale słabo generalizuje na nowe instancje, model prawdopodobnie nadmiernie dopasowuje się do danych treningowych (lub mieliśmy wyjątkowe szczęście na danych treningowych). Możliwe rozwiązania problemu nadmiernego dopasowania to pozyskanie większej ilości danych, uproszczenie modelu (wybór prostszego algorytmu, zmniejszenie liczby parametrów lub używanych cech, lub regularyzacja modelu) lub zmniejszenie szumu w danych treningowych.

16. Zbiór testowy jest używany do oszacowania błędu generalizacji, jaki model popełni na nowych instancjach, zanim model zostanie wdrożony do produkcji.

17. Zbiór walidacyjny jest używany do porównywania modeli. Umożliwia on wybór najlepszego modelu i dostrojenie hiperparametrów.

18. Zbiór "train-dev" jest używany, gdy istnieje ryzyko niedopasowania między danymi treningowymi a danymi używanymi w zbiorach walidacyjnym i testowym (które zawsze powinny być jak najbardziej zbliżone do danych używanych po wdrożeniu modelu do produkcji). Zbiór "train-dev" to część zbioru treningowego, która jest odłożona (model nie jest na niej trenowany). Model jest trenowany na pozostałej części zbioru treningowego i oceniany zarówno na zbiorze "train-dev", jak i na zbiorze walidacyjnym. Jeśli model dobrze radzi sobie na zbiorze treningowym, ale nie na zbiorze "train-dev", to model prawdopodobnie nadmiernie dopasowuje się do zbioru treningowego. Jeśli dobrze radzi sobie zarówno na zbiorze treningowym, jak i na zbiorze "train-dev", ale nie na zbiorze walidacyjnym, to prawdopodobnie istnieje znaczne niedopasowanie danych między danymi treningowymi a danymi walidacyjnymi i testowymi, i należy spróbować ulepszyć dane treningowe, aby bardziej przypominały dane walidacyjne i testowe.

19. Jeśli dostrajasz hiperparametry przy użyciu zbioru testowego, ryzykujesz nadmierne dopasowanie do zbioru testowego, a mierzony błąd generalizacji będzie optymistyczny (możesz wdrożyć model, który działa gorzej niż się spodziewasz).