# Uczenie Maszynowe (kurs zima 2024/2025)

## Prowadzący zajęcia:

* Dr Kamil Smolak; email: <kamil.smolak@upwr.edu.pl>

# Forma zajęć:

Wszystkie materiały do zajęć, wykłady i ćwiczenia są dostępne online w postaci Jupyter Book.

Materiały są interaktywnymi notebookami Pythona, które umożliwiają prezentację i praktykę umiejętności związanych z uczeniem maszynowym.

Materiały będą dostępne online *przed* ćwiczeniami, co pozwoli na realizację zajęć w fomie _odwróconej_, w której studenci zapoznają się z materiałami *przed* ćwiczeniami. Dzięki temu możemy postawić większy nacisk na praktykę w trakcie zajęć.

In [9]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.decomposition import PCA
from sklearn.metrics import accuracy_score
import ipywidgets as widgets
from ipywidgets import interact

# Load Iris Dataset
iris = load_iris()
X = iris.data
y = iris.target

# Use PCA to reduce to 2 dimensions for visualization
pca = PCA(n_components=2)
X_reduced = pca.fit_transform(X)

# Standardize the dataset
scaler = StandardScaler()
X_reduced = scaler.fit_transform(X_reduced)

# Train-test split
X_train, X_test, y_train, y_test = train_test_split(X_reduced, y, test_size=0.2, random_state=42)

# Interactive function to visualize the decision boundary with different regularization strength
def plot_classification(C):
    # Create and train the model
    model = LogisticRegression(C=C, multi_class='ovr')
    model.fit(X_train, y_train)

    # Predict the test set
    y_pred = model.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)

    # Plot decision boundary
    plt.figure(figsize=(8, 6))
    x_min, x_max = X_train[:, 0].min() - 1, X_train[:, 0].max() + 1
    y_min, y_max = X_train[:, 1].min() - 1, X_train[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.01), np.arange(y_min, y_max, 0.01))
    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    plt.contourf(xx, yy, Z, alpha=0.8)
    plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, edgecolors='k', marker='o', label='Train set')
    plt.scatter(X_test[:, 0], X_test[:, 1], c=y_test, marker='x', label='Test set')
    
    plt.title(f'Logistic Regression (C={C:.2f})\nAccuracy: {accuracy:.2f}')
    plt.xlabel('PCA Component 1')
    plt.ylabel('PCA Component 2')
    plt.legend(loc='upper left')
    plt.show()

# Interactive slider to control the regularization strength (C parameter)
interact(plot_classification, C=widgets.FloatSlider(value=1.0, min=0.01, max=10.0, step=1, description='C (Inverse of Regularization Strength)'));


interactive(children=(FloatSlider(value=1.0, description='C (Inverse of Regularization Strength)', max=10.0, m…

## Przedmiot i cel zajęć

Przedmiot obejmuje wprowadzenie i kształcenie w dziedzinie uczenia maszynowego i powiązanych obszarów, takich jak Data Science.

#### W trakcie kursu skupimy się na zrozumieniu zasad działania i typami uczenia maszynowego, nauczymy się przeprowadzania kompletnego procesu budowy modelu i zwrócimy uwagę na typowe błędy popełniane w trakcie budowy modeli.


## Co to jest Uczenie Maszynowe?

<img src='img/Student.png' width=500/>

## O nazewnictwie

<img src='img/AIMLDL.jpg' width=400/>

<i>Demir, H., & Sarı, F. (2020). The effect of artificial intelligence and industry 4.0 on robotic systems. Engineering on Energy Materials, Iksad Publications, 51-72.</i>

### To co powszechnie nazywamy Sztuczną Inteligencją (AI) jest w rzeczywistości uczeniem maszynowym, a nawet i uczeniem głębokim. 

Termin przyjął się w mowie potocznej, ale jest nieprecyzyjny. AI jest znacznie szerszym zakresem powiązanym również z robotyką i automatyką.


## Celem AI jest zbudowanie istoty rozumującej jak człowiek.

Budowa takiej istoty obejmuje replikację wszystkich elementów niezbędnych do interakcji z otoczeniem. Większość z tych elementów replikujemy całkiem nieźle - mowa tu o zdolnościach ruchowych i manipulacji obiektami.

Można myśleć o tym, jak o replikacji konkretnych elementów ciała:

* Nogi do poruszania
* Ręce do manipulacji
* <b> Mózg to rozumowania i wnioskowania </b>

### Ambicją uczenia maszynowego jest komponentu niezbędnego dla inteligentnej istoty, tj. sztucznego mózgu

<img src='img/mozg.webp' width=300/>

Budowa mózgu stanowiła na przestrzeni lat niejako inspirację dla niektórych algorytmów uczenia maszynowego, a w szczególności sieci neuronowych, które rewolucjonizują obecny świat. Budowa neuronów i ich powiązań stanowiło podstawę opracowania pierwszego uczonego modelu. Miało to miejsce już w 1958 roku. Potem nastąpiła tzw. zima AI, gdzie niewiele badań nad tym tematem miało w ogóle miejsce. Wynikało to głównie z braku możliwości obliczeniowych.

Wizja odtworzenia mózgu, pomimo że kusząca, jest nadal odległa. Złożoność obecnych algorytmów jest daleko mniejsza niż naszych mózgów.

## Algorytmy są głównie trenowane do wykonywania jednego zadania, nie są w stanie generalizować zadań.

W wielu obszarach zdolność algorytmów jest lepsza niż zdolność naszych mózgów.

<img src='img/chiuaua.jpg' />

Natomiast jesteśmy znacznie lepsi w *różnorodności* realizowanych zadań.

* Żeby algorytm uczenia maszynowego był w stanie rozpoznać słonia, musi najpierw obejrzeć 1000 zdjęć słonia.
* Dziecko na podstawie jednej książeczki z bajkowym rysunkiem słonia nauczy się go bezbłędnie rozpoznawać.


* Osoba która nauczyła się jeździć autem w słonecznej pogodzie, prawdopodobnie poradzi sobie nieźle z jadą po śnieżnej drodze.
* Algorytm, który nigdy nie widział zaśnieżonej drogi prawdopodobnie "spanikuje" i nie wykona żadnych akcji.

## Jaka jest zatem przyszłość uczenia maszynowego?

Modele stają się coraz bardziej uniwersalne i zdolne do wykonywania zadań szybko i efektywnie. Choćby przykład popularnych dużych modeli językowych (large language models - LLM) takich jak ChatGPT, pokazuje jak zdolne zaczyną być te narzędzia.

To prowadzi do dwóch pytań:

* Czy modele uczenia maszynowego są lub mogą być świadome?
* Jaka jest ich przyszłość?

Koncepcja "osobliwości" (singularity) mówi o stworzeniu tzw. Generalnej Sztucznej Inteligencji (General AI), która jest zdolna do wykonywania wszystkich powierzonych zadań w sposób inteligentny. Taka inteligencja jest zdolna do samo-ulepszania, rozwijając się daleko poza nasze wyobrażenia oraz kontrolę. Dlatego też, stawiane jest często pytanie dotyczące świadomości - kiedy możemy uznać algorytmy za świadome?

Już dziś modele przesuwają granice wiedzy, znajdując rozwiązania problemów tak efektywne, że przekraczają one ludzką zdolność rozumowania.

Przykładowo - macierze mnożone są wykorzystując metodę Strassena, która niezmiennie od 1969 była najefektywniejszą metodą tej operacji. W 2022 roku AlphaTensor opracował własną metodę mnożenia macierzy, która wymagała mniejszej liczby operacji.

## Być może uczenie maszynowe to kolejna rewolucja w historii ludzkości.

<img src='img/revol.jpg'/>

Każda rewolucja charakteryzuje się zmianą sposobu życia, podnosząc jego poziom ale i zmieniając funkcjonowanie świata. Zmiany muszą być przeprowadzane odpowiedzialnie i zawsze spotykają się z oporem. *Etyka* jest kluczowym zagadnieniem. Prawdopodobnie niektóre zawody znikną i zostaną zautomatyzowane. Powstaną za to nowe.

# Praca w obszarze AI/ML

Liczba roli/stanowisk które są oferowane na rynku w obszarze AI/ML jest ogromna. Można podzielić je na cztery główne typy:

<img src='img/Roles.png'/>


Firmy oferują różne stanowiska, specjalizujące się w konkretnych zadaniach lub bardziej ogólne, często zależne jest to od wielkości firmy i jej klientów.

<img src='img/Needs.png'/>

Na tym przedmiocie postaram wskazać się wam kierunki rozwoju w tym zakresie i pokazać jak wykorzystać uczenie maszynowe do projektów i zadań.

Jest to też jeden z lepiej opłacanych sektorów gospodarki, choć rzadko oferowane są stanowiska dla początkujących (juniorów). Wymagane są:

* dobra znajomość języka programowania (Python), 
* modeli, często zaawansowanych metod i typów uczenia maszynowego
* umiejętności składowania i przetwarzania danych (SQL, NoSQL) 
* obliczeń rozproszonych (Dask, Spark)
* utrzymywania budowy i rozwoju oprogramowania  (MLOps, Kubernetes, Docker)
* pracy w środowisku chmurowym (AWS, Azure)
* umiejętności zarządzania zespołem, pracy z klientem i prowadzenia projektów.

Osoba pracująca w tym obszarze musi być wszechstronna i posiadać duże doświadczenie. Nierzadko jednak warto zainwestować swój czas.

<img src='img/tools.jpg'/>

Największy nacisk należy postawić na początku na:

    naukę programowania (warto skorzystać ze stron z wyzwaniami programistycznymi jak np. leetcode.com i projecteuler.net)
    
    na wykowanie własnych projektów uczenia maszynowego
    
    na budowanie portfolio na swoim koncie GitHub (pracodawcy to sprawdzają)
    
<img src='img/leetcode.png' />

# Co zatem będziemy robić w trakcie tego kursu?

Skupimy się na przeprowadzeniu kompletnego procesu budowy modeli uczenia maszynowego. Podążać będziemy za typowym podejściem do eksploracji danych, które obejmuje etapy:

    Zrozumienie danych - biznesowe i techniczne
    Przygotowanie danych
    Modelowanie (budowa modelu)
    Ewaluacja (ocena modelu)
    Wnioski/Interpretacja i ewentualne powtórzenie procesu eksploracji

<img src='img/model.png' />

Budowa modelu uczenia maszynowego to tylko niewielka część całego procesu. Przygotowanie danych jest kluczowe i czasochłonne.

## Zagadnienia

Zagadnienia objęte tym kursem to:

    Przygotowanie do procesu budowy modelu
    Przygotowanie danych i inżynieria cech
    Uczenie nadzorowane
        Klasyfikacja
        Regresja
        Sieci neuronowe
    Uczenie nienadzorowane
        Klasteryzacja
        Redukcja wymiarów
    Ocena modeli i wyciąganie wniosków
    Często popełniane błędy w trakcie budowy modeli

# Organizacja kursu

Materiały do przedmiotu będą dostępne online w formie Jupyter Booka, którego można pobrać i uruchomić na własnym komputerze

Wszelkie zadania będzie można przesyłać przed dedykowaną stronę na platformie Google Classroom. 

### Zaliczenie kursu

Podstawą zaliczenia jest aktywność na ćwiczeniach. Z uwagi na podejście do zajęć w formie "klasy odwróconej", podczas ćwiczeń każde zadanie będzie wykonywać jedna osoba wybrana przez prowadzącego. Zadanie będzie wykonywane na rzutniku i będzie podlegało ocenie.

Dodatkowo będą dwa testy z treści zajęć.

