# LAB 2.1: Perceptron & Podstawy Sieci Neuronowych

**Sztuczna Inteligencja - Semestr V**

**ProwadzƒÖcy:** ≈Åukasz Grala

---

## üéØ Cele laboratorium:

1. ‚úÖ Zrozumienie podstaw sieci neuronowych
2. ‚úÖ Implementacja perceptronu od zera
3. ‚úÖ Testowanie na prostych problemach (AND, OR, XOR)
4. ‚úÖ Wizualizacja granic decyzyjnych
5. ‚úÖ Multi-layer Perceptron dla XOR
6. ‚úÖ Pierwsze zastosowanie na rzeczywistych danych (Iris)

---

## üìö Wymagana wiedza:

- Python, NumPy
- Podstawy algebry liniowej (mno≈ºenie macierzy)
- Pojƒôcie funkcji (input ‚Üí output)

---

## Setup - Importy

In [None]:
# Podstawowe biblioteki
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris, make_classification
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Ustawienia
np.random.seed(42)
plt.rcParams['figure.figsize'] = (10, 6)
sns.set_style('whitegrid')

print("‚úì Biblioteki za≈Çadowane!")
print(f"NumPy version: {np.__version__}")

---
## CZƒò≈öƒÜ 1: Teoria - Co to jest Perceptron?

### Czym jest perceptron?

**Perceptron** to najprostsza forma sztucznego neuronu, wynaleziona przez Franka Rosenblatta w 1958 roku.

**Struktura:**
```
    x‚ÇÅ ‚îÄ‚îê
        ‚îú‚îÄ‚Üí Œ£ (suma wa≈ºona) ‚îÄ‚Üí f(z) ‚îÄ‚Üí output
    x‚ÇÇ ‚îÄ‚î§    z = w‚ÇÅx‚ÇÅ + w‚ÇÇx‚ÇÇ + b
        ‚îÇ
    x‚Çô ‚îÄ‚îò
    
    gdzie:
    - x‚ÇÅ, x‚ÇÇ, ..., x‚Çô : inputs (cechy)
    - w‚ÇÅ, w‚ÇÇ, ..., w‚Çô : wagi (weights)
    - b : bias (pr√≥g)
    - f : funkcja aktywacji
    - z : suma wa≈ºona
```

**Funkcje aktywacji:**

1. **Step function** (perceptron klasyczny):
   ```
   f(z) = 1 je≈õli z >= 0
          0 je≈õli z < 0
   ```

2. **Sigmoid** (logistic):
   ```
   f(z) = 1 / (1 + e^(-z))
   ```

3. **ReLU** (Rectified Linear Unit):
   ```
   f(z) = max(0, z)
   ```

**Zastosowania:**
- Klasyfikacja binarna (2 klasy)
- Podstawowy building block dla sieci neuronowych
- Rozpoznawanie prostych wzorc√≥w

**Ograniczenia:**
- Tylko problemy liniowo separowalne
- Nie rozwiƒÖ≈ºe XOR!

---

## CZƒò≈öƒÜ 2: Implementacja Perceptronu 

### Zadanie 2.1: Klasa Perceptron

Zaimplementuj perceptron z algorytmem uczenia.

In [None]:
class Perceptron:
    """
    Perceptron - najprostsza sieƒá neuronowa
    
    Algorytm uczenia:
    1. Inicjalizuj wagi losowo (lub zerami)
    2. Dla ka≈ºdego przyk≈Çadu treningowego:
        a) Oblicz predykcjƒô: y_pred = f(w¬∑x + b)
        b) Oblicz b≈ÇƒÖd: error = y_true - y_pred
        c) Zaktualizuj wagi: w = w + learning_rate * error * x
        d) Zaktualizuj bias: b = b + learning_rate * error
    3. Powtarzaj a≈º do zbie≈ºno≈õci lub max iteracji
    """
    
    def __init__(self, learning_rate=0.01, n_iters=1000):
        """
        Inicjalizacja perceptronu
        
        Parameters:
        -----------
        learning_rate : float
            Wsp√≥≈Çczynnik uczenia (jak szybko uczymy siƒô)
            Typowe warto≈õci: 0.001 - 0.1
        n_iters : int
            Maksymalna liczba epok (iteracji przez ca≈Çy dataset)
        """
        self.lr = learning_rate
        self.n_iters = n_iters
        self.activation_func = self._unit_step_func
        self.weights = None
        self.bias = None
        
    def fit(self, X, y):
        """
        Trenowanie perceptronu
        
        Parameters:
        -----------
        X : array-like, shape = [n_samples, n_features]
            Dane treningowe
        y : array-like, shape = [n_samples]
            Etykiety (0 lub 1)
        """
        n_samples, n_features = X.shape
        
        # TODO 1: Inicjalizuj wagi zerami
        self.weights = np.zeros(n_features)
        self.bias = 0
        
        # Konwertuj y do 0/1 je≈õli potrzeba
        y_ = np.array(y)
        
        # TODO 2: G≈Ç√≥wna pƒôtla uczenia
        for _ in range(self.n_iters):
            for idx, x_i in enumerate(X):
                # Forward pass - oblicz predykcjƒô
                linear_output = np.dot(x_i, self.weights) + self.bias
                y_predicted = self.activation_func(linear_output)
                
                # Oblicz b≈ÇƒÖd
                error = y_[idx] - y_predicted
                
                # TODO 3: Update rule - zaktualizuj wagi i bias
                # Regu≈Ça: w = w + learning_rate * error * x
                self.weights += self.lr * error * x_i
                self.bias += self.lr * error
    
    def predict(self, X):
        """
        Predykcja dla nowych danych
        
        Parameters:
        -----------
        X : array-like, shape = [n_samples, n_features]
        
        Returns:
        --------
        y_pred : array, shape = [n_samples]
            Predykcje (0 lub 1)
        """
        linear_output = np.dot(X, self.weights) + self.bias
        y_predicted = self.activation_func(linear_output)
        return y_predicted
    
    def _unit_step_func(self, x):
        """
        Step function - funkcja aktywacji
        
        Zwraca 1 je≈õli x >= 0, inaczej 0
        """
        return np.where(x >= 0, 1, 0)

print("‚úì Klasa Perceptron zaimplementowana!")

### Zadanie 2.2: Test na AND gate

**Bramka AND:**
```
x1  x2  | output
-----------------
0   0   |   0
0   1   |   0
1   0   |   0
1   1   |   1
```

Czy perceptron potrafi nauczyƒá siƒô tego?

In [None]:
# TODO 1: Przygotuj dane dla AND gate
X_and = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_and = np.array([0, 0, 0, 1])

print("AND Gate - Dane treningowe:")
print("X:")
print(X_and)
print("\ny (expected):")
print(y_and)

# TODO 2: Stw√≥rz i wytrenuj perceptron
p = Perceptron(learning_rate=0.1, n_iters=10)
p.fit(X_and, y_and)

# TODO 3: Testuj
predictions = p.predict(X_and)

print("\nPredykcje perceptronu:")
print(predictions)

# TODO 4: Sprawd≈∫ accuracy
accuracy = np.mean(predictions == y_and)
print(f"\nAccuracy: {accuracy * 100:.1f}%")

# TODO 5: Wy≈õwietl nauczone wagi
print(f"\nNauczone wagi: {p.weights}")
print(f"Nauczony bias: {p.bias}")

### Zadanie 2.3: Test na OR gate

**Bramka OR:**
```
x1  x2  | output
-----------------
0   0   |   0
0   1   |   1
1   0   |   1
1   1   |   1
```

In [None]:
# TODO 1: Dane dla OR gate
X_or = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_or = np.array([0, 1, 1, 1])

print("OR Gate - Dane treningowe:")
print(f"X:\n{X_or}")
print(f"\ny (expected):\n{y_or}")

# TODO 2: Trenuj perceptron
p_or = Perceptron(learning_rate=0.1, n_iters=10)
p_or.fit(X_or, y_or)

# TODO 3: Predykcje
predictions_or = p_or.predict(X_or)
print(f"\nPredykcje: {predictions_or}")
print(f"Accuracy: {np.mean(predictions_or == y_or) * 100:.1f}%")
print(f"\nWagi: {p_or.weights}, Bias: {p_or.bias}")

### Zadanie 2.4: Test na XOR gate - **PROBLEM!**

**Bramka XOR:**
```
x1  x2  | output
-----------------
0   0   |   0
0   1   |   1
1   0   |   1
1   1   |   0
```

**Pytanie:** Czy perceptron potrafi nauczyƒá siƒô XOR?

**Odpowied≈∫:** **NIE!** XOR nie jest liniowo separowalny.

Sprawd≈∫my to:

In [None]:
# TODO 1: Dane dla XOR
X_xor = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_xor = np.array([0, 1, 1, 0])

print("XOR Gate - Dane treningowe:")
print(f"X:\n{X_xor}")
print(f"\ny (expected):\n{y_xor}")

# TODO 2: Trenuj perceptron
p_xor = Perceptron(learning_rate=0.1, n_iters=100)  # Wiƒôcej iteracji
p_xor.fit(X_xor, y_xor)

# TODO 3: Predykcje
predictions_xor = p_xor.predict(X_xor)
print(f"\nPredykcje: {predictions_xor}")
print(f"Expected:  {y_xor}")
print(f"Accuracy: {np.mean(predictions_xor == y_xor) * 100:.1f}%")

print("\n‚ùå Perceptron NIE MO≈ªE nauczyƒá siƒô XOR!")
print("Problem XOR wymaga Multi-Layer Perceptron (MLP)")

---
## CZƒò≈öƒÜ 3: Wizualizacja Granic Decyzyjnych

### Zadanie 3.1: Funkcja wizualizujƒÖca

Stw√≥rz funkcjƒô kt√≥ra rysuje granicƒô decyzyjnƒÖ perceptronu.

In [None]:
def plot_decision_boundary(X, y, model, title="Decision Boundary"):
    """
    Rysuje granicƒô decyzyjnƒÖ dla perceptronu (2D)
    
    Granica decyzyjna to linia gdzie: w‚ÇÅx‚ÇÅ + w‚ÇÇx‚ÇÇ + b = 0
    """
    # Stw√≥rz siatkƒô punkt√≥w
    x_min, x_max = X[:, 0].min() - 0.5, X[:, 0].max() + 0.5
    y_min, y_max = X[:, 1].min() - 0.5, X[:, 1].max() + 0.5
    
    xx, yy = np.meshgrid(
        np.arange(x_min, x_max, 0.02),
        np.arange(y_min, y_max, 0.02)
    )
    
    # Predykcja dla ka≈ºdego punktu siatki
    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    
    # Rysuj
    plt.figure(figsize=(10, 6))
    plt.contourf(xx, yy, Z, alpha=0.4, cmap='RdYlBu')
    plt.scatter(X[:, 0], X[:, 1], c=y, s=200, edgecolors='black', 
                cmap='RdYlBu', linewidths=2)
    plt.xlabel('x‚ÇÅ', fontsize=12)
    plt.ylabel('x‚ÇÇ', fontsize=12)
    plt.title(title, fontsize=14)
    plt.grid(True, alpha=0.3)
    
    # Rysuj liniƒô decyzyjnƒÖ
    # w1*x1 + w2*x2 + b = 0  =>  x2 = -(w1*x1 + b) / w2
    if model.weights[1] != 0:
        x1_line = np.linspace(x_min, x_max, 100)
        x2_line = -(model.weights[0] * x1_line + model.bias) / model.weights[1]
        plt.plot(x1_line, x2_line, 'k--', linewidth=2, label='Decision Boundary')
        plt.legend()
    
    plt.tight_layout()
    plt.show()

print("‚úì Funkcja wizualizacji gotowa!")

### Zadanie 3.2: Wizualizuj AND, OR i XOR

In [None]:
# TODO 1: Wizualizuj AND gate
plot_decision_boundary(X_and, y_and, p, "AND Gate - Decision Boundary")

# TODO 2: Wizualizuj OR gate
plot_decision_boundary(X_or, y_or, p_or, "OR Gate - Decision Boundary")

# TODO 3: Wizualizuj XOR gate
plot_decision_boundary(X_xor, y_xor, p_xor, "XOR Gate - Perceptron FAILS!")

print("\nüìä Obserwacje:")
print("- AND i OR: Liniowo separowalne ‚úì")
print("- XOR: Nie da siƒô rozdzieliƒá liniƒÖ prostƒÖ ‚úó")
print("- Potrzebujemy wiƒôcej warstw (MLP)!")

---
## CZƒò≈öƒÜ 4: Multi-Layer Perceptron dla XOR

### Zadanie 4.1: Implementacja MLP

**MLP (Multi-Layer Perceptron)** = sieƒá z warstwƒÖ ukrytƒÖ (hidden layer)

**Architektura:**
```
Input (2) ‚Üí Hidden (4, ReLU) ‚Üí Output (1, Sigmoid)
```

**Forward Propagation:**
1. z‚ÇÅ = W‚ÇÅ ¬∑ x + b‚ÇÅ
2. a‚ÇÅ = ReLU(z‚ÇÅ)
3. z‚ÇÇ = W‚ÇÇ ¬∑ a‚ÇÅ + b‚ÇÇ
4. a‚ÇÇ = Sigmoid(z‚ÇÇ)

**Backpropagation:**
1. Oblicz gradient dla output layer
2. Propaguj b≈ÇƒÖd wstecz do hidden layer
3. Zaktualizuj wagi

In [None]:
class MLP:
    """
    Multi-Layer Perceptron z 1 hidden layer
    
    Architecture: Input ‚Üí Hidden (ReLU) ‚Üí Output (Sigmoid)
    """
    
    def __init__(self, n_input, n_hidden, n_output, learning_rate=0.1):
        """
        Inicjalizacja MLP
        
        Parameters:
        -----------
        n_input : int
            Liczba neuron√≥w wej≈õciowych (features)
        n_hidden : int
            Liczba neuron√≥w w hidden layer
        n_output : int
            Liczba neuron√≥w wyj≈õciowych (zwykle 1 dla binary classification)
        learning_rate : float
            Wsp√≥≈Çczynnik uczenia
        """
        # TODO 1: Inicjalizacja wag (Xavier initialization)
        self.W1 = np.random.randn(n_input, n_hidden) * np.sqrt(2. / n_input)
        self.b1 = np.zeros((1, n_hidden))
        
        self.W2 = np.random.randn(n_hidden, n_output) * np.sqrt(2. / n_hidden)
        self.b2 = np.zeros((1, n_output))
        
        self.lr = learning_rate
        
        # Cache dla backward pass
        self.cache = {}
    
    def sigmoid(self, x):
        """Sigmoid activation: œÉ(x) = 1 / (1 + e^(-x))"""
        # Clip x aby uniknƒÖƒá overflow
        x_clipped = np.clip(x, -500, 500)
        return 1 / (1 + np.exp(-x_clipped))
    
    def sigmoid_derivative(self, x):
        """Pochodna sigmoid: œÉ'(x) = œÉ(x) * (1 - œÉ(x))"""
        return x * (1 - x)
    
    def relu(self, x):
        """ReLU activation: ReLU(x) = max(0, x)"""
        return np.maximum(0, x)
    
    def relu_derivative(self, x):
        """Pochodna ReLU: 1 je≈õli x > 0, inaczej 0"""
        return (x > 0).astype(float)
    
    def forward(self, X):
        """
        Forward propagation
        
        Returns: output
        """
        # TODO 2: Layer 1 (hidden layer)
        self.z1 = np.dot(X, self.W1) + self.b1
        self.a1 = self.relu(self.z1)
        
        # TODO 3: Layer 2 (output layer)
        self.z2 = np.dot(self.a1, self.W2) + self.b2
        self.a2 = self.sigmoid(self.z2)
        
        return self.a2
    
    def backward(self, X, y, output):
        """
        Backpropagation - oblicza gradienty i aktualizuje wagi
        
        Wzory:
        - Output layer: dL/dW2 = a1.T @ (output - y)
        - Hidden layer: dL/dW1 = X.T @ (dz1)
            gdzie dz1 = (output - y) @ W2.T * relu'(a1)
        """
        m = X.shape[0]
        
        # TODO 4: Gradienty dla output layer
        # Dla Binary Cross-Entropy + Sigmoid, gradient = output - y
        dz2 = output - y
        dW2 = (1/m) * np.dot(self.a1.T, dz2)
        db2 = (1/m) * np.sum(dz2, axis=0, keepdims=True)
        
        # TODO 5: Gradienty dla hidden layer
        da1 = np.dot(dz2, self.W2.T)
        dz1 = da1 * self.relu_derivative(self.a1)
        dW1 = (1/m) * np.dot(X.T, dz1)
        db1 = (1/m) * np.sum(dz1, axis=0, keepdims=True)
        
        # TODO 6: Update wag (gradient descent)
        self.W2 -= self.lr * dW2
        self.b2 -= self.lr * db2
        self.W1 -= self.lr * dW1
        self.b1 -= self.lr * db1
    
    def train(self, X, y, epochs=10000, verbose=True):
        """
        Trenowanie sieci
        
        Parameters:
        -----------
        X : array, shape = [n_samples, n_features]
        y : array, shape = [n_samples, 1]
        epochs : int
            Liczba epok
        verbose : bool
            Czy wy≈õwietlaƒá progress
        
        Returns:
        --------
        losses : list
            Historia funkcji straty
        """
        losses = []
        
        for epoch in range(epochs):
            # Forward pass
            output = self.forward(X)
            
            # Oblicz loss (Binary Cross-Entropy)
            loss = -np.mean(y * np.log(output + 1e-8) + 
                           (1 - y) * np.log(1 - output + 1e-8))
            losses.append(loss)
            
            # Backward pass
            self.backward(X, y, output)
            
            # Wy≈õwietl progress
            if verbose and epoch % 1000 == 0:
                print(f"Epoch {epoch:5d}, Loss: {loss:.4f}")
        
        return losses
    
    def predict(self, X):
        """Predykcja (0 lub 1)"""
        output = self.forward(X)
        return (output > 0.5).astype(int)

print("‚úì Klasa MLP zaimplementowana!")

### Zadanie 4.2: RozwiƒÖzanie XOR z MLP

In [None]:
# Dane XOR
X_xor_train = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_xor_train = np.array([[0], [1], [1], [0]])

print("XOR - Dane treningowe:")
print(f"X:\n{X_xor_train}")
print(f"\ny:\n{y_xor_train.flatten()}")

# TODO 1: Stw√≥rz MLP
mlp = MLP(n_input=2, n_hidden=4, n_output=1, learning_rate=0.1)

print("\nüîÑ Trening MLP dla XOR...")
# TODO 2: Trenuj
losses = mlp.train(X_xor_train, y_xor_train, epochs=10000, verbose=True)

# TODO 3: Testuj
predictions = mlp.predict(X_xor_train)
print(f"\n=== WYNIKI ===")
print(f"Predykcje: {predictions.flatten()}")
print(f"Expected:  {y_xor_train.flatten()}")
print(f"Accuracy:  {np.mean(predictions == y_xor_train) * 100:.1f}%")

print("\n‚úÖ MLP ROZWIƒÑZA≈Å XOR!")

### Zadanie 4.3: Wizualizacja uczenia

In [None]:
# TODO 1: Learning curve
plt.figure(figsize=(10, 6))
plt.plot(losses, linewidth=2)
plt.xlabel('Epoch', fontsize=12)
plt.ylabel('Loss (Binary Cross-Entropy)', fontsize=12)
plt.title('Learning Curve - MLP training on XOR', fontsize=14)
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("üìâ Loss maleje - sieƒá siƒô uczy!")

# TODO 2: Wizualizuj granicƒô decyzyjnƒÖ MLP
def plot_mlp_boundary(X, y, model, title="MLP Decision Boundary"):
    x_min, x_max = X[:, 0].min() - 0.5, X[:, 0].max() + 0.5
    y_min, y_max = X[:, 1].min() - 0.5, X[:, 1].max() + 0.5
    
    xx, yy = np.meshgrid(
        np.arange(x_min, x_max, 0.02),
        np.arange(y_min, y_max, 0.02)
    )
    
    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    
    plt.figure(figsize=(10, 6))
    plt.contourf(xx, yy, Z, alpha=0.4, cmap='RdYlBu', levels=1)
    plt.scatter(X[:, 0], X[:, 1], c=y, s=200, edgecolors='black',
                cmap='RdYlBu', linewidths=2)
    plt.xlabel('x‚ÇÅ', fontsize=12)
    plt.ylabel('x‚ÇÇ', fontsize=12)
    plt.title(title, fontsize=14)
    plt.grid(True, alpha=0.3)
    plt.tight_layout()
    plt.show()

# Wizualizuj
plot_mlp_boundary(X_xor_train, y_xor_train.flatten(), mlp, 
                  "XOR - MLP Decision Boundary (NON-LINEAR)")

print("üé® MLP tworzy nieliniowƒÖ granicƒô decyzyjnƒÖ!")

---
## CZƒò≈öƒÜ 5: Zastosowanie na Iris Dataset

### Zadanie 5.1: Wczytaj i przygotuj dane

In [None]:
# Wczytaj Iris dataset
iris = load_iris()
X_iris = iris.data[:, :2]  # U≈ºyjemy tylko 2 pierwszych cech (dla wizualizacji)
y_iris = (iris.target == 0).astype(int).reshape(-1, 1)  # Binary: setosa vs rest

print("Iris Dataset:")
print(f"Features shape: {X_iris.shape}")
print(f"Target shape: {y_iris.shape}")
print(f"\nKlasy (pierwsze 10):")
print(y_iris[:10].flatten())

# TODO 1: Train-test split
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
    X_iris, y_iris, test_size=0.2, random_state=42, stratify=y_iris
)

# TODO 2: Skalowanie
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

print(f"\nTrain set: {X_train_scaled.shape}")
print(f"Test set: {X_test_scaled.shape}")

### Zadanie 5.2: Trenuj MLP na Iris

In [None]:
# TODO 1: Stw√≥rz MLP
mlp_iris = MLP(n_input=2, n_hidden=8, n_output=1, learning_rate=0.01)

print("üîÑ Trening MLP na Iris dataset...")
# TODO 2: Trenuj
losses_iris = mlp_iris.train(X_train_scaled, y_train, epochs=5000, verbose=False)

print("‚úì Trening zako≈Ñczony!")

# TODO 3: Ewaluacja na train set
train_pred = mlp_iris.predict(X_train_scaled)
train_accuracy = np.mean(train_pred == y_train) * 100
print(f"\nTrain Accuracy: {train_accuracy:.2f}%")

# TODO 4: Ewaluacja na test set
test_pred = mlp_iris.predict(X_test_scaled)
test_accuracy = np.mean(test_pred == y_test) * 100
print(f"Test Accuracy: {test_accuracy:.2f}%")

# TODO 5: Learning curve
plt.figure(figsize=(10, 6))
plt.plot(losses_iris, linewidth=2, color='blue')
plt.xlabel('Epoch', fontsize=12)
plt.ylabel('Loss', fontsize=12)
plt.title('Learning Curve - Iris Dataset', fontsize=14)
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

### Zadanie 5.3: Wizualizacja wynik√≥w

In [None]:
# TODO 1: Scatter plot - actual vs predicted
plt.figure(figsize=(14, 6))

# Train set
plt.subplot(1, 2, 1)
plt.scatter(X_train_scaled[y_train.flatten() == 0, 0], 
           X_train_scaled[y_train.flatten() == 0, 1],
           c='blue', label='Class 0', s=100, alpha=0.6, edgecolors='black')
plt.scatter(X_train_scaled[y_train.flatten() == 1, 0], 
           X_train_scaled[y_train.flatten() == 1, 1],
           c='red', label='Class 1', s=100, alpha=0.6, edgecolors='black')
plt.xlabel('Sepal Length (scaled)', fontsize=12)
plt.ylabel('Sepal Width (scaled)', fontsize=12)
plt.title(f'Train Set (Accuracy: {train_accuracy:.1f}%)', fontsize=14)
plt.legend()
plt.grid(True, alpha=0.3)

# Test set
plt.subplot(1, 2, 2)
plt.scatter(X_test_scaled[y_test.flatten() == 0, 0], 
           X_test_scaled[y_test.flatten() == 0, 1],
           c='blue', label='Class 0', s=100, alpha=0.6, edgecolors='black')
plt.scatter(X_test_scaled[y_test.flatten() == 1, 0], 
           X_test_scaled[y_test.flatten() == 1, 1],
           c='red', label='Class 1', s=100, alpha=0.6, edgecolors='black')
plt.xlabel('Sepal Length (scaled)', fontsize=12)
plt.ylabel('Sepal Width (scaled)', fontsize=12)
plt.title(f'Test Set (Accuracy: {test_accuracy:.1f}%)', fontsize=14)
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# TODO 2: Decision boundary
plot_mlp_boundary(X_test_scaled, y_test.flatten(), mlp_iris,
                  "Iris Dataset - MLP Decision Boundary")

---
## PODSUMOWANIE LAB 2.1

### Czego siƒô nauczy≈Çe≈õ:

‚úÖ **Teoria:**
- Czym jest perceptron
- Jak dzia≈Ça algorytm uczenia
- Pojƒôcie funkcji aktywacji
- Liniowa separowalno≈õƒá

‚úÖ **Praktyka:**
- Implementacja perceptronu od zera
- Testowanie na AND, OR, XOR
- Wizualizacja granic decyzyjnych
- Problem XOR i jego rozwiƒÖzanie

‚úÖ **MLP:**
- Multi-layer perceptron
- Forward i backward propagation
- Nieliniowe granice decyzyjne
- Zastosowanie na rzeczywistych danych

---

### Kluczowe wnioski:

1. **Perceptron** mo≈ºe rozwiƒÖzaƒá tylko problemy **liniowo separowalne**
2. **XOR** wymaga sieci wielowarstwowej (MLP)
3. **Hidden layer** pozwala nauczyƒá siƒô nieliniowych wzorc√≥w
4. **Backpropagation** to kluczowy algorytm uczenia g≈Çƒôbokich sieci

---

### Na nastƒôpne zajƒôcia (Lab 2.2):

**Temat:** MLP & Backpropagation (szczeg√≥≈Çowo)

**Bƒôdziemy omawiaƒá:**
- Matematyka backpropagation krok po kroku
- R√≥≈ºne optimizers (SGD, Momentum, Adam)
- Weight initialization
- Problem znikajƒÖcego gradientu
- Mini-batch training
- MNIST classification

**Przygotuj siƒô:**
- Powt√≥rz pochodne (chain rule)
- Gradient descent
- Matrix multiplication

---

### Zadanie:

1. ‚úÖ Eksperymentuj z r√≥≈ºnymi learning rates dla MLP
2. ‚úÖ Spr√≥buj r√≥≈ºnej liczby neuron√≥w w hidden layer (2, 4, 8, 16)
3. ‚úÖ U≈ºyj wszystkich 4 cech z Iris (zamiast 2)
4. ‚úÖ Zaimplementuj perceptron dla multi-class classification (3 klasy Iris)
5. ‚úÖ Poczytaj o backpropagation przed nastƒôpnymi zajƒôciami

---

**Kontakt:** lukasz.grala@cdv.pl

**Materia≈Çy:**
- Nielsen, M.: "Neural Networks and Deep Learning" (darmowy online)
- 3Blue1Brown: "Neural Networks" (YouTube)
- Coursera: Andrew Ng "Machine Learning"

**Powodzenia!** üöÄüß†
