# Ćwiczenie 2
**Aproksymacja linii metodą największego spadku (Gradient Descent) w perceptronie**

W tym ćwiczeniu wykorzystujemy perceptron do aproksymacji prostej opisującej zależność między zmiennymi, przy użyciu algorytmu gradient descent.

# Cel
Celem ćwiczenia jest wyznaczenie prostej aproksymującej zbiór punktów wygenerowanych na płaszczyźnie kartezjańskiej.
W zadaniu stosujemy metodę największego spadku (gradient descent) do minimalizacji błędu średniokwadratowego (MSE), co pozwala na iteracyjne dostosowywanie wag modelu. Dzięki temu perceptron uczy się aproksymować rzeczywisty przebieg danych.

# Wstęp teoretyczny
W ćwiczeniu wykorzystujemy dwie kluczowe koncepcje:

1. **Perceptron**
   To najprostsza sieć neuronowa, która dla danych wejściowych przyjmuje postać funkcji liniowej:
$$
   h(x) = a \cdot x + b
$$
   gdzie \(a\) jest współczynnikiem kierunkowym, a \(b\) wyrazem wolnym.

2. **Metoda największego spadku (Gradient Descent)**
   Algorytm optymalizacji, który pozwala znaleźć minimum funkcji celu, iteracyjnie aktualizując parametry modelu w kierunku przeciwnym do gradientu.
   Funkcją celu w naszym przypadku jest błąd średniokwadratowy (MSE):
$$
   E = \frac{1}{M} \sum_{i=1}^{M} \left(y_i - h(x_i)\right)^2
$$
   Parametry \(a\) i \(b\) są aktualizowane według reguły:
$$
   w_k = w_{k-1} + \eta \cdot \frac{\partial E}{\partial w}\Bigr|_{w_{k-1}}
$$
   gdzie $\eta$ to współczynnik uczenia (learning rate).


In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# Ustawienia:
np.random.seed(42)  # dla powtarzalności wyników
M = 15  # liczba punktów pomiarowych
eta = 0.01  # współczynnik uczenia (można eksperymentować, np. 0.01 lub 0.05)
delta_threshold = 0.01  # kryterium zakończenia iteracji

In [None]:
# Generowanie danych
# Przyjmujemy, że prawdziwa prosta to: y = 2.0*x + 1.0, a do tego dodajemy niewielki szum
x_data = np.linspace(0, 10, M)
noise = np.random.randn(M) * 1.0  # szum o niewielkiej wariancji
y_data = 2.0 * x_data + 1.0 + noise

In [None]:
# Inicjalizacja parametrów
a = 0.0  # początkowa wartość współczynnika kierunkowego
b = 0.0  # początkowa wartość wyrazu wolnego

# Funkcja aproksymująca:
def h(x, a, b):
    return a * x + b

# Funkcja licząca błąd średniokwadratowy:
def mse(y_true, y_pred):
    return np.mean((y_true - y_pred)**2)

# Obliczamy gradienty błędu względem a i b
def compute_gradients(x, y, a, b):
    M = len(y)
    # Predykcje
    y_pred = h(x, a, b)
    # Obliczamy błędy
    error = y - y_pred
    # Gradienty – pochodne cząstkowe błędu E względem a i b
    grad_a = (2/M) * np.sum(error * x)   # pochodna względem a
    grad_b = (2/M) * np.sum(error)         # pochodna względem b
    return grad_a, grad_b

In [None]:
# Proces uczenia metodą największego spadku
max_iterations = 10000  # maksymalna liczba iteracji, zabezpieczenie przed nieskończoną pętlą
E_prev = mse(y_data, h(x_data, a, b))
iteration = 0

while iteration < max_iterations:
    # Obliczenie gradientów
    grad_a, grad_b = compute_gradients(x_data, y_data, a, b)

    # Aktualizacja parametrów
    a = a + eta * grad_a
    b = b + eta * grad_b

    # Obliczenie nowego błędu
    E_curr = mse(y_data, h(x_data, a, b))

    # Obliczenie różnicy błędów
    delta = abs(E_curr - E_prev)

    # Dla celów diagnostycznych można wypisać postęp co kilka iteracji
    if iteration % 100 == 0:
        print(f"Iteracja {iteration:4d}: E = {E_curr:.4f}, delta = {delta:.4f}, a = {a:.4f}, b = {b:.4f}")

    # Warunek zakończenia pętli
    if delta <= delta_threshold:
        print(f"Zakończono iteracje po {iteration} krokach, delta = {delta:.4f}")
        break

    # Przygotowanie do kolejnej iteracji
    E_prev = E_curr
    iteration += 1

In [None]:
# Wyniki końcowe
print("\nOstateczne parametry prostej:")
print(f"a (współczynnik kierunkowy) = {a:.4f}")
print(f"b (wyraz wolny) = {b:.4f}")

In [None]:
# Wizualizacja wyników
plt.figure(figsize=(8, 6))
plt.scatter(x_data, y_data, color='blue', label='Punkty pomiarowe')
# Generujemy wartości dla linii aproksymującej
x_line = np.linspace(x_data.min()-1, x_data.max()+1, 100)
y_line = h(x_line, a, b)
plt.plot(x_line, y_line, color='red', linewidth=2, label='Prosta aproksymująca')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Aproksymacja linii metodą gradient descent')
plt.legend()
plt.show()

# Wnioski
Ćwiczenie wykazało, że metoda gradient descent jest skutecznym narzędziem do optymalizacji parametrów modelu liniowego.
Dzięki iteracyjnemu dostosowywaniu wag perceptronu udało się znaleźć prostą, która minimalizuje błąd średniokwadratowy między wartościami rzeczywistymi a modelowanymi.
Wyniki eksperymentu potwierdzają zasadność teoretycznych założeń i praktyczną użyteczność podejścia, co czyni je wartościowym narzędziem w analizie i aproksymacji danych.
