# Perceptron

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score

## Uczenie perceptronu

Uczenie perceptronu to iteracyjny algorytm dopasowywania wag, majƒÖcy na celu poprawnƒÖ klasyfikacjƒô przyk≈Çad√≥w treningowych. Aktualizacja wag nastƒôpuje tylko wtedy, gdy model pope≈Çni b≈ÇƒÖd.

### Parametry:

- **Learning rate**: $h > 0$ ‚Äì wsp√≥≈Çczynnik uczenia, decydujƒÖcy o wielko≈õci aktualizacji wag.
- **Epochs**: $N \in \mathbb{N}$ ‚Äì liczba pe≈Çnych przej≈õƒá przez zbi√≥r treningowy.
- **Wektor wag poczƒÖtkowych**: $\mathbf{v} \in \mathbb{R}^d$ ‚Äì inicjalizowany losowo lub jako wektor zerowy.

---

### Algorytm uczenia:

Dla ka≈ºdego przyk≈Çadu treningowego $(\mathbf{x}_i, y_i)$, gdzie:
- $\mathbf{x}_i \in \mathbb{R}^d$ ‚Äì wektor cech,
- $y_i \in \{0, 1\}$ ‚Äì etykieta klasowa,

wykonujemy:

1. **Obliczenie wej≈õcia modelu**:

$$
z_i = \mathbf{v}^\top \mathbf{x}_i
$$

czyli iloczynu skalarnego wag i wektora cech.

2. **Predykcja modelu**:

$$
p_i = H(z_i)
$$

gdzie $H(z)$ to funkcja aktywacji Heaviside‚Äôa:

$$
H(z) =
\begin{cases}
1 & \text{je≈õli } z \geq 0 \\\\
0 & \text{w przeciwnym razie}
\end{cases}
$$

3. **Sprawdzenie poprawno≈õci klasyfikacji**:
   - Je≈õli $p_i = y_i$, to przyk≈Çad zosta≈Ç poprawnie sklasyfikowany ‚Äì **brak zmian**.
   - Je≈õli $p_i \ne y_i$, to dokonujemy aktualizacji wag:

$$
\mathbf{v} \leftarrow \mathbf{v} + h \cdot (y_i - p_i) \cdot \mathbf{x}_i
$$

**Intuicja aktualizacji:**
- Gdy $y_i = 1$, $p_i = 0$ ‚Üí dodajemy $h \cdot \mathbf{x}_i$
- Gdy $y_i = 0$, $p_i = 1$ ‚Üí odejmujemy $h \cdot \mathbf{x}_i$

**Uwaga:**  
Korekta wag zmienia warto≈õƒá iloczynu skalarnego proporcjonalnie do normy przyk≈Çadu:

$$
(\mathbf{v} \pm h \cdot \mathbf{x}_i)^\top \mathbf{x}_i = \mathbf{v}^\top \mathbf{x}_i \pm h \cdot \|\mathbf{x}_i\|^2
$$


In [None]:
"""Funkcja Heaviside'a."""
def heaviside(x):
    return np.where(x >= 0, 1, 0)

"""Perceptron"""
class Perceptron():
    def __init__(self, learning_rate=0.1, epochs=20):
        self.learning_rate = learning_rate
        self.epochs = epochs
        self.weights = None

    def predict(self, X):
        return heaviside(np.dot(X, self.weights))

    def fit(self, X, y):
        n_samples, n_features = X.shape
        self.weights = np.random.randn(n_features)

        for _ in range(self.epochs):
            for idx, x_i in enumerate(X):
                y_predicted = heaviside(np.dot(x_i, self.weights))

                update = self.learning_rate * (y[idx] - y_predicted)
                self.weights += update * x_i

    def accuracy(self, X, y):
        y_pred = self.predict(X)
        return np.mean(y_pred == y)


In [None]:
def wizualizacja(X, y, perceptron):
    # Trenowanie perceptronu
    perceptron.fit(X, y)
    acc = perceptron.accuracy(X, y)

    # Wizualizacja wynik√≥w z kolejnymi barierami decyzyjnymi
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.02), np.arange(y_min, y_max, 0.02))

    plt.figure(figsize=(6, 6))

    # Ostateczna bariera decyzyjna
    Z = perceptron.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    plt.contourf(xx, yy, Z, alpha=0.8, cmap=plt.cm.Paired)

    # Punkty danych
    plt.scatter(X[:, 0], X[:, 1], c=y, edgecolors='k', marker='o')
    plt.axhline(0, color='black', linewidth=1, linestyle='-')
    plt.axvline(0, color='black', linewidth=1, linestyle='-')
    plt.grid(True, which='both', linestyle='--', linewidth=0.5, alpha=0.7)
    plt.title(f'Klasyfikacja perceptronem\nAccuracy: {acc:.2f}')
    plt.show()

perceptron_no_bias = Perceptron(learning_rate=0.1, epochs=100)

# Generowanie prostych danych
e=0.2
np.random.seed(42)
X = np.random.randn(500, 2)
y = np.array([1 if x[0] + x[1]> np.random.normal(loc=0, scale=e) else 0 for x in X])
wizualizacja(X,y, perceptron_no_bias)


# sytuacja gdy nie ma separowalno≈õci przez liniƒô przechodzƒÖcƒÖ przez zero
y = np.array([1 if x[0] + x[1]+1> np.random.normal(loc=0, scale=e) else 0 for x in X])
wizualizacja(X,y, perceptron_no_bias)

## Rozszerzanie przestrzeni danych by umo≈ºliwiƒá barierƒô postaci
$$
v^Tx+b \leq 0
$$

Rozszerzamy dane z $x$ do $(x,1)$, i na takich rozszerzonych stosujemy model.
W praktyce wagi modelu majƒÖ dodatkowƒÖ wsp√≥≈ÇrzƒôdnƒÖ, nazywamy jƒÖ bias.

Wtedy pojawia siƒô update zar√≥wno dla $v$ jak i $b$:
$$
update=h\cdot (y_i -predicted(x_i))
$$
i
$$
weights=weights+h \cdot update \cdot x_i, \, bias=bias+h\cdot update.
$$

In [None]:
class PerceptronBias():
    def __init__(self, learning_rate=0.1, epochs=20):
        self.learning_rate = learning_rate
        self.epochs = epochs
        self.weights = None
        self.bias = None

    def predict(self, X):
        return heaviside(np.dot(X, self.weights) + self.bias)

    def fit(self, X, y):
        n_samples, n_features = X.shape
        self.weights = np.random.randn(n_features)
        self.bias = np.random.rand()

        for _ in range(self.epochs):
            for idx, x_i in enumerate(X):
                y_predicted = heaviside(np.dot(x_i, self.weights) + self.bias)

                update = self.learning_rate * (y[idx] - y_predicted)
                self.weights += update * x_i
                self.bias += update * 1

    def accuracy(self, X, y):
        y_pred = self.predict(X)
        return np.mean(y_pred == y)

perceptron_bias = PerceptronBias(learning_rate=0.1, epochs=100)

# Generowanie prostych danych
e=0.2
np.random.seed(0)

X = np.random.randn(500, 2)
y = np.array([1 if x[0] + x[1] +1> np.random.normal(loc=0, scale=e) else 0 for x in X])
wizualizacja(X,y, perceptron_bias)

M√≥wimy, ≈ºe zbiory $X_0,X_1 \subset \mathbb{R}^n$ sƒÖ separowalne liniowo, je≈ºeli istnieje $v \in \mathbb{R}^n$ i skalar $b$ taki, ≈ºe
$$
v^TX_0+b <0, \, v^T X_1+b > 0
$$
Inaczej m√≥wiƒÖc dla ka≈ºdego $x_i$ mamy
$$
H(v^T x_i+b)=y_i.
$$

Przyk≈Çad zbioru nie separwoalnego liniowo (rozdzielamy O od X):
$$
\begin{array}{cc}
OX \\
XO
\end{array}
$$

*Twierdzenie* Je≈ºeli zbiory sƒÖ separowalne liniowo, to algorytm uczenia perceptronu jest zbie≈ºny do prawid≈Çowego rozwiƒÖzania kt√≥re rozdziela klasy.


# A co je≈õli nie da siƒô rozdzieliƒá za pomocƒÖ liniowego modelu?


In [None]:
perceptron = PerceptronBias(learning_rate=0.1, epochs=100)

# a co je≈ºeli ko≈Ço?
y = np.array([1 if x[0]**2 + x[1]**2 > 1+np.random.normal(loc=0, scale=e) else 0 for x in X])
wizualizacja(X,y, perceptron)

# moons
from sklearn.datasets import make_moons
X, y = make_moons(n_samples=300, noise=0.2, random_state=42)
wizualizacja(X,y, perceptron)

# Zanurzanie w przestrze≈Ñ wysoko wymiarowƒÖ
Rozszerzamy przestrze≈Ñ z wej≈õciowej przestrzeni o wiƒôcej cech. Losowo wybrane - wybieramy losowƒÖ macierz o du≈ºym wymiarze i losowy bias, i obk≈Çadamy jakƒÖ≈õ nieliniowo≈õciƒÖ, na przyk≈Çad funkcjƒÖ $relu(x)=\max(0,x)$ albo $\tanh(x)$:

$$
x \to ReLU(Wx+b)
$$

In [None]:
# F to zanurzenie w wiekszƒÖ przestrze≈Ñ -- reprezentacja

"""Perceptron z reprezentacjƒÖ i augmentacjƒÖ"""
class PerceptronRep:
    def __init__(self, learning_rate=0.1, epochs=400):
        self.learning_rate = learning_rate
        self.epochs = epochs
        self.weights = None
        self.bias=None

    def predict(self, x, F):
        return heaviside(np.dot(F(x), self.weights) + self.bias)

    def fit(self, X, y, F):
        n_features = len(F(X[0]))
        self.weights = np.random.randn(n_features)
        self.bias = np.random.rand()

        for _ in range(self.epochs):
            for idx, x_i in enumerate(X):
                noise=np.random.randn(len(x_i))
                y_predicted = heaviside(np.dot(F(x_i), self.weights) + self.bias)

                update = self.learning_rate * (y[idx] - y_predicted)
                self.weights += update * F(x_i)
                self.bias += update

    def accuracy(self, X, y, F):
        s=0
        S=0
        for idx, x_i in enumerate(X):
          s+=(heaviside(np.dot(F(x_i), self.weights) + self.bias) == y[idx])
          S+=1
        return s/S


def wizualizacjaRep(X_train,y_train,X_test,y_test, F):
  # Trenowanie perceptronu
  perceptron = PerceptronRep(learning_rate=1, epochs=100)
  perceptron.fit(X_train, y_train, F)
  acc_train = perceptron.accuracy(X_train, y_train, F)
  acc_test = perceptron.accuracy(X_test, y_test, F)

  # Wizualizacja wynik√≥w z kolejnymi barierami decyzyjnymi
  x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
  y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
  xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.02), np.arange(y_min, y_max, 0.02))

  plt.figure(figsize=(6, 6))

  # Ostateczna bariera decyzyjna
  Z = perceptron.predict(np.c_[xx.ravel(), yy.ravel()],F)
  Z = Z.reshape(xx.shape)
  plt.contourf(xx, yy, Z, alpha=0.8, cmap=plt.cm.Paired)

  # Punkty danych
  plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, edgecolors='k', marker='x',alpha=0.7)
  plt.scatter(X_test[:, 0], X_test[:, 1], c=y_test, edgecolors='k', marker='o')
  plt.axhline(0, color='black', linewidth=1, linestyle='-')
  plt.axvline(0, color='black', linewidth=1, linestyle='-')
  plt.grid(True, which='both', linestyle='--', linewidth=0.5, alpha=0.7)
  plt.title(f'Klasyfikacja perceptronem \nAccuracy train: {acc_train:.2f} test:{acc_test:.2f}')
  plt.show()


"""
Zanurzanie w przestrzeni wielowymiarowej
liniowe ob≈Ço≈ºone nieliniowo≈õciami
"""
dim=50
W = np.random.randn(2, dim)  # Macierz zanurzenia
b=np.random.randn(dim) # bias

# nieliniowo≈õƒá
def relu(x):
    return np.maximum(0, x)

# kluczowa funkcja zanurzajƒÖca w wiƒôkszƒÖ przestrze≈Ñ
def F(X):
  return relu(b+np.dot(X,W))

# Tworzenie zbioru danych Moon
np.random.seed(42)

N=100
N_train=N//2
from sklearn.datasets import make_moons

X, y = make_moons(n_samples=N, noise=0.2, random_state=42)

X_train=X[:N_train]
X_test=X[N_train:]
y_train=y[:N_train]
y_test=y[N_train:]

np.random.seed(None)

wizualizacjaRep(X_train,y_train,X_test,y_test,F)


# üß† Zadanie ‚Äì Rak Piersi (Breast Cancer Classification)

Twoim zadaniem jest klasyfikacja danych z zestawu **Breast Cancer** na podstawie dw√≥ch cech:

- `mean radius`
- `mean texture`

RozwiƒÖzanie wykonamy na dwa sposoby:

1. Implementacja w≈Çasnego perceptronu  
2. U≈ºycie gotowego modelu perceptronu z `sklearn.linear_model`

In [None]:
from sklearn.datasets import load_breast_cancer

# Wczytanie danych
data = load_breast_cancer()
X = data.data[:, [0, 1]]  # tylko dwie cechy (mean radius, mean texture)

y = data.target

# Zamiana etykiet na -1 i 1
y = np.where(y == 0, -1, 1)

X_test=X[400:];
y_test=y[400:]
X=X[:400]
y=y[:400]

# Wizualizacja
plt.scatter(X[:, 0], X[:, 1], c=y, cmap='bwr', edgecolor='k')
plt.xlabel(data.feature_names[0])
plt.ylabel(data.feature_names[1])
plt.title("Dane wej≈õciowe: Breast Cancer")
plt.show()

# Wizualizacja granicy decyzyjnej
def plot_decision_boundary(X, y, model):
    # Zakres danych
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1

    # Siatka punkt√≥w
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.02),
                         np.arange(y_min, y_max, 0.02))

    # Predykcja dla ka≈ºdego punktu siatki
    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    # Wykres
    plt.contourf(xx, yy, Z, alpha=0.4, cmap='bwr')
    plt.scatter(X[:, 0], X[:, 1], c=y, cmap='bwr', edgecolor='k')
    plt.xlabel(data.feature_names[0])
    plt.ylabel(data.feature_names[1])
    plt.title("Perceptron - granica decyzyjna")
    plt.show()

In [None]:
class Perceptron:
    def __init__(self, learning_rate=0.01, n_iters=1000):
        self.lr = learning_rate
        self.n_iters = n_iters
        self.weights = None
        self.bias = None

    def fit(self, X, y):
        pass

    def predict(self, X):
        linear_output = np.dot(X, self.weights) + self.bias
        return np.sign(linear_output)

# Trenowanie perceptronu
perceptron = Perceptron(learning_rate=0.01, n_iters=1000)
perceptron.fit(X, y)



In [None]:
# Wizualizacja
plot_decision_boundary(X_test, y_test, perceptron)

# Dok≈Çadno≈õƒá
y_pred = perceptron.predict(X)
accuracy = np.mean(y_pred == y)
print(f"Dok≈Çadno≈õƒá perceptronu: {accuracy:.2f}")

In [None]:
# Twoja implementacja z u≈ºyciem perceptronu z SKLEARNt

## Klasyfikacja danych w kszta≈Çcie k√≥≈Ç za pomocƒÖ perceptronu

W tym zadaniu wykorzystamy **perceptron** do klasyfikacji danych, kt√≥re uk≈ÇadajƒÖ siƒô w **koncentryczne ko≈Ça**. Celem jest sprawdzenie, jak klasyczny perceptron radzi sobie z danymi, kt√≥re nie sƒÖ liniowo separowalne.

### Kroki:
1. Wygeneruj dane w kszta≈Çcie k√≥≈Ç za pomocƒÖ `make_circles` z biblioteki `sklearn.datasets`.
2. Wy≈õwietl dane na wykresie.
3. Zaimplementuj perceptron lub u≈ºyj gotowego z `sklearn.linear_model`.
4. Przeprowad≈∫ trening modelu na danych.
5. Oce≈Ñ skuteczno≈õƒá modelu i zinterpretuj wyniki.


In [None]:
from sklearn.datasets import make_circles

X,y=make_circles(random_state=42)