# 🧠 Модуль 2. Обучение с учителем. Задача классификации

В этом модуле мы изучим основы классификации, персептрон, адаптивный линейный нейрон, методы обучения, и проведем практику с реальными данными.

## 🔹 1. Понятие нейронной сети
Нейронная сеть — это математическая модель, вдохновлённая мозгом. Она состоит из «нейронов», которые принимают входы, применяют веса и активационную функцию.

## 🔹 2. Персептрон — реализация

In [12]:
!pip install scikit-learn
!pip install matplotlib

Defaulting to user installation because normal site-packages is not writeable



[notice] A new release of pip is available: 24.2 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Defaulting to user installation because normal site-packages is not writeable



[notice] A new release of pip is available: 24.2 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [15]:
from sklearn.linear_model import Perceptron
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import matplotlib.pyplot as plt

X, y = make_classification(n_samples=200, n_features=2, n_informative=1, 
                          n_redundant=0, n_repeated=0, n_classes=2, 
                          n_clusters_per_class=1, random_state=1)


X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

clf = Perceptron()
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
print("Точность на тесте:", accuracy_score(y_test, y_pred))

Точность на тесте: 0.9666666666666667


## 🔹 3. Адаптивный линейный нейрон (Adaline)

In [17]:
import numpy as np

class AdalineGD:
    def __init__(self, eta=0.01, n_iter=50):
        self.eta = eta
        self.n_iter = n_iter

    def fit(self, X, y):
        self.w_ = np.zeros(1 + X.shape[1])
        self.cost_ = []

        for _ in range(self.n_iter):
            net_input = self.net_input(X)
            output = self.activation(net_input)
            errors = y - output
            self.w_[1:] += self.eta * X.T.dot(errors)
            self.w_[0] += self.eta * errors.sum()
            cost = (errors**2).sum() / 2.0
            self.cost_.append(cost)
        return self

    def net_input(self, X):
        return np.dot(X, self.w_[1:]) + self.w_[0]

    def activation(self, X):
        return X

    def predict(self, X):
        return np.where(self.activation(self.net_input(X)) >= 0.0, 1, -1)

## 🔹 4–5. Градиентный и стохастический градиентный спуск

In [18]:
from sklearn.linear_model import SGDClassifier
sgd = SGDClassifier(loss='perceptron', learning_rate='constant', eta0=0.01, max_iter=1000)
sgd.fit(X_train, y_train)
print("SGD точность:", sgd.score(X_test, y_test))

SGD точность: 0.8833333333333333


## 🔹 6. Динамическое обучение (на потоковых данных)

SGDClassifier может использовать `partial_fit`, чтобы подгружать данные частями. Это позволяет обучать модель на больших датасетах без загрузки всего в память.

## 🔹 7. Практика с реальным набором данных (Breast Cancer)

In [19]:
from sklearn.datasets import load_breast_cancer
from sklearn.preprocessing import StandardScaler

data = load_breast_cancer()
X, y = data.data, data.target
X = StandardScaler().fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)

model = SGDClassifier(loss="log_loss", max_iter=1000, tol=1e-3)
model.fit(X_train, y_train)
print("Точность на тесте:", model.score(X_test, y_test))

Точность на тесте: 0.9824561403508771


## ✅ Выводы
- Персептрон подходит для линейных задач
- Adaline обучается через градиентный спуск
- SGD полезен для больших наборов
- Использование scikit-learn делает запуск моделей простым