<a href="https://colab.research.google.com/github/VakhromeevaKate/sechenov-ai-methods-course/blob/main/Scipy_Keras_PyTorch.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Scikit-learn, TensorFlow, Keras и PyTorch для Машинного Обучения



## 1.Scikit-learn — для классического ML

### Зачем он используется?

Scikit-learn — это библиотека для классического машинного обучения. Она идеальна для работы с структурированными данными (таблицами). Ее основные задачи:

- Обучение с учителем (классификация, регрессия)

- Обучение без учителя (кластеризация, снижение размерности)

- Предобработка данных, выбор моделей, оценка качества.

Ключевые принципы:

Единый API: У всех моделей есть методы .fit(), .predict(), .score().

Конвейеры (Pipelines): Позволяют объединить этапы предобработки и моделирования в одну цепочку.

Основные методы и модули:

- sklearn.model_selection.train_test_split — разделение данных на обучающую и тестовую выборки.

- sklearn.preprocessing (StandardScaler, LabelEncoder) — предобработка данных.

- sklearn.linear_model (LogisticRegression, LinearRegression) — линейные модели.

- sklearn.ensemble (RandomForestClassifier, GradientBoostingRegressor) — ансамбли (одни из лучших "готовых" моделей).

- sklearn.metrics (accuracy_score, classification_report) — метрики для оценки качества.




In [1]:
# Пример: классификация ирисов Фишера
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Загрузка данных
iris = load_iris()
X, y = iris.data, iris.target

# Разделение на тренировочную и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Создание и обучение модели
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Предсказание и оценка
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

print(f"Точность модели: {accuracy:.2f}")

Точность модели: 1.00


## TensorFlow — вычислительный движок для численных задач

### Зачем он используется?
TensorFlow (TF) — это низкоуровневая библиотека для численных вычислений с акцентом на глубокое обучение. Ее главная сила:

- Создание и обучение нейронных сетей любой сложности.
- Работа на CPU, GPU и TPU для ускорения вычислений.

Использование вычислительных графов (хотя в TF 2.x это скрыто за простым API).

Ключевые концепции:
- Тензоры (Tensors): Многомерные массивы — основная единица данных в TF.
- Графы (Graphs): Раньше нужно было явно строить граф операций. Сейчас это делается автоматически в режиме Eager Execution ("жадное выполнение"), что делает код интуитивно понятным.

In [2]:
# Пример: Умножение тензоров

import tensorflow as tf

# Создание тензоров
a = tf.constant([[1, 2], [3, 4]])
b = tf.constant([[5, 6], [7, 8]])

# Матричное умножение (основа многих операций в НС)
c = tf.matmul(a, b)

print("Результат умножения матриц:")
print(c.numpy()) # .numpy() преобразует тензор TF в массив NumPy

# Вывод:
# [[19 22]
#  [43 50]]

Результат умножения матриц:
[[19 22]
 [43 50]]


## Keras — высокоуровневый API для глубокого обучения

### Зачем он используется?
Keras — это высокоуровневый API, который теперь является стандартной частью TensorFlow (tf.keras). Он создан для быстрого прототипирования нейронных сетей. Его девиз: "Быстрые эксперименты с глубоким обучением".

Почему он популярен:
- Простота и удобство чтения: Позволяет описывать сложные сети в несколько строк кода.
- Модульность: Модель собирается как конструктор из "блоков" (слоев).
- Работает поверх бэкендов: Изначально работал с TF, Theano, CNTK, сейчас — часть TF.

Ключевые методы и концепции:
- Sequential API: Простейший способ построения модели "слой за слоем".
- Функциональный API: Для построения более сложных моделей (например, с несколькими входами/выходами).
- Слои (Layers): Dense (полносвязный), Conv2D (сверточный), LSTM (рекуррентный).
- Компиляция модели: model.compile() — здесь задаются оптимизатор, функция потерь и метрики.
- Обучение: model.fit() — основной метод для обучения.

In [3]:
# Нейронная сеть для классификации одежды (Fashion-MNIST)
import tensorflow as tf
from tensorflow.keras import layers, models

# 1. Загрузка и подготовка данных
fashion_mnist = tf.keras.datasets.fashion_mnist
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

# Нормализация данных (приводим значения пикселей к диапазону [0, 1])
X_train, X_test = X_train / 255.0, X_test / 255.0

# 2. Построение модели с помощью Sequential API
model = models.Sequential([
    layers.Flatten(input_shape=(28, 28)), # Преобразует изображение 28x28 в вектор из 784 элементов
    layers.Dense(128, activation='relu'), # Полносвязный слой со 128 нейронами и функцией активации ReLU
    layers.Dropout(0.2),                  # Слой Dropout для борьбы с переобучением
    layers.Dense(10, activation='softmax') # Выходной слой с 10 нейронами (по числу классов) и softmax
])

# 3. Компиляция модели
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 4. Обучение модели
history = model.fit(X_train, y_train, epochs=5, validation_split=0.2)

# 5. Оценка на тестовых данных
test_loss, test_acc = model.evaluate(X_test, y_test, verbose=2)
print(f"\nТочность на тестовой выборке: {test_acc}")

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
[1m29515/29515[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
[1m26421880/26421880[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
[1m5148/5148[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
[1m4422102/4422102[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step


  super().__init__(**kwargs)


Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 6ms/step - accuracy: 0.7486 - loss: 0.7084 - val_accuracy: 0.8537 - val_loss: 0.4063
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 5ms/step - accuracy: 0.8494 - loss: 0.4199 - val_accuracy: 0.8574 - val_loss: 0.3843
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 5ms/step - accuracy: 0.8652 - loss: 0.3717 - val_accuracy: 0.8672 - val_loss: 0.3685
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 5ms/step - accuracy: 0.8684 - loss: 0.3559 - val_accuracy: 0.8682 - val_loss: 0.3574
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 5ms/step - accuracy: 0.8777 - loss: 0.3314 - val_accuracy: 0.8783 - val_loss: 0.3375
313/313 - 1s - 3ms/step - accuracy: 0.8674 - loss: 0.3722

Точность на тестовой выборке: 0.8673999905586243


## PyTorch — гибкий фреймворк для исследований

### Зачем он используется?
PyTorch — это фреймворк для глубокого обучения, который сочетает в себе высокую производительность и гибкость. Изначально создавался для научных исследований.

Его главные преимущества:
- Императивный стиль (Imperative): Код выполняется построчно, как обычный Python ("define-by-run").
- Динамические графы вычислений: Граф строится на лету во время выполнения операций, что обеспечивает невероятную гибкость.
- Тесная интеграция с Python: Ощущается как продолжение Python, а не как отдельный язык.
- Отличная поддержка GPU и обширное сообщество.

Ключевые концепции:
- Тензоры (Tensors): Аналогично TF, но с более "питоновским" API.
- Autograd: Автоматическое дифференцирование — PyTorch сам вычисляет градиенты.
- Модули (torch.nn.Module): Базовый класс для создания моделей.
- Оптимизаторы (torch.optim): Алгоритмы оптимизации для обучения.

In [5]:
# Пример: Та же нейронная сеть для Fashion-MNIST на PyTorch

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, random_split
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt

# 1. Определение архитектуры модели
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 128),
            nn.ReLU(),
            nn.Dropout(0.2),
            nn.Linear(128, 10)
        )

    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits

# 2. Загрузка и подготовка данных
def load_data():
    # Преобразования для данных
    transform = transforms.Compose([
        transforms.ToTensor(),  # Конвертируем в тензор и нормализуем к [0, 1]
        transforms.Normalize((0.5,), (0.5,))  # Нормализуем к [-1, 1]
    ])

    # Загрузка датасета Fashion-MNIST
    train_dataset = torchvision.datasets.FashionMNIST(
        root='./data',
        train=True,
        download=True,
        transform=transform
    )

    test_dataset = torchvision.datasets.FashionMNIST(
        root='./data',
        train=False,
        download=True,
        transform=transform
    )

    # Разделение тренировочных данных на обучение и валидацию
    train_size = int(0.8 * len(train_dataset))
    val_size = len(train_dataset) - train_size
    train_subset, val_subset = random_split(train_dataset, [train_size, val_size])

    # Создание DataLoader'ов для батчевой обработки
    train_loader = DataLoader(train_subset, batch_size=64, shuffle=True)
    val_loader = DataLoader(val_subset, batch_size=64, shuffle=False)
    test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

    return train_loader, val_loader, test_loader

# 3. Функция для одного шага обучения
def train_epoch(model, train_loader, loss_fn, optimizer, device):
    model.train()
    total_loss = 0
    correct = 0
    total = 0

    for batch, (X, y) in enumerate(train_loader):
        X, y = X.to(device), y.to(device)

        # Прямой проход
        pred = model(X)
        loss = loss_fn(pred, y)

        # Обратный проход
        optimizer.zero_grad()  # Обнуляем градиенты
        loss.backward()        # Вычисляем градиенты
        optimizer.step()       # Обновляем веса

        total_loss += loss.item()
        _, predicted = torch.max(pred.data, 1)
        total += y.size(0)
        correct += (predicted == y).sum().item()

    accuracy = 100 * correct / total
    avg_loss = total_loss / len(train_loader)
    return avg_loss, accuracy

# 4. Функция для валидации
def validate(model, val_loader, loss_fn, device):
    model.eval()
    total_loss = 0
    correct = 0
    total = 0

    with torch.no_grad():  # Отключаем вычисление градиентов для валидации
        for X, y in val_loader:
            X, y = X.to(device), y.to(device)
            pred = model(X)
            loss = loss_fn(pred, y)

            total_loss += loss.item()
            _, predicted = torch.max(pred.data, 1)
            total += y.size(0)
            correct += (predicted == y).sum().item()

    accuracy = 100 * correct / total
    avg_loss = total_loss / len(val_loader)
    return avg_loss, accuracy

# 5. Основной процесс обучения
def main():
    # Проверяем доступность GPU
    device = "cuda" if torch.cuda.is_available() else "cpu"
    print(f"Используется устройство: {device}")

    # Загрузка данных
    train_loader, val_loader, test_loader = load_data()

    # Инициализация модели
    model = NeuralNetwork().to(device)
    loss_fn = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=1e-3)

    print("Начало обучения...")

    # Цикл обучения
    for epoch in range(5):
        # Обучение на одной эпохе
        train_loss, train_acc = train_epoch(model, train_loader, loss_fn, optimizer, device)

        # Валидация
        val_loss, val_acc = validate(model, val_loader, loss_fn, device)

        print(f"Epoch {epoch+1}/5:")
        print(f"  Train Loss: {train_loss:.4f}, Train Acc: {train_acc:.2f}%")
        print(f"  Val Loss: {val_loss:.4f}, Val Acc: {val_acc:.2f}%")
        print("-" * 50)

    # 6. Тестирование на тестовой выборке
    test_loss, test_acc = validate(model, test_loader, loss_fn, device)
    print(f"\nРезультат на тестовой выборке:")
    print(f"Test Loss: {test_loss:.4f}, Test Accuracy: {test_acc:.2f}%")

# Запуск основной программы
if __name__ == "__main__":
    main()

Используется устройство: cpu


100%|██████████| 26.4M/26.4M [00:01<00:00, 17.0MB/s]
100%|██████████| 29.5k/29.5k [00:00<00:00, 271kB/s]
100%|██████████| 4.42M/4.42M [00:00<00:00, 5.00MB/s]
100%|██████████| 5.15k/5.15k [00:00<00:00, 6.87MB/s]


Начало обучения...
Epoch 1/5:
  Train Loss: 0.5553, Train Acc: 79.90%
  Val Loss: 0.4153, Val Acc: 84.47%
--------------------------------------------------
Epoch 2/5:
  Train Loss: 0.4220, Train Acc: 84.68%
  Val Loss: 0.3913, Val Acc: 85.46%
--------------------------------------------------
Epoch 3/5:
  Train Loss: 0.3881, Train Acc: 85.82%
  Val Loss: 0.3671, Val Acc: 86.32%
--------------------------------------------------
Epoch 4/5:
  Train Loss: 0.3660, Train Acc: 86.66%
  Val Loss: 0.3471, Val Acc: 87.07%
--------------------------------------------------
Epoch 5/5:
  Train Loss: 0.3466, Train Acc: 87.30%
  Val Loss: 0.3363, Val Acc: 87.74%
--------------------------------------------------

Результат на тестовой выборке:
Test Loss: 0.3682, Test Accuracy: 86.73%
