In [1]:
import torch
from torchvision import transforms
from torch.utils.data import DataLoader
import numpy as np

### Нормализация данных в PyTorch

In [2]:
# Создание примера набора данных

class CustomDataset(torch.utils.data.Dataset):
    def __init__(self, data):
        self.data = data

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return self.data[idx]

# Генерация примера данных
data = np.random.randn(100, 3)  # Пример входных данных размерности 100x3

# Преобразование numpy массива в тензор
data = torch.tensor(data, dtype=torch.float32)

# -- Вариант 1 --

# Считаем среднее и std:

means = data.mean(dim=0, keepdim=True)
stds = data.std(dim=0, keepdim=True)
normalized_data = (data - means) / stds

# Создание экземпляра Dataset
dataset = CustomDataset(normalized_data)

# -- Вариант 2 --

# Создание экземпляра Dataset
dataset = CustomDataset(data)

# Применение нормализации с использованием torchvision.transforms
transform = transforms.Compose([transforms.Normalize(mean=data.mean(dim=0), std=data.std(dim=0))])

# Применение преобразования к набору данных
dataset.transform = transform

# Использование DataLoader для итерации по нормализованным данным
dataloader = DataLoader(dataset, batch_size=4, shuffle=True)

### Инициализация весов в PyTorch

In [None]:
import torch
import torch.nn as nn

# Задаем размерности входа и выхода для линейного слоя
input_size = 64
output_size = 128

# Создаем линейный слой
linear_layer = nn.Linear(input_size, output_size)


# Применяем Xavier инициализацию к весам этого слоя
nn.init.xavier_uniform_(linear_layer.weight)

# Применяем He инициализацию к весам этого слоя с равномерным распределением
nn.init.kaiming_uniform_(model.fc.weight, mode='fan_in', nonlinearity='relu')

# Применяем He инициализацию к весам этого слоя с нормальным распределением
nn.init.kaiming_normal_(model.fc.weight, mode='fan_in', nonlinearity='relu')

### Weight decay в PyTorch

In [None]:
#Задаем оптимизатор с параметром weight_decay (для применения L2 регуляризации)

optimizer = optim.SGD(model.parameters(), lr=0.01, weight_decay=0.001)

### Gradient Clipping в PyTorch

In [None]:
# Мы пользуемся методами clip_grad_norm_() или clip_grad_value_() для ограничения нормы градиентов или их значений.

import torch
import torch.nn as nn

# Создаем модель
model = nn.Sequential(
    nn.Linear(10, 5),
    nn.ReLU(),
    nn.Linear(5, 1)
)

# Определяем функцию потерь
criterion = nn.MSELoss()

# Задаем оптимизатор
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# Задаем параметры gradient clipping
max_grad_norm = 1.0  # Максимальная допустимая норма градиентов
clip_type = 'norm'  # Может быть 'norm' или 'value'

# Пример обучения с gradient clipping
inputs = torch.randn(1, 10)
targets = torch.randn(1, 1)

# Прямой проход
outputs = model(inputs)
loss = criterion(outputs, targets)

# Обратное распространение ошибки
optimizer.zero_grad()
loss.backward()

# Применение gradient clipping
if clip_type == 'norm':
    torch.nn.utils.clip_grad_norm_(model.parameters(), max_grad_norm)
elif clip_type == 'value':
    torch.nn.utils.clip_grad_value_(model.parameters(), max_grad_norm)

# Обновление весов
optimizer.step()



### Dropout в PyTorch

In [None]:
# Пример архитектуры с Dropout-слоями

class ExampleModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.layer1 = nn.Linear(60, 60)
        self.act1 = nn.ReLU()
        self.dropout1 = nn.Dropout(0.2)
        self.layer2 = nn.Linear(60, 30)
        self.act2 = nn.ReLU()
        self.dropout2 = nn.Dropout(0.2)
        self.output = nn.Linear(30, 1)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.act1(self.layer1(x))
        x = self.dropout1(x)
        x = self.act2(self.layer2(x))
        x = self.dropout2(x)
        x = self.sigmoid(self.output(x))
        return x

### BatchNorm в PyTorch

In [None]:
# Слой BatchNorm
m = nn.BatchNorm2d(num_features=100)

input = torch.randn(20, 100, 35, 45)
output = m(input)