# Пожалуйста, делайте копию на свой Google Drive!

# Сравнение методов сериализации

In [None]:
!pip install onnx onnxruntime



In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
import time
import onnx
import onnxruntime
import pickle
from tqdm import tqdm
from torch.utils.data import Subset
import random
import numpy as np
from scipy import stats
import warnings
warnings.filterwarnings("ignore")

In [None]:
class ComplexCNN(nn.Module):
    def __init__(self):
        super(ComplexCNN, self).__init__()
        self.features = nn.Sequential(
            nn.Conv2d(1, 64, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(64, 64, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(64, 128, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(128, 128, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(128, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(256, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(256, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=2, stride=2),
        )
        self.avgpool = nn.AdaptiveAvgPool2d((1, 1))
        self.classifier = nn.Sequential(
            nn.Linear(256, 512),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(512, 512),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(512, 10),
        )

    def forward(self, x):
        x = self.features(x)
        x = self.avgpool(x)
        x = torch.flatten(x, 1)
        x = self.classifier(x)
        return x

In [None]:
# Загрузка и подготовка данных (оставлено без изменений)
transform = transforms.Compose(
    [transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))]
)
train_set = torchvision.datasets.MNIST(
    root='./data', train=True, download=True, transform=transform
)

num_samples = 1000
indices = random.sample(range(len(train_set)), num_samples)
limited_set = Subset(train_set, indices)
train_loader = torch.utils.data.DataLoader(limited_set, batch_size=4, shuffle=True)

In [None]:
# Обучение модели
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = ComplexCNN().to(device)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters())
n_epoch = 2
sep = "-" * 60

for epoch in range(n_epoch):
    print(sep)
    print(f"Epoch: {epoch}")

    losses = []

    for data in tqdm(train_loader):
        inputs, labels = data[0].to(device), data[1].to(device)
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        losses.append(loss)

    epoch_loss = torch.mean(torch.tensor(losses))
    print(f"\nLoss: {epoch_loss}")
else:
    print(sep)
    print("Обучение завершено")

------------------------------------------------------------
Epoch: 0


100%|██████████| 250/250 [00:29<00:00,  8.61it/s]



Loss: 2.3070297241210938
------------------------------------------------------------
Epoch: 1


100%|██████████| 250/250 [00:28<00:00,  8.64it/s]


Loss: 2.3042705059051514
------------------------------------------------------------
Обучение завершено





In [None]:
# Сохранение модели различными способами

# 1. PyTorch
torch.save(model.state_dict(), "cnn_pytorch.pth")
print("Модель сохранена в формате PyTorch")

# 2. Pickle
with open("cnn_pickle.pkl", "wb") as f:
    pickle.dump(model, f)
print("Модель сохранена в формате Pickle")

# 3. ONNX
dummy_input = torch.randn(1, 1, 28, 28).to(device)
torch.onnx.export(model, dummy_input, "cnn.onnx", verbose=True)
print("Модель сохранена в формате ONNX")

Модель сохранена в формате PyTorch
Модель сохранена в формате Pickle
Модель сохранена в формате ONNX


In [None]:
# Загрузка моделей

def print_load_time(start_time, model):
    print("--------------------------------------------------------")
    print(f"Модель: {model}")
    print(f"Время десереализации: {time.time() - start_time:.6f} секунд")

# 1. PyTorch
start_time = time.time()
pytorch_model = ComplexCNN().to(device)
pytorch_model.load_state_dict(torch.load("cnn_pytorch.pth"))
pytorch_model.eval()
print_load_time(start_time, "PyTorch")

# 2. Pickle
start_time = time.time()
with open("cnn_pickle.pkl", "rb") as f:
    pickle_model = pickle.load(f)
pickle_model.eval()
print_load_time(start_time, "Pickle")

# 3. ONNX
start_time = time.time()
onnx_model = onnx.load("cnn.onnx")
onnx.checker.check_model(onnx_model)
ort_session = onnxruntime.InferenceSession("cnn.onnx")
print_load_time(start_time, "ONNX")

print("\nВсе модели загружены")

--------------------------------------------------------
Модель: PyTorch
Время десереализации: 0.033295 секунд
--------------------------------------------------------
Модель: Pickle
Время десереализации: 0.009754 секунд
--------------------------------------------------------
Модель: ONNX
Время десереализации: 0.073164 секунд

Все модели загружены


In [None]:
def measure_inference_time(model_func, input_tensor, num_iterations=1000):
    times = []
    for _ in range(num_iterations):
        start_time = time.time()
        _ = model_func(input_tensor)
        end_time = time.time()
        times.append(end_time - start_time)
    return times

def bootstrap_analysis(times, num_bootstrap=1000, confidence=0.95):
    means = []
    for _ in range(num_bootstrap):
        sample = np.random.choice(times, size=len(times), replace=True)
        means.append(np.mean(sample))

    mean = np.mean(means)
    ci_lower, ci_upper = np.percentile(means, [(1-confidence)/2 * 100, (1+confidence)/2 * 100])
    return mean, ci_lower, ci_upper

In [None]:
# Подготовка входных данных
input_tensor = torch.randn(1, 1, 28, 28).to(device)
onnx_input = {ort_session.get_inputs()[0].name: input_tensor.cpu().numpy()}

# Измерение времени инференса
original_times = measure_inference_time(model, input_tensor)
pytorch_times = measure_inference_time(pytorch_model, input_tensor)
pickle_times = measure_inference_time(pickle_model, input_tensor)
onnx_times = measure_inference_time(lambda x: ort_session.run(None, onnx_input), onnx_input)

models = ['Original', 'PyTorch', 'Pickle', 'ONNX']
times_list = [original_times, pytorch_times, pickle_times, onnx_times]

In [None]:
max_name_length = max(len(name) for name in models)
for model_name, times_ in zip(models, times_list):
    print(f"Среднее время инференса {model_name:<{max_name_length}}: {np.mean(times_):.6f} секунд")

Среднее время инференса Original: 0.010764 секунд
Среднее время инференса PyTorch : 0.010528 секунд
Среднее время инференса Pickle  : 0.010568 секунд
Среднее время инференса ONNX    : 0.004927 секунд


In [None]:
# Выполнение bootstrap-анализа
sep_1 = "=" * 60
sep_2 = "-" * 60

print(sep_1)
print("Результаты bootstrap-анализа (95% доверительный интервал):")
print(sep_2)
for model_name, times_ in zip(models, times_list):
    mean, ci_lower, ci_upper = bootstrap_analysis(times_)
    print(f"{model_name:<{max_name_length}}: {mean:.6f} секунд ({ci_lower:.6f} - {ci_upper:.6f})")

print()
print(sep_1)
print("Сравнение производительности:")
print(sep_2)
for model_name, times_ in zip(models[1:], times_list[1:]):
    speedup = np.mean(original_times) / np.mean(times_)
    print(f"Ускорение {model_name:<{max_name_length}}: {speedup:.2f}x")

# Статистический тест (t-test) для сравнения с оригинальной моделью
print()
print(sep_1)
print("Статистическая значимость (p-value):")
print(sep_2)
for model_name, times_ in zip(models[1:], times_list[1:]):
    t_stat, p_value = stats.ttest_ind(original_times, times_)
    print(f"{model_name:<{max_name_length}} vs Original: p-value = {p_value}")

Результаты bootstrap-анализа (95% доверительный интервал):
------------------------------------------------------------
Original: 0.010760 секунд (0.010585 - 0.010929)
PyTorch : 0.010525 секунд (0.010349 - 0.010702)
Pickle  : 0.010567 секунд (0.010392 - 0.010739)
ONNX    : 0.004927 секунд (0.004899 - 0.004957)

Сравнение производительности:
------------------------------------------------------------
Ускорение PyTorch : 1.02x
Ускорение Pickle  : 1.02x
Ускорение ONNX    : 2.18x

Статистическая значимость (p-value):
------------------------------------------------------------
PyTorch  vs Original: p-value = 0.053917609493007425
Pickle   vs Original: p-value = 0.103960973130923
ONNX     vs Original: p-value = 0.0
