In [None]:
import re
import matplotlib.pyplot as plt

# Путь к файлу логов
log_file_path = '/home/ir739wb/ilyarekun/nn_DeiT_25/fbkrep/deit/deit_output.log'

# Списки для хранения данных
epochs = []
train_losses = []
val_losses = []
val_accuracies = []

# Регулярные выражения для извлечения данных
epoch_pattern = r'Epoch: \[(\d+)\]'  # Номер эпохи
train_loss_pattern = r'loss: [\d.]+ \(([\d.]+)\)'  # Средний train loss в скобках
val_metrics_pattern = r'\* Acc@1 ([\d.]+) Acc@5 [\d.]+ loss ([\d.]+)'  # Val accuracy и val loss

# Чтение файла логов
try:
    with open(log_file_path, 'r') as file:
        current_epoch = None
        for line in file:
            # Поиск номера эпохи
            epoch_match = re.search(epoch_pattern, line)
            if epoch_match:
                current_epoch = int(epoch_match.group(1))

            # Поиск train loss (берем только последнее значение эпохи)
            train_loss_match = re.search(train_loss_pattern, line)
            if train_loss_match and current_epoch is not None:
                # Проверяем, что это последняя строка батча в эпохе
                if '[327/328]' in line:  # Предполагаем, что 328 — общее число батчей
                    train_loss = float(train_loss_match.group(1))
                    if current_epoch not in epochs:  # Добавляем только один раз на эпоху
                        epochs.append(current_epoch)
                        train_losses.append(train_loss)

            # Поиск val loss и val accuracy
            val_metrics_match = re.search(val_metrics_pattern, line)
            if val_metrics_match and current_epoch is not None:
                val_accuracy = float(val_metrics_match.group(1))  # Acc@1
                val_loss = float(val_metrics_match.group(2))      # loss
                # Добавляем только если эпоха уже записана в train_losses
                if current_epoch in epochs and len(val_losses) < len(epochs):
                    val_losses.append(val_loss)
                    val_accuracies.append(val_accuracy)

    # Проверка, что данные были извлечены
    if not epochs:
        print("Не удалось найти данные в файле логов. Проверьте путь к файлу или его формат.")
    else:
        # Построение графиков
        plt.figure(figsize=(12, 5))

        # График для train и val loss
        plt.subplot(1, 2, 1)
        plt.plot(epochs, train_losses, label='Train Loss', color='blue')
        plt.plot(epochs, val_losses, label='Val Loss', color='red')
        plt.xlabel('Эпоха')
        plt.ylabel('Loss')
        plt.title('Train и Val Loss')
        plt.legend()

        # График для val accuracy
        plt.subplot(1, 2, 2)
        plt.plot(epochs, val_accuracies, label='Val Accuracy', color='green')
        plt.xlabel('Эпоха')
        plt.ylabel('Accuracy (%)')
        plt.title('Val Accuracy')
        plt.legend()

        # Отображение графиков
        plt.tight_layout()
        plt.show()

except FileNotFoundError:
    print(f"Файл {log_file_path} не найден. Проверьте путь.")
except Exception as e:
    print(f"Произошла ошибка: {e}")

In [None]:
import re
import matplotlib.pyplot as plt

# Путь к файлу логов
log_file_path = '/home/ir739wb/ilyarekun/nn_DeiT_25/fbkrep/deit/deit_output.log'

# Списки для хранения данных
epochs = []
train_losses = []
val_losses = []
val_accuracies = []

# Регулярные выражения для извлечения данных
epoch_pattern = r'Epoch: \[(\d+)\]'  # Номер эпохи
train_loss_pattern = r'Averaged stats: lr: [\d.e-]+  loss: [\d.]+ \(([\d.]+)\)'  # Средний train loss
val_metrics_pattern = r'\* Acc@1 ([\d.]+) Acc@5 [\d.]+ loss ([\d.]+)'  # Val accuracy и val loss

# Чтение файла логов
try:
    with open(log_file_path, 'r') as file:
        current_epoch = None
        for line in file:
            # Поиск номера эпохи
            epoch_match = re.search(epoch_pattern, line)
            if epoch_match:
                current_epoch = int(epoch_match.group(1))

            # Поиск train loss из Averaged stats
            train_loss_match = re.search(train_loss_pattern, line)
            if train_loss_match and current_epoch is not None:
                train_loss = float(train_loss_match.group(1))
                if current_epoch not in epochs:  # Добавляем только один раз на эпоху
                    epochs.append(current_epoch)
                    train_losses.append(train_loss)

            # Поиск val loss и val accuracy
            val_metrics_match = re.search(val_metrics_pattern, line)
            if val_metrics_match and current_epoch is not None:
                val_accuracy = float(val_metrics_match.group(1))  # Acc@1
                val_loss = float(val_metrics_match.group(2))      # loss
                # Добавляем только если эпоха уже записана в train_losses
                if current_epoch in epochs and len(val_losses) < len(epochs):
                    val_losses.append(val_loss)
                    val_accuracies.append(val_accuracy)

    # Проверка, что данные были извлечены
    if not epochs:
        print("Не удалось найти данные в файле логов. Проверьте путь к файлу или его формат.")
    else:
        # Построение графиков
        plt.figure(figsize=(12, 5))

        # График для train и val loss
        plt.subplot(1, 2, 1)
        plt.plot(epochs, train_losses, label='Train Loss', color='blue')
        plt.plot(epochs, val_losses, label='Val Loss', color='red')
        plt.xlabel('Эпоха')
        plt.ylabel('Loss')
        plt.title('Train и Val Loss')
        plt.legend()

        # График для val accuracy
        plt.subplot(1, 2, 2)
        plt.plot(epochs, val_accuracies, label='Val Accuracy', color='green')
        plt.xlabel('Эпоха')
        plt.ylabel('Accuracy (%)')
        plt.title('Val Accuracy')
        plt.legend()

        # Отображение графиков
        plt.tight_layout()
        plt.show()

except FileNotFoundError:
    print(f"Файл {log_file_path} не найден. Проверьте путь.")
except Exception as e:
    print(f"Произошла ошибка: {e}")

In [None]:
%pwd

In [None]:
!dot -V
%pip install graphviz
from graphviz import Digraph

dot = Digraph(comment='DistilledVisionTransformer', format='png')

# Input
dot.node('Input', 'Input Image\n[batch_size, 3, 224, 224]')

# Patch Embedding
dot.node('PatchEmbed', 'Patch Embedding\nConv2d(3, 192, k=16, s=16)\n→ [batch_size, 196, 192]')
dot.edge('Input', 'PatchEmbed')

# Add Tokens
dot.node('Tokens', 'Add [CLS] and [DIST] Tokens\n→ [batch_size, 198, 192]')
dot.edge('PatchEmbed', 'Tokens')

# Positional Embeddings
dot.node('PosEmbed', 'Add Positional Embeddings')
dot.edge('Tokens', 'PosEmbed')

# Positional Dropout
dot.node('PosDrop', 'Positional Dropout (p=0.0)')
dot.edge('PosEmbed', 'PosDrop')

# Transformer Blocks
dot.node('Transformer', 'Transformer Blocks (x12)\nEach: LayerNorm → Attention (3 heads) → DropPath → LayerNorm → MLP (192→768→192, GELU)')
dot.edge('PosDrop', 'Transformer')

# Final Normalization
dot.node('FinalNorm', 'Final LayerNorm')
dot.edge('Transformer', 'FinalNorm')

# Classification Heads
dot.node('CLS', 'Extract [CLS] Token\n(index 0)')
dot.node('DIST', 'Extract [DIST] Token\n(index 1)')
dot.node('Head', 'head\nLinear(192→100)')
dot.node('HeadDist', 'head_dist\nLinear(192→100)')
dot.node('Logits', 'Logits\n[batch_size, 100]')
dot.node('DistLogits', 'Distillation Logits\n[batch_size, 100]')

dot.edge('FinalNorm', 'CLS')
dot.edge('FinalNorm', 'DIST')
dot.edge('CLS', 'Head')
dot.edge('DIST', 'HeadDist')
dot.edge('Head', 'Logits')
dot.edge('HeadDist', 'DistLogits')

# Render
dot.render('deit_architecture', view=True)

In [None]:
# Установка зависимостей
%pip install timm graphviz torch matplotlib numpy

# Импорт библиотек с проверкой версий
try:
    import torch
    import timm
    import matplotlib.pyplot as plt
    import numpy as np
    print(f"PyTorch version: {torch.__version__}")
    print(f"timm version: {timm.__version__}")
except ModuleNotFoundError as e:
    print(f"Ошибка импорта: {e}")
    print("Убедитесь, что все библиотеки установлены:")
    print("  - conda install pytorch torchvision -c pytorch")
    print("  - pip install timm graphviz matplotlib numpy")
    raise

# Загрузка модели
try:
    model = timm.create_model('deit_tiny_distilled_patch16_224', pretrained=True, num_classes=100)
    model.eval()
    print("Модель успешно загружена")
except Exception as e:
    print(f"Ошибка при загрузке модели: {e}")
    raise

# Создание случайного входного изображения
input_image = torch.randn(1, 3, 224, 224)
print("Случайный входной тензор создан:", input_image.shape)

# Пример forward pass (для проверки)
with torch.no_grad():
    output = model(input_image)
    print("Выход модели:", output.shape)

In [None]:
# Get patch embedding output
with torch.no_grad():
    patch_embed_output = model.patch_embed.proj(input_image)  # [1, 192, 14, 14]

# Visualize the first channel
feature_map = patch_embed_output[0, 0].cpu().numpy()
plt.imshow(feature_map, cmap='viridis')
plt.colorbar()
plt.title('Patch Embedding Feature Map (Channel 0)')
plt.show()

In [None]:
# Modify Attention class to store attention weights
class CustomAttention(torch.nn.Module):
    def __init__(self, attn_module):
        super().__init__()
        self.attn = attn_module
        self.last_attn = None

    def forward(self, x):
        x = self.attn(x)
        if hasattr(self.attn, 'last_attn'):
            self.last_attn = self.attn.last_attn
        return x

# Apply to all blocks
for block in model.blocks:
    block.attn = CustomAttention(block.attn)

# Forward pass
with torch.no_grad():
    output = model(input_image)

# Visualize attention map from the first block, first head
attn_map = model.blocks[0].attn.last_attn[0, 0].cpu().numpy()  # [198, 198]
plt.imshow(attn_map, cmap='hot', interpolation='nearest')
plt.colorbar()
plt.title('Attention Map (Block 0, Head 0)')
plt.show()

In [None]:
# Get weights from the first MLP's fc1 layer
weights = model.blocks[0].mlp.fc1.weight.detach().cpu().numpy().flatten()

# Plot histogram
plt.hist(weights, bins=50)
plt.title('Weight Distribution of MLP fc1 (Block 0)')
plt.xlabel('Weight Value')
plt.ylabel('Frequency')
plt.show()