In [None]:
# Ячейка 1: Импорты
import sys
import os
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from PIL import Image
import pickle

# Настройка путей
current_dir = os.path.dirname(os.getcwd())
sys.path.append(current_dir)

# Импорты из проекта
from datasets.dataset import PartsDataset, val_transforms

In [None]:
# Ячейка 2: Анализ датасета
# Загрузка данных
dataset = PartsDataset(root_dir='../data/123', transform=val_transforms)

print(f"Общее количество изображений: {len(dataset)}")
print(f"Количество классов: {len(dataset.label_to_idx)}")

# Распределение изображений по классам
class_counts = {}
for i in range(len(dataset)):
    _, label, _ = dataset[i]
    class_name = dataset.idx_to_label[label]
    class_counts[class_name] = class_counts.get(class_name, 0) + 1

print("\nРаспределение по классам:")
for class_name, count in sorted(class_counts.items(), key=lambda x: x[1], reverse=True):
    print(f"{class_name}: {count} изображений")

In [None]:
# Ячейка 3: Визуализация данных
# Показать случайные изображения из разных классов
fig, axes = plt.subplots(3, 5, figsize=(15, 10))
axes = axes.ravel()

for i in range(15):
    idx = np.random.randint(0, len(dataset))
    image, label, img_path = dataset[idx]
    
    # Конвертируем тензор обратно в изображение
    image_np = image.permute(1, 2, 0).numpy()
    image_np = np.clip(image_np, 0, 1)
    
    axes[i].imshow(image_np)
    axes[i].set_title(f"Class: {dataset.idx_to_label[label]}")
    axes[i].axis('off')

plt.tight_layout()
plt.show()

In [None]:
# Ячейка 4: Анализ эмбеддингов
# Загрузка эмбеддингов
embeddings = np.load('../embeddings/embeddings.npy')
labels = np.load('../embeddings/labels.npy')

print(f"Форма эмбеддингов: {embeddings.shape}")
print(f"Форма меток: {labels.shape}")

# Статистика эмбеддингов
print(f"\nСтатистика эмбеддингов:")
print(f"Среднее значение: {np.mean(embeddings):.4f}")
print(f"Стандартное отклонение: {np.std(embeddings):.4f}")
print(f"Минимальное значение: {np.min(embeddings):.4f}")
print(f"Максимальное значение: {np.max(embeddings):.4f}")