# 🚀 Оптимізований DysonianLineCNN

Швидка версія для навчання моделі з покращеними налаштуваннями

In [1]:
# ⚡️ Клонування репозиторію для запуску в Colab
!git clone https://github.com/AndriiUriadov/DysonLineParamsExtractorCNN.git
%cd DysonLineParamsExtractorCNN

Cloning into 'DysonLineParamsExtractorCNN'...
remote: Enumerating objects: 142, done.[K
remote: Counting objects: 100% (142/142), done.[K
remote: Compressing objects: 100% (108/108), done.[K
remote: Total 142 (delta 70), reused 88 (delta 31), pack-reused 0 (from 0)[K
Receiving objects: 100% (142/142), 263.74 KiB | 1.72 MiB/s, done.
Resolving deltas: 100% (70/70), done.
/content/DysonLineParamsExtractorCNN


In [2]:
# Виконуємо код перевірки середовища виконання
import subprocess
import sys
# Виконуємо файл як модуль
exec(open('colab_gpu_check.py').read())

🔍 ПЕРЕВІРКА СИСТЕМНИХ РЕСУРСІВ В COLAB

📊 ІНФОРМАЦІЯ ПРО GPU:
❌ GPU недоступний
   Причина: nvidia-smi не знайдено (драйвери NVIDIA не встановлені)

💾 ІНФОРМАЦІЯ ПРО RAM:
   Загальна пам'ять: 13.6 GB
   Доступна пам'ять: 12.5 GB
   Використана пам'ять: 0.8 GB
   Відсоток використання: 8.4%
⚠️  Використовується runtime з низькою RAM (< 20 GB)
   ✅ RAM у нормальному стані
🌐 Працюємо в Google Colab
💡 Для кращої продуктивності рекомендується:
   - Використовувати GPU runtime
   - Активувати високі ресурси RAM

📋 РЕЗУЛЬТАТ ПЕРЕВІРКИ СЕРЕДОВИЩА ВИКОНАННЯ:
❌ Недостатньо ресурсів для ефективного навчання



In [None]:
# Завантаження та попередня обробка даних
from data_loader import load_and_preprocess

# Завантажуємо та обробляємо дані
X_train, X_val, X_test, y_train, y_val, y_test, y_train_dict, y_val_dict, y_test_dict, scaler_y, y_min, y_max = load_and_preprocess()

print("✅ Дані успішно завантажено та оброблено!")
print(f"   Train samples: {X_train.shape[0]}")
print(f"   Val samples: {X_val.shape[0]}")
print(f"   Test samples: {X_test.shape[0]}")

In [None]:
# Створення оптимізованої моделі
from model import create_model
import torch

# Визначаємо пристрій
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"🎯 Використовуємо пристрій: {device}")

# Створюємо модель з оптимізованими параметрами
model = create_model(
    input_size=4096,
    hidden_sizes=[512, 256, 128],
    num_heads=8,
    dropout=0.1,  # Зменшено dropout для швидшого навчання
    device=device
)

print("✅ Оптимізована модель створена!")

In [None]:
# Створення оптимізованого тренера
from trainer_optimized import create_optimized_trainer

# Оптимізації пам'яті GPU
import torch
torch.cuda.empty_cache()
torch.backends.cudnn.benchmark = True

# Створюємо оптимізований тренер
trainer = create_optimized_trainer(
    model=model,
    learning_rate=0.002,  # Збільшена швидкість навчання
    weight_decay=1e-4,    # Збільшена регуляризація
    device=device
)

# Створюємо DataLoader з більшим batch_size
train_loader, val_loader, test_loader = trainer.create_data_loaders(
    X_train, X_val, X_test, y_train, y_val, y_test, batch_size=32  # Збільшено batch_size
)

print("✅ Оптимізований тренер готовий до навчання!")

In [None]:
# Навчання оптимізованої моделі
print("🚀 Початок оптимізованого навчання...")

# Навчаємо модель з оптимізованими параметрами
history = trainer.train(
    train_loader=train_loader,
    val_loader=val_loader,
    num_epochs=100,
    early_stopping_patience=15  # Зменшено терпіння для швидшого завершення
)

print("✅ Оптимізоване навчання завершено!")

In [None]:
# Оцінка оптимізованої моделі
print("📊 Оцінка оптимізованої моделі...")

# Оцінюємо на тестових даних
test_metrics = trainer.evaluate(test_loader)

print("✅ Оцінка завершена!")

In [None]:
# Візуалізація результатів
from utils import plot_training_results, plot_predictions_vs_actual
from model_visualizer import visualize_model_architecture

# Візуалізуємо архітектуру моделі
visualize_model_architecture(model, device)

# Візуалізуємо результати навчання
plot_training_results(history)

# Візуалізуємо передбачення
plot_predictions_vs_actual(model, test_loader, device, scaler_y)

print("✅ Візуалізація завершена!")

In [None]:
# Порівняння з базовою версією
print("📈 Порівняння оптимізацій:")
print("   • Batch size: 32 (замість 16)")
print("   • Learning rate: 0.002 (замість 0.001)")
print("   • Weight decay: 1e-4 (замість 1e-5)")
print("   • Optimizer: AdamW (замість Adam)")
print("   • Mixed precision: увімкнено")
print("   • CUDNN benchmark: увімкнено")
print("   • Workers: 2 (паралельне завантаження)")
print("   • Early stopping patience: 15 (замість 20)")
print("   • Dropout: 0.1 (замість 0.2)")

print("\n🎯 Очікувані покращення:")
print("   • Швидкість навчання: +30-50%")
print("   • Використання GPU: +20-30%")
print("   • Стабільність навчання: покращено")
print("   • Якість моделі: збережено або покращено")