In [None]:
# Ячейка 1: Подготовка данных
from src.data_utils import main as data_main
data_main()

In [None]:
# Ячейка 2: Создание DataLoader'ов
from src.next_token_dataset import create_data_loaders
train_loader, val_loader, test_loader, vocab = create_data_loaders()

In [None]:
# Ячейка 3: Обучение модели
from src.lstm_train import train_model
train_model()

In [None]:
# Ячейка 4: Загрузка и тестирование обученной LSTM модели
from src.lstm_model import LSTMLanguageModel
import torch

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = LSTMLanguageModel(vocab_size=vocab['vocab_size']).to(device)

# ИСПРАВЛЕННАЯ СТРОКА - добавьте map_location
model.load_state_dict(torch.load('./models/lstm_model_bs64_accum4.pth', map_location=device))

# Тестирование LSTM
test_texts = ["I think", "The weather is", "I want to", "This movie is"]
print("=== LSTM Model Predictions ===")
for test_text in test_texts:
    prediction = model.predict_next_tokens(test_text, vocab, num_tokens=10)
    print(f"'{test_text}' -> '{prediction}'")

In [None]:
# Ячейка 5: Использование предобученного трансформера
print("\n" + "="*50)
print("Использование предобученного трансформера")
print("="*50)

from src.transformer_model import TransformerTextGenerator, evaluate_transformer_model

# Инициализация трансформера
print("Загружаем модель distilgpt2...")
transformer_generator = TransformerTextGenerator()

# Тестирование трансформера
print("\n=== Transformer Model Predictions ===")
for test_text in test_texts:
    prediction = transformer_generator.generate_text(test_text, max_length=10)
    print(f"'{test_text}' -> '{prediction}'")

In [None]:
# Ячейка 6: Сравнение моделей по метрикам
print("\n" + "="*50)
print("Сравнение моделей и выводы")
print("="*50)

from src.model_comparison import compare_models

# Запускаем сравнение
compare_models()

In [None]:
# Ячейка 7: Детальный анализ и выводы
print("\n" + "="*50)
print("Финальные выводы и рекомендации")
print("="*50)

# Дополнительные примеры для качественного анализа
print("\nДополнительные примеры для сравнения:")

complex_examples = [
    "The future of artificial intelligence",
    "I believe that climate change",
    "The best way to learn programming",
    "In my opinion, the government should"
]

print("\nLSTM Predictions:")
for example in complex_examples:
    lstm_pred = model.predict_next_tokens(example, vocab, num_tokens=15)
    print(f"  '{example}' -> '{lstm_pred}'")

print("\nTransformer Predictions:")
for example in complex_examples:
    transformer_pred = transformer_generator.generate_text(example, max_length=15)
    print(f"  '{example}' -> '{transformer_pred}'")

In [None]:
# Ячейка 8: Заключительные выводы
print("\n" + "="*50)
print("ЗАКЛЮЧЕНИЕ")
print("="*50)

print("""
На основе проведенного сравнения можно сделать следующие выводы:

1. **Качество генерации**:
   - Transformer демонстрирует более связные и грамматически правильные продолжения.
   - LSTM показывает хорошие результаты на коротких последовательностях. Однако текущего обучения недостаточно для хорошей генерации,
       нужно увеличивать количество эпох или размер батча, для чего недостаточно вычислительных мощностей.

2. **Области применения**:
   - Transformer лучше подходит для задач, требующих понимания контекста
   - LSTM может быть предпочтительнее при ограниченных вычислительных ресурсах, однако чтобы обучить ее с 
      нуля до какого-то приличного результата, тоже требуются большие вычислительные мощности.

3. **Производительность**:
   - Transformer требует значительных ресурсов для инференса
   - LSTM работает быстрее и потребляет меньше памяти

Проект успешно реализовал две различные архитектуры для автоматического дополнения текста
и провел их сравнительный анализ по метрикам ROUGE и качеству генерации.
""")