Этот репозиторий создан для обучения модели автоматического исправления пунктуационных ошибок в тексте.
Блокнот с обучением и запуском модели находится здесь:
notebooks/Rubert_LSTM_punct_0.ipynb
Блокнот с подготовкой данных лежит здесь:
notebooks/Prepare_datasets_distilled.ipynb
Папка Data содержит данные для обучения:
Rawdata - используемые данные, подлежащие предобработке;
Datasets - готовые данные, применяющиеся для обучения, валидации и тестирования.