Этот репозиторий создан как часть проекта "Классификация архивных документов по политическому признаку с помощью BERT", выполненного в рамках защиты курсовых работ по программе "Нейронные сети и их применение в научных исследованиях" от MSU.AI.
Блокнот ("Model_test") содержит результаты тестирования модели на трех текстах, не вошедших ни в одну из обучающих/текстовых выборок. В дополнение к определенному моделью классу мы приводим результаты анализа вывода модели с помощью SHAP. Для просмотра визуализации SHAP лучше открыть файл Model_test в Google Colab.
Классы датасета:
- Большевики 0
- Меньшевики 1
- Левые эсеры 2
- Кадеты 3
- Монархисты 4
- Белая армия 5
- Рабочая оппозиция большевикам 6
- Дворянское собрание 7
Оставшиеся материалы будут выложены после публикации работы.