RuSciTextsSum

В рамках работы Автоматическое реферирование научных текстов для русского языка с помощью моделей T5

Необходимые библиотеки:

transformers
sentencepiece
datasets
evaluate
rouge
bert_score
nltk

Архив с сохраненными дообученными моделями можно скачать с диска по ссылке ниже. Из-за размера файлов их невозможно выложить в систему GitHub.

archive: https://drive.google.com/drive/folders/1YWwnGua7Eh1LKGEVwwq8Hsep8R6f6zET?usp=share_link

Программное средство содержится в файле pipeline.py

Собранный датасет находится в директории /dataset

Директория /experiments содержит ipynb ноутбуки с проведенными экспериментами и рассчетами, проведенными в рамках работы

Директория /texts содержит примеры текстов, на которых можно тестировать работу программы. Пронумерованные файлы составляют более короткие тексты тезисов к ВКР, более длинный текст находится в файле text.txt

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
dataset		dataset
experiments		experiments
t5-model-small/logs		t5-model-small/logs
texts		texts
README.md		README.md
pipeline.py		pipeline.py
requirements.txt		requirements.txt
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

dataset

dataset

experiments

experiments

t5-model-small/logs

t5-model-small/logs

texts

texts

README.md

README.md

pipeline.py

pipeline.py

requirements.txt

requirements.txt

run.sh

run.sh

Repository files navigation

RuSciTextsSum

About

Releases

Packages

Languages

EduNetArchive/Yakovleva_RuSciTextSum

Folders and files

Latest commit

History

Repository files navigation

RuSciTextsSum

About

Resources

Stars

Watchers

Forks

Languages