GenreClassifierEnsembles

You can find all the datasets we use in data directory.

Train models

Transformer-based models

Train XLM-RoBERTa

        --transformer-model xlm-roberta-base \
        --train-data-filename data/new_valid_livejournal/new_pure_livejournal_ftd_train1.csv \
        --test-data-filename data/new_valid_livejournal/new_pure_livejournal_ftd_valid1.csv \
        --model-dir models/xlm_roberta_half_livejournal_ru_seed_42 \
        --random-seed 42 \
        --cuda-device 0

Train RuBERT

        --transformer-model DeepPavlov/rubert-base-cased \
        --train-data-filename data/new_valid_livejournal/new_pure_livejournal_ftd_train1.csv \
        --test-data-filename data/new_valid_livejournal/new_pure_livejournal_ftd_valid1.csv \
        --model-dir models/xlm_roberta_half_livejournal_ru_seed_42 \
        --random-seed 42 \
	--use-bert-pooler True \
        --cuda-device 0

Classic ML

Train Logistic Regression:

        --train-data-filename data/new_valid_livejournal/new_pure_livejournal_ftd_train1.csv \
        --test-data-filename data/new_valid_livejournal/new_pure_livejournal_ftd_valid1.csv \
        --model-dir models/svm_genre/new_valid_lr_livejournal_ftd_100_seed_42_1

Train SVM Classifier:

        --train-data-filename new_valid_livejournal/new_pure_livejournal_ftd_train1.csv \
        --test-data-filename data/new_valid_livejournal/new_pure_livejournal_ftd_valid1.csv \
        --model-dir models/svm_genre/new_valid_svm_livejournal_ftd_100_seed_42_1

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
data		data
README.md		README.md
classic_models.py		classic_models.py
evaluate_lr_classifier.py		evaluate_lr_classifier.py
evaluate_transformer_classifier.py		evaluate_transformer_classifier.py
interpret_ensembles_manual_genres_k15.ipynb		interpret_ensembles_manual_genres_k15.ipynb
interpret_ensembles_manual_genres_k30.ipynb		interpret_ensembles_manual_genres_k30.ipynb
interpret_ensembles_manual_genres_k50.ipynb		interpret_ensembles_manual_genres_k50.ipynb
train_lr_classifier.py		train_lr_classifier.py
train_rf_classifier.py		train_rf_classifier.py
train_svm_classifier.py		train_svm_classifier.py
train_transformer_classifier.py		train_transformer_classifier.py
visualise_embeddings.py		visualise_embeddings.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

data

data

README.md

README.md

classic_models.py

classic_models.py

evaluate_lr_classifier.py

evaluate_lr_classifier.py

evaluate_transformer_classifier.py

evaluate_transformer_classifier.py

interpret_ensembles_manual_genres_k15.ipynb

interpret_ensembles_manual_genres_k15.ipynb

interpret_ensembles_manual_genres_k30.ipynb

interpret_ensembles_manual_genres_k30.ipynb

interpret_ensembles_manual_genres_k50.ipynb

interpret_ensembles_manual_genres_k50.ipynb

train_lr_classifier.py

train_lr_classifier.py

train_rf_classifier.py

train_rf_classifier.py

train_svm_classifier.py

train_svm_classifier.py

train_transformer_classifier.py

train_transformer_classifier.py

visualise_embeddings.py

visualise_embeddings.py

Repository files navigation

GenreClassifierEnsembles

Train models

Transformer-based models

Classic ML

About

Releases

Packages

Languages

MikeLepekhin/GenreClassifierEnsembles

Folders and files

Latest commit

History

Repository files navigation

GenreClassifierEnsembles

Train models

Transformer-based models

Classic ML

About

Resources

Stars

Watchers

Forks

Languages