Myers-Brigg Personality Classification with Twitter Feed

This is the repo for Wesley Kwong's 5th Year MIDS W266 Natural Language Processing with Deep Learning final project.

The aim of this project was to analyze how various monolingual and multilingual BERT models performed on classifying the Myers-Brigg Personality Test (MBTI) classes based on Twitter tweets. The dataset used for this project was the TwiSty dataset. The tweets are in German (DE), Spanish (ES), Italian (IT), and Dutch (NL).

Dataset: https://www.uantwerpen.be/en/research-groups/clips/research/datasets/

Verhoeven, B., Daelemans, W., & Plank, B. (2016) TwiSty: a multilingual Twitter Stylometry corpus for gender and personality profiling. In: Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016). Portorož, Slovenia.

fastText's Aligned Word Vectors: https://fasttext.cc/docs/en/aligned-vectors.html

A. Joulin, P. Bojanowski, T. Mikolov, H. Jegou, E. Grave, Loss in Translation: Learning Bilingual Word Mapping with a Retrieval Criterion
P. Bojanowski*, E. Grave*, A. Joulin, T. Mikolov, Enriching Word Vectors with Subword Information

BERT Models:

Multilingual (bert-base-multilingual-cased): https://huggingface.co/bert-base-multilingual-cased
German (bert-base-german-cased): https://huggingface.co/bert-base-german-cased
Spanish (dccuchile/bert-base-spanish-wwm-cased): https://huggingface.co/dccuchile/bert-base-spanish-wwm-cased
Italian (dbmdz/bert-base-italian-cased): https://huggingface.co/dbmdz/bert-base-italian-cased
Dutch (GroNLP/bert-base-dutch-cased): https://huggingface.co/GroNLP/bert-base-dutch-cased

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
results_summary		results_summary
Appendix.xlsx		Appendix.xlsx
DE-trial-text4.csv		DE-trial-text4.csv
ES-trial-text.csv		ES-trial-text.csv
IT-trial-text3.csv		IT-trial-text3.csv
NL-trial-text3.csv		NL-trial-text3.csv
README.md		README.md
bert_all_models.ipynb		bert_all_models.ipynb
bert_hyperparamter_optimization.ipynb		bert_hyperparamter_optimization.ipynb
bert_train_size_variation.ipynb		bert_train_size_variation.ipynb
cnn_baseline.ipynb		cnn_baseline.ipynb
cnn_baseline_multilingual.ipynb		cnn_baseline_multilingual.ipynb
cnn_hyperparameter_optimization.ipynb		cnn_hyperparameter_optimization.ipynb
cnn_train_size_variation.ipynb		cnn_train_size_variation.ipynb
id_to_twitter_text.ipynb		id_to_twitter_text.ipynb
result_eda.ipynb		result_eda.ipynb
samples_to_train_test.ipynb		samples_to_train_test.ipynb
twisty_eda.ipynb		twisty_eda.ipynb
twisty_sample_eda.ipynb		twisty_sample_eda.ipynb
twisty_test.csv		twisty_test.csv
twisty_train.csv		twisty_train.csv
w266_Final_Project_Report.pdf		w266_Final_Project_Report.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Myers-Brigg Personality Classification with Twitter Feed

About

Releases

Packages

Languages

wesleykwong/Myers-Brigg-Classification

Folders and files

Latest commit

History

Repository files navigation

Myers-Brigg Personality Classification with Twitter Feed

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages