GitHub - johnnytorres/recsys_twconv_s2s: Recommending Users to Engage in Twitter Conversations

Code for implementation of the model in our paper "Seq2Seq models for recommending short text conversations": https://doi.org/10.1016/j.eswa.2020.113270

To run the experiments, we recommend to create the python virtual environment and install prerequisites including Tensorflow.

experiments with sample data

make run \
    DATASET=twconv_2011_trec_v10 \
    SUBSET=sampledataconvs \
    MODEL=rnn \
    TRAIN_BATCH_SIZE=8 \
    NUM_EPOCHS=2 \
    MAX_INPUT_LEN=10 \
    MAX_SOURCE_LEN=10 \
    MAX_TARGET_LEN=10 \
    NUM_DISTRACTORS=5 \
    EMBEDDING_SIZE=300 \
    EMBEDDING_ENABLED=1 \
    EMBEDDING_TRAINABLE=1 \
    RNN_DIM=50

experiments for benchmarking models

make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=random  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=tfidf  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=rnn  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=lstm  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=bilstm  

make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=random  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=tfidf  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=rnn  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=lstm  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=bilstm  

make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs MODEL=random  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs MODEL=tfidf  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs MODEL=rnn  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs MODEL=lstm  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs MODEL=bilstm  

make run DATASET=twconv_2016_usersec_v10 SUBSET=alldatausers MODEL=random  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldatausers MODEL=tfidf  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldatausers MODEL=rnn  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldatausers MODEL=lstm  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldatausers MODEL=bilstm

experiments for embeddings analysis

make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=0   TAG="embeddings"
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=1   TAG="embeddings_trainable"
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=0   TAG="embeddings"
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=1   TAG="embeddings_trainable"

make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=lstm EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=0   TAG="embeddings"
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs MODEL=lstm EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=1   TAG="embeddings_trainable"
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=lstm EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=0   TAG="embeddings"
make run DATASET=twconv_2011_trec_v10 SUBSET=alldatausers MODEL=lstm EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=1   TAG="embeddings_trainable"


make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=0   TAG="embeddings"
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=1   TAG="embeddings_trainable"
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldatausers MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=0   TAG="embeddings"
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldatausers MODEL=rnn EMBEDDING_ENABLED=1 EMBEDDING_TRAINABLE=1   TAG="embeddings_trainable"

experiments for different training size

make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs_test20 MODEL=rnn  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs_test30 MODEL=rnn  
make run DATASET=twconv_2011_trec_v10 SUBSET=alldataconvs_test40 MODEL=rnn  

make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs_test20 MODEL=rnn  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs_test30 MODEL=rnn  
make run DATASET=twconv_2016_usersec_v10 SUBSET=alldataconvs_test40 MODEL=rnn

calculate metrics

./scripts/results.sh

Name		Name	Last commit message	Last commit date
Latest commit History 83 Commits
analysis		analysis
scripts		scripts
twconvrecsys		twconvrecsys
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
config.yaml		config.yaml
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

License

johnnytorres/recsys_twconv_s2s

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages