Scalable Thompson Sampling via Optimal Transport

The Particle-Interactive Thompson sampling (\pi-TS) uses distribution optimization techniques to approximate the posterior distribution in Thompson sampling, solved via Wasserstein gradient flows. Our approach is scalable and does not make explicit distribution assumptions on posterior approximations. This repository contains source code to reproduce the results presented in the paper Scalable Thompson Sampling via Optimal Transport (AISTATS 2019):

@inproceedings{Zhang_pi_TS,
  title={Scalable Thompson Sampling via Optimal Transport},
  author={Ruiyi Zhang, Zheng Wen, Changyou Chen, Chen Fang, Tong Yu, Lawrence Carin},
  booktitle={AISTATS},
  year={2019}
}

Dependencies

This code is based on Python 2.7, with the main dependencies being TensorFlow==1.5.0 and Theano==0.9.0

Experimental Codes

Dataset

Download the required datasets with the following cmd:

python prepare_data.py

Training

Train the model on the data.

source $dataset$.sh

Training log is printed as below:

Initializing model BBB-bnn.
Initializing model NeuralLinear-bnn.
Initializing model DGF-bnn.
Successfully initialized the models!
Initializing model BootRMS-0-bnn.
Initializing model BootRMS-1-bnn.
Initializing model BootRMS-2-bnn.
Training SVGD-bnn for 100 steps...
Training BBB-bnn for 100 steps...
Training NeuralLinear-bnn for 100 steps...
Training DGF-bnn for 100 steps...
Training BootRMS-0-bnn for 100 steps...
Training BootRMS-1-bnn for 100 steps...
Training BootRMS-2-bnn for 100 steps...
...

Evaluation

The results will be saved in a *.npz file, and the figures are based on these files.

Acknowledgement

This implementation is based on Deep Bayesian bandits library. We thank Riquelme et al. for making their code public.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
bandits		bandits
1adult.sh		1adult.sh
2census.sh		2census.sh
3covertype.sh		3covertype.sh
4financial.sh		4financial.sh
5mushroom.sh		5mushroom.sh
6statlog.sh		6statlog.sh
README.md		README.md
example_main.py		example_main.py
linear.sh		linear.sh
sparse.sh		sparse.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Scalable Thompson Sampling via Optimal Transport

Contents

Dependencies

Experimental Codes

Dataset

Training

Evaluation

Acknowledgement

About

Releases

Packages

Languages

zhangry868/Scalable-Thompson-Sampling-via-Optimal-Transport

Folders and files

Latest commit

History

Repository files navigation

Scalable Thompson Sampling via Optimal Transport

Contents

Dependencies

Experimental Codes

Dataset

Training

Evaluation

Acknowledgement

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages