GitHub

#backdoor-HSIC (bd_HSIC)

Accompanying code for the paper "A Kernel Test for Causal Association via Noise Contrastive Backdoor Adjustment".

To generate the synthetic data used in the paper, the general procedure is the following:

Generate the necessary data
Generate and run the appropriate job using the "interpreter_run.py"
Post-process the results
Generate plots from the results

We list which scripts to run and which job to run to recreate the experiments in the paper.

Experiment	File to generate data	File to run experiments	Post process file	Generate plot
Binary	generate_simple_null.py	do_null_binary	kchsic_categorical_power.py	kchsic_categorical_power.py
Linear continuous	generate_data_multivariate.py	kc_rule_new	post_process.py	create_plots.py
Mixed	generate_mixed_data.py	do_null_mix	post_process.py	create_plots.py
Non-linear continuous	generate_hdm_breaker.py	hdm_breaker_fam_y=i_100, i=1,4	post_process.py	create_plots.py
Linear kernel binary	generate_simple_null.py	do_null_binary_linear_kernel	kchsic_categorical_power.py	kchsic_categorical_power.py
Linear kernel continuous	generate_data_multivariate.py	linear	post_process.py	create_plots.py

To get the results for the benchmark post-double-selection method and the R scripts can be run. To run the R scripts, some .pt files need to be converted to .csv. To do this, use the pt_to_csv.py script. For the real world experiments, do the following:

Lalonde - Run lalonde_real_experiment.py
Twins - Process the data using twins_preprocess.py, then run twins_real_experiment.py

This repository will include the results needed to recreate the plots in the paper already.

Name		Name	Last commit message	Last commit date
Latest commit History 182 Commits
1d_cat_pow		1d_cat_pow
build/lib		build/lib
dist		dist
kgformula.egg-info		kgformula.egg-info
kgformula		kgformula
old_csvs		old_csvs
post_processing_utils		post_processing_utils
pylatex		pylatex
.gitignore		.gitignore
1d_cat_pow_kchsic.tex		1d_cat_pow_kchsic.tex
1d_cat_pow_kchsic_real.tex		1d_cat_pow_kchsic_real.tex
RCIT.R		RCIT.R
README.md		README.md
ablation_3d.csv		ablation_3d.csv
bd_hsic_real_world_postprocess.py		bd_hsic_real_world_postprocess.py
bdhsic_categorical_power.py		bdhsic_categorical_power.py
break_hdm_pow_1.csv		break_hdm_pow_1.csv
break_hdm_pow_4.csv		break_hdm_pow_4.csv
combined_dataset_latest.csv		combined_dataset_latest.csv
cont_bench_hdm.R		cont_bench_hdm.R
cont_hdm_pow.csv		cont_hdm_pow.csv
covid_19_test.py		covid_19_test.py
covid_bench.R		covid_bench.R
covid_dummy.R		covid_dummy.R
covid_hdm_post_process.py		covid_hdm_post_process.py
covid_investigate_relationships.py		covid_investigate_relationships.py
covid_to_csv.py		covid_to_csv.py
create_plots.py		create_plots.py
csv_to_pt.py		csv_to_pt.py
debug_c19.csv		debug_c19.csv
exp_jobs_true_weights.csv		exp_jobs_true_weights.csv
extract_real_data.R		extract_real_data.R
gcm_break_ref.csv		gcm_break_ref.csv
gcm_test.R		gcm_test.R
generate_binary_do_null.R		generate_binary_do_null.R
generate_covid_real_experiment.py		generate_covid_real_experiment.py
generate_data_multivariate.py		generate_data_multivariate.py
generate_data_multivariate_bdhsic_breaker.py		generate_data_multivariate_bdhsic_breaker.py
generate_data_multivariate_bdhsic_breaker_1D_linear.py		generate_data_multivariate_bdhsic_breaker_1D_linear.py
generate_data_multivariate_non_gaussian_GCM_breaker.py		generate_data_multivariate_non_gaussian_GCM_breaker.py
generate_data_multivariate_non_gaussian_HSIC_breaker.py		generate_data_multivariate_non_gaussian_HSIC_breaker.py
generate_data_multivariate_non_gaussian_ablation.py		generate_data_multivariate_non_gaussian_ablation.py
generate_hdm_breaker.py		generate_hdm_breaker.py
generate_job_params.py		generate_job_params.py
generate_mixed_data.py		generate_mixed_data.py
generate_simple_null.py		generate_simple_null.py
hdm_bench_syntehtic.csv		hdm_bench_syntehtic.csv
hdm_benchmark_power.R		hdm_benchmark_power.R
hdm_fail_1d.R		hdm_fail_1d.R
hdm_fail_50d.R		hdm_fail_50d.R
hdm_fail_cont_xy=0.001_n=10000_y=4.csv		hdm_fail_cont_xy=0.001_n=10000_y=4.csv
hdm_fail_cont_xy=0.001_n=1000_y=4.csv		hdm_fail_cont_xy=0.001_n=1000_y=4.csv
hdm_fail_cont_xy=0.001_n=5000_y=4.csv		hdm_fail_cont_xy=0.001_n=5000_y=4.csv
hdm_fail_cont_xy=0.002_n=10000_y=4.csv		hdm_fail_cont_xy=0.002_n=10000_y=4.csv
hdm_fail_cont_xy=0.002_n=1000_y=4.csv		hdm_fail_cont_xy=0.002_n=1000_y=4.csv
hdm_fail_cont_xy=0.002_n=5000_y=4.csv		hdm_fail_cont_xy=0.002_n=5000_y=4.csv
hdm_fail_cont_xy=0.003_n=10000_y=4.csv		hdm_fail_cont_xy=0.003_n=10000_y=4.csv
hdm_fail_cont_xy=0.003_n=1000_y=4.csv		hdm_fail_cont_xy=0.003_n=1000_y=4.csv
hdm_fail_cont_xy=0.003_n=5000_y=4.csv		hdm_fail_cont_xy=0.003_n=5000_y=4.csv
hdm_fail_cont_xy=0.004_n=10000_y=4.csv		hdm_fail_cont_xy=0.004_n=10000_y=4.csv
hdm_fail_cont_xy=0.004_n=1000_y=4.csv		hdm_fail_cont_xy=0.004_n=1000_y=4.csv
hdm_fail_cont_xy=0.004_n=5000_y=4.csv		hdm_fail_cont_xy=0.004_n=5000_y=4.csv
hdm_fail_cont_xy=0.005_n=10000_y=4.csv		hdm_fail_cont_xy=0.005_n=10000_y=4.csv
hdm_fail_cont_xy=0.005_n=1000_y=4.csv		hdm_fail_cont_xy=0.005_n=1000_y=4.csv
hdm_fail_cont_xy=0.005_n=5000_y=4.csv		hdm_fail_cont_xy=0.005_n=5000_y=4.csv
hdm_fail_cont_xy=0.01_n=1000.csv		hdm_fail_cont_xy=0.01_n=1000.csv
hdm_fail_cont_xy=0.01_n=10000.csv		hdm_fail_cont_xy=0.01_n=10000.csv
hdm_fail_cont_xy=0.01_n=10000_y=4.csv		hdm_fail_cont_xy=0.01_n=10000_y=4.csv
hdm_fail_cont_xy=0.01_n=1000_y=4.csv		hdm_fail_cont_xy=0.01_n=1000_y=4.csv
hdm_fail_cont_xy=0.01_n=5000.csv		hdm_fail_cont_xy=0.01_n=5000.csv
hdm_fail_cont_xy=0.01_n=5000_y=4.csv		hdm_fail_cont_xy=0.01_n=5000_y=4.csv
hdm_fail_cont_xy=0.02_n=1000.csv		hdm_fail_cont_xy=0.02_n=1000.csv
hdm_fail_cont_xy=0.02_n=10000.csv		hdm_fail_cont_xy=0.02_n=10000.csv
hdm_fail_cont_xy=0.02_n=10000_y=4.csv		hdm_fail_cont_xy=0.02_n=10000_y=4.csv
hdm_fail_cont_xy=0.02_n=1000_y=4.csv		hdm_fail_cont_xy=0.02_n=1000_y=4.csv
hdm_fail_cont_xy=0.02_n=5000.csv		hdm_fail_cont_xy=0.02_n=5000.csv
hdm_fail_cont_xy=0.02_n=5000_y=4.csv		hdm_fail_cont_xy=0.02_n=5000_y=4.csv
hdm_fail_cont_xy=0.03_n=1000.csv		hdm_fail_cont_xy=0.03_n=1000.csv
hdm_fail_cont_xy=0.03_n=10000.csv		hdm_fail_cont_xy=0.03_n=10000.csv
hdm_fail_cont_xy=0.03_n=10000_y=4.csv		hdm_fail_cont_xy=0.03_n=10000_y=4.csv
hdm_fail_cont_xy=0.03_n=1000_y=4.csv		hdm_fail_cont_xy=0.03_n=1000_y=4.csv
hdm_fail_cont_xy=0.03_n=5000.csv		hdm_fail_cont_xy=0.03_n=5000.csv
hdm_fail_cont_xy=0.03_n=5000_y=4.csv		hdm_fail_cont_xy=0.03_n=5000_y=4.csv
hdm_fail_cont_xy=0.04_n=1000.csv		hdm_fail_cont_xy=0.04_n=1000.csv
hdm_fail_cont_xy=0.04_n=10000.csv		hdm_fail_cont_xy=0.04_n=10000.csv
hdm_fail_cont_xy=0.04_n=10000_y=4.csv		hdm_fail_cont_xy=0.04_n=10000_y=4.csv
hdm_fail_cont_xy=0.04_n=1000_y=4.csv		hdm_fail_cont_xy=0.04_n=1000_y=4.csv
hdm_fail_cont_xy=0.04_n=5000.csv		hdm_fail_cont_xy=0.04_n=5000.csv
hdm_fail_cont_xy=0.04_n=5000_y=4.csv		hdm_fail_cont_xy=0.04_n=5000_y=4.csv
hdm_fail_cont_xy=0.05_n=1000.csv		hdm_fail_cont_xy=0.05_n=1000.csv
hdm_fail_cont_xy=0.05_n=10000.csv		hdm_fail_cont_xy=0.05_n=10000.csv
hdm_fail_cont_xy=0.05_n=10000_y=4.csv		hdm_fail_cont_xy=0.05_n=10000_y=4.csv
hdm_fail_cont_xy=0.05_n=1000_y=4.csv		hdm_fail_cont_xy=0.05_n=1000_y=4.csv
hdm_fail_cont_xy=0.05_n=5000.csv		hdm_fail_cont_xy=0.05_n=5000.csv
hdm_fail_cont_xy=0.05_n=5000_y=4.csv		hdm_fail_cont_xy=0.05_n=5000_y=4.csv
hdm_fail_cont_xy=0.0_n=1000.csv		hdm_fail_cont_xy=0.0_n=1000.csv
hdm_fail_cont_xy=0.0_n=10000.csv		hdm_fail_cont_xy=0.0_n=10000.csv
hdm_fail_cont_xy=0.0_n=10000_y=4.csv		hdm_fail_cont_xy=0.0_n=10000_y=4.csv
hdm_fail_cont_xy=0.0_n=1000_y=4.csv		hdm_fail_cont_xy=0.0_n=1000_y=4.csv
hdm_fail_cont_xy=0.0_n=5000.csv		hdm_fail_cont_xy=0.0_n=5000.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

MrHuff/kgformula

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages