Merge pull request #143 from stanford-oval/wip/next

Merge the dialogue workdirs
stanford-oval · Jul 21, 2020 · ebbcd8c · ebbcd8c
2 parents 650ba10 + f144dda
commit ebbcd8c
Show file tree

Hide file tree

Showing 559 changed files with 9,728 additions and 2,382 deletions.
diff --git a/.gitignore b/.gitignore
@@ -1,10 +1,35 @@
 *~
+*.tmp
 .idea/*
-*.zip
-build/
+config.mk
+
+# standard node stuff
 node_modules
-*.cred.json
-lines_of_code.csv
 .nyc_output/
+coverage/
+
+# make outputs
+build
+datadir
+
+# intermediate files of dataset generation
+synthetic*
+augmented*
+*user.tsv
+*agent.tsv
+eval/*/schema.tt
+eval/*/dataset.tt
+eval/*/database-map.tsv
 
+# files downloaded from s3 and thingpedia
+parameter-datasets*
+entities.json
+eval/*/models
+eval/*/datasets
+.embeddings/
+
+# testing files
+*.cred.json
 test/device-classes/*.tt
+
+
diff --git a/.travis.yml b/.travis.yml
@@ -2,15 +2,25 @@ branches:
   except:
   - "/^wip/"
 language: node_js
-node_js:
-- '10'
-before_install: yarn global add greenkeeper-lockfile@1
-before_script: greenkeeper-lockfile-update
-after_script: greenkeeper-lockfile-upload
-script:
-- yarn make lint
-- TZ="America/Los_Angeles" yarn test $(git diff --name-only $TRAVIS_COMMIT_RANGE | paste -sd " ")
-after_success: yarn run coverage
+node_js: '10'
+jobs:
+  include:
+    -
+      name: "Unit Tests"
+      install:
+      - travis_retry yarn
+      script:
+      - yarn lint
+      - TZ="America/Los_Angeles" yarn test main universe
+      after_success: yarn run coverage
+    -
+      name: "Dataset Generation"
+      install:
+      - travis_retry yarn
+      - pyenv global 3.7
+      - pip3 install --user numpy
+      script:
+      - ./travis/test-dataset.sh
 env:
   global:
     secure: if/uAlocgQl/D76vzuR90EQqoxZyBZv5+OLO/SV7hUE50hPdBfn7yucPomQG85nE2JAGyWzFwQTxkTDBmGE8Uew+PrGyDU244nH2vvwdEQl6VEJi8BCdK7jtE5/wb+ewyRBn1siNOWGlFG/God+ojkaL0fGcVINWLbT4JWF4olN1mcKv3y8oiVMPbA1RkHaE75nfF2l2b5MOGd6QxcoyeBIZegFwHk3evKBNy2lZ+eOxZoZZUUN9bwZYyF0tbpi/w7F1hv5Tj9c5/2FTYM9z+jXSfC4kCH0WCMyOpE/YhfE1NhHVglJk9MVArm3o5V4BtKfKtyTpVWOJGqgWavWqF+QteTeP3hvQpKS/3SyGTL9hqG30yijCtuVo5YZFTGhjBtqhFMhEqaSAuXgQol+IPur+9Hn9DyDW7XRVkpoP22EemP2SweXwOkQg6QFTqyN3PU0R51akgP6LD8VaXw7MPAtH07b7YCbBT7/IMCIDMe8hGAqRLUjB+GhzCWLvEsl8o82SaF+w4mzqDMApLsL1up9AMrQ6MQWFc+8lujShmfnEvAMiNdTHZOr+vcY5ytU6WAkaR2lgUR90Zn13/z2jYToVti9nD/x6pkVvr9XBP6uRruoT3LTzWXY2mflDwblobu0T9VND63A4CSPHpfH/utFKq8Em6INrhNvBJI87Z2I=
diff --git a/Makefile b/Makefile
@@ -1,15 +1,93 @@
+-include ./config.mk
+
 NULL =
 
-pkgfiles := $(wildcard */package.json)
-zipfiles := $(pkgfiles:%/package.json=%.zip)
+all_releases := main universe staging
+# this indirection is for the purpose of [genie-k8s](https://github.com/stanford-oval/genie-k8s),
+# which sets experiment=
+experiment ?= main
+release ?= $(experiment)
+# dev or test
+eval_set ?= dev
+# model to train or evaluate
+model ?=
+
+devices_fn = $(foreach d,$(wildcard $(1)/*/manifest.tt),$(patsubst %/manifest.tt,%,$(d)))
+pkgfiles_fn = $(wildcard $(1)/*/package.json)
+
+# *_devices is the devices in this release, and all devices in a "more stable" release
+main_devices := $(call devices_fn,main)
+universe_devices := $(main_devices) $(call devices_fn,universe)
+staging_devices := $(universe_devices) $(call devices_fn,staging)
+main_pkgfiles := $(call pkgfiles_fn,main)
+universe_pkgfiles := $(main_pkgfiles) $(call pkgfiles_fn,universe)
+staging_pkgfiles := $(universe_pkgfiles) $(call pkgfiles_fn,staging)
+
+# hyperparameters that can be overridden on the cmdline
+template_file ?= thingtalk/en/dialogue.genie
+dataset_file ?= eval/$(release)/dataset.tt
+schema_file ?= eval/$(release)/schema.tt
+paraphrases_user ?= $(wildcard $(release)/*/paraphrase/*.tsv)
+eval_files ?= eval/$(release)/$(eval_set)/annotated.txt $(foreach d,$($(release)_devices),$(d)/eval/$(eval_set)/annotated.txt)
+
+synthetic_flags ?= \
+	dialogues \
+	multifilters \
+	nostream \
+	notablejoin \
+	projection \
+	projection_with_filter \
+	schema_org \
+	undefined_filter \
+	$(NULL)
+
+target_pruning_size ?= 125
+minibatch_size ?= 300
+target_size ?= 1
+subdatasets ?= 6
+subdataset_ids := $(shell seq 1 $(subdatasets))
+max_turns ?= 5
+max_depth ?= 8
+debug_level ?= 1
+update_canonical_flags ?= --algorithm bert,adj,bart --paraphraser-model ./models/paraphraser-bart
+
+generate_flags ?= $(foreach v,$(synthetic_flags),--set-flag $(v)) --target-pruning-size $(target_pruning_size) --max-turns $(max_turns) --maxdepth $(max_depth)
+custom_gen_flags ?=
+
+template_deps = \
+	$(geniedir)/languages/thingtalk/*.js \
+	$(geniedir)/languages/thingtalk/dialogue_acts/*.js \
+	$(geniedir)/languages/thingtalk/*.genie \
+	$(geniedir)/languages/thingtalk/en/*.genie \
+	$(geniedir)/languages/thingtalk/en/dlg/*.genie
+
+evalflags ?=
+
+# configuration (should be set in config.mk)
+eslint ?= node_modules/.bin/eslint
+thingpedia_cli ?= node_modules/.bin/thingpedia
+
+geniedir ?= node_modules/genie-toolkit
+memsize ?= 9000
+parallel ?= 7
+genie ?= node --experimental_worker --max_old_space_size=$(memsize) $(geniedir)/tool/genie.js
+
+thingpedia_url ?= https://thingpedia.stanford.edu/thingpedia
+developer_key ?= invalid
+
+s3_bucket ?=
+genie_k8s_project ?=
+genie_k8s_owner ?=
 
 .PRECIOUS: %/node_modules
+.PHONY: all clean lint
 
-all: $(zipfiles)
+all: $($(release)_pkgfiles:%/package.json=build/%.zip)
 	@:
 
-%.zip: % %/node_modules
-	cd $< ; zip -x '*.tt' '*.yml' 'node_modules/.bin/*' 'icon.png' -r $(abspath $@) .
+build/%.zip: % %/node_modules
+	mkdir -p `dirname $@`
+	cd $< ; zip -x '*.tt' '*.yml' 'node_modules/.bin/*' 'icon.png' 'eval/*' 'simulation/*' 'database-map.tsv' -r $(abspath $@) .
 
 %/node_modules: %/package.json %/yarn.lock
 	mkdir -p $@
@@ -19,11 +97,147 @@ all: $(zipfiles)
 %: %/package.json %/*.js %/node_modules
 	touch $@
 
+$(schema_file): $(addsuffix /manifest.tt,$($(release)_devices))
+	cat $^ > $@
+
+$(dataset_file): $(addsuffix /dataset.tt,$($(release)_devices))
+	cat $^ > $@
+
+eval/$(release)/database-map.tsv: $(addsuffix /database-map.tsv,$($(release)_devices))
+	for f in $^ ; do \
+	  sed 's|\t|\t../../'`dirname $$f`'/|g' $$f >> $@ ; \
+	done
+
+entities.json:
+	$(thingpedia_cli) --url $(thingpedia_url) --developer-key $(developer_key) --access-token invalid \
+	  download-entities -o $@
+
+parameter-datasets.tsv:
+	$(thingpedia_cli) --url $(thingpedia_url) --developer-key $(developer_key) --access-token invalid \
+	  download-entity-values --manifest $@.tmp --append-manifest -d parameter-datasets
+	$(thingpedia_cli) --url $(thingpedia_url) --developer-key $(developer_key) --access-token invalid \
+	  download-string-values --manifest $@.tmp --append-manifest -d parameter-datasets
+	mv $@.tmp $@
+
+eval/$(release)/synthetic-%.txt : $(schema_file) $(dataset_file) $(template_deps) entities.json
+	$(genie) generate-dialogs \
+	  --locale en-US --target-language thingtalk \
+	  --template $(geniedir)/languages/$(template_file) \
+	  --thingpedia $(schema_file) --entities entities.json --dataset $(dataset_file) \
+	  -o $@.tmp -f txt $(generate_flags) --debug $(debug_level) $(custom_gen_flags) --random-seed $@ \
+	  -n $(target_size) -B $(minibatch_size)
+	mv $@.tmp $@
+
+eval/$(release)/synthetic.txt: $(foreach v,$(subdataset_ids),eval/$(release)/synthetic-$(v).txt)
+	cat $^ > $@
+
+eval/$(release)/synthetic-%.user.tsv : eval/$(release)/synthetic-%.txt $(schema_file)
+	$(genie) dialog-to-contextual \
+	  --locale en-US --target-language thingtalk --deduplicate \
+	  --thingpedia $(schema_file) --side user --flags S --id-prefix $*: \
+	  -o $@.tmp $<
+	mv $@.tmp $@
+
+eval/$(release)/synthetic.user.tsv: $(foreach v,$(subdataset_ids),eval/$(release)/synthetic-$(v).user.tsv)
+	$(genie) deduplicate --contextual -o $@.tmp $^
+	mv $@.tmp $@
+
+eval/$(release)/synthetic-%.agent.tsv : eval/$(release)/synthetic-%.txt $(schema_file)
+	$(genie) dialog-to-contextual \
+	  --locale en-US --target-language thingtalk --deduplicate \
+	  --thingpedia $(schema_file) --side agent --flags S --id-prefix $*: \
+	  -o $@.tmp $<
+	mv $@.tmp $@
+
+eval/$(release)/synthetic.agent.tsv: $(foreach v,$(subdataset_ids),eval/$(release)/synthetic-$(v).agent.tsv)
+	$(genie) deduplicate --contextual -o $@.tmp $^
+	mv $@.tmp $@
+
+eval/$(release)/augmented.user.tsv : eval/$(release)/synthetic.user.tsv $(schema_file) $(paraphrases_user) parameter-datasets.tsv
+	$(genie) augment -o $@.tmp \
+	  --locale en-US --target-language thingtalk --contextual \
+	  --thingpedia $(schema_file) --parameter-datasets parameter-datasets.tsv \
+	  --synthetic-expand-factor 2 --quoted-paraphrasing-expand-factor 60 --no-quote-paraphrasing-expand-factor 20 --quoted-fraction 0.0 \
+	  --no-debug $(paraphrases_user) $< --parallelize $(parallel)
+	mv $@.tmp $@
+
+eval/$(release)/$(eval_set)/agent.tsv : $(eval_files) $(schema_file)
+	$(genie) dialog-to-contextual \
+	  --locale en-US --target-language thingtalk --no-tokenized \
+	  --thingpedia $(schema_file) --side agent --flags E \
+	  -o $@.tmp $(eval_files)
+	mv $@.tmp $@
+
+eval/$(release)/$(eval_set)/user.tsv : $(eval_files) $(schema_file)
+	$(genie) dialog-to-contextual \
+	  --locale en-US --target-language thingtalk --no-tokenized \
+	  --thingpedia $(schema_file) --side user --flags E \
+	  -o $@.tmp $(eval_files)
+	mv $@.tmp $@
+
+eval/$(release)/$(eval_set)/%.dialogue.results: eval/$(release)/models/%/best.pth $(eval_files) $(schema_file) eval/$(release)/database-map.tsv parameter-datasets.tsv
+	mkdir -p eval/$(release)/$(eval_set)/$(dir $*)
+	$(genie) evaluate-dialog \
+	  --url "file://$(abspath $(dir $<))" \
+	  --thingpedia $(schema_file) \
+	  --target-language thingtalk \
+	  --database-file eval/$(release)/database-map.tsv \
+	  --parameter-datasets parameter-datasets.tsv \
+	  --debug --csv-prefix $(eval_set) --csv $(evalflags) \
+	  -o $@.tmp $(eval_files) > eval/$(release)/$(eval_set)/$*.dialogue.debug.tmp
+	mv eval/$(release)/$(eval_set)/$*.dialogue.debug.tmp eval/$(release)/$(eval_set)/$*.dialogue.debug
+	mv $@.tmp $@
+
+# NOTE: there is no augmentation of agent sentences! The agent networks (policy & NLG) operate with QUOTED tokens exclusively
+datadir/agent: eval/$(release)/synthetic.agent.tsv eval/$(release)/dev/agent.tsv
+	mkdir -p $@
+	cp eval/$(release)/synthetic.agent.tsv $@/
+	cp eval/$(release)/synthetic.agent.tsv $@/train.tsv ; \
+	cp eval/$(release)/dev/agent.tsv $@/eval.tsv ; \
+	touch $@
+
+datadir/user: eval/$(release)/synthetic.user.tsv eval/$(release)/augmented.user.tsv eval/$(release)/dev/user.tsv
+	mkdir -p $@
+	cp eval/$(release)/synthetic.user.tsv $@/
+	cp eval/$(release)/augmented.user.tsv $@/train.tsv ; \
+	cp eval/$(release)/dev/user.tsv $@/eval.tsv ; \
+	touch $@
+
+datadir: datadir/agent datadir/user $(foreach v,$(subdataset_ids),eval/$(release)/synthetic-$(v).txt)
+	cat eval/$(release)/synthetic-*.txt > $@/synthetic.txt
+	python3 ./scripts/measure.py $@ > $@/stats
+	touch $@
+
 clean:
-	rm -f *.zip
+	rm -fr build/
+	rm -fr entities.json
+	for exp in $(all_releases) ; do \
+		rm -rf $$exp/schema.tt $$exp/dataset.tt $$exp/synthetic* parameter-datasets* $$exp/augmented* ; \
+	done
 
 lint:
-	for f in */package.json ; do \
-		echo $$f ; \
-		eslint `dirname $$f`/*.js || exit 1 ; \
+	for d in $($(release)_devices) ; do \
+		echo $$d ; \
+		$(thingpedia_cli) lint-device --manifest $$d/manifest.tt --dataset $$d/dataset.tt ; \
+		test ! -f $$d/package.json || $(eslint) $$d/*.js ; \
 	done
+
+evaluate: eval/$(release)/$(eval_set)/$(model).dialogue.results
+	for f in $^ ; do echo $$f ; cat $$f ; done
+
+eval/$(release)/models/%/best.pth:
+	mkdir -p eval/$(release)/models/$(if $(findstring /,$*),$(dir $*),)
+	aws s3 sync --exclude '*/dataset/*' --exclude '*/cache/*' --exclude 'iteration_*.pth' --exclude '*_optim.pth' s3://geniehai/$(if $(findstring /,$*),$(dir $*),$(genie_k8s_owner)/)models/$(genie_k8s_project)/$(release)/$(notdir $*)/ eval/$(release)/models/$*/
+
+syncup:
+	aws s3 sync --delete --exclude 'node_modules/*' --exclude '*/node_modules/*' --exclude '.embeddings/*' --exclude '*/models/*' --exclude '*/datasets/*' --exclude 'datadir/*' --exclude '*/synthetic*' --exclude '*/augmented*' --exclude '.git/*' --exclude '.nyc_output/*' --no-follow-symlinks . s3://$(s3_bucket)/$(genie_k8s_owner)/workdir/$(genie_k8s_project)/
+
+syncdown:
+	aws s3 sync s3://$(s3_bucket)/$(genie_k8s_owner)/workdir/$(genie_k8s_project)/ .
+
+$(release)/datasets/%/stats:
+	aws s3 cp s3://$(s3_bucket)/$(if $(findstring /,$*),$(dir $*),$(genie_k8s_owner)/)dataset/$(genie_k8s_project)/$(release)/$(notdir $*)/stats $@ || true
+	sed -i 's|datadir|'$(release)/datasets/$*'|g' $@
+
+training-set-statistics: $(foreach v,$($(release)_training_sets),$(release)/datasets/$(v)/stats)
+	cat $(foreach v,$($(release)_training_sets),$(release)/datasets/$(v)/stats)
diff --git a/README.md b/README.md
@@ -1,4 +1,4 @@
-# Various Thingpedia Devices
+# Thingpedia Devices for Almond
 
 [![Build Status](https://travis-ci.com/stanford-oval/thingpedia-common-devices.svg?branch=master)](https://travis-ci.com/stanford-oval/thingpedia-common-devices) [![Coverage Status](https://coveralls.io/repos/github/stanford-oval/thingpedia-common-devices/badge.svg?branch=master)](https://coveralls.io/github/stanford-oval/thingpedia-common-devices?branch=master)
 
@@ -23,12 +23,41 @@ Thingpedia is part of Almond, a research project led by
 prof. Monica Lam, from Stanford University.  You can find more
 information at <https://almond.stanford.edu>.
 
+## Repository Organization
+
+The devices in this repository are divided in three release channels, based
+on their development maturity:
+
+- `main`: curated, high-quality, officially supported Thingpedia devices that are 
+  are continuously tested and and reasonably expected to work on all supported
+  Almond platforms.
+- `universe`: community-supported Thingpedia devices that at some point passed
+  our standard of quality but might be out of date with upstream API changes or
+  lack newer functionality; `universe` devices are also automatically tested and
+  have their dependencies updated automatically.
+- `staging`: incubator for newly developed Thingpedia devices, not yet ready for
+  wide use; staging devices are not regularly tested and might have out-of-date
+  dependencies or security vulnerabilities; use `staging` devices at your own risk.
+
+Each device is in a folder named after the device ID. The folder contains:
+
+- `manifest.tt`: the Thingpedia device definition
+- `dataset.tt`: additional primitive templates for the Thingpedia device
+- `icon.png`: the icon in Thingpedia
+- `eval/`: evaluation data (one folder for dev and one for test)
+- `eval/*/input.txt`: bare dialogues between user and agent
+- `eval/*/annotated.txt`: annotated dialogues
+- `paraphrase/`: (optional) paraphrase data
+- `package.json` and `yarn.lock`: node package definition and dependency list for the Thingpedia device, if the device needs custom JS code
+- `*.js`: custom JS code used by the Thingpedia device
+- `node_modules/`: (optional, generated) NPM dependencies for the device
+
 ## Test your device
 This repository also provides a simple test framework for devices 
-that require no authentication or basic username-password style 
+that require no authentication or username-password style 
 [basic authentication](https://almond.stanford.edu/thingpedia/developers/thingpedia-device-intro-auth-n-discovery.md#username-and-password). 
 
-Once your device has been created, you can add the test under directory `test`. 
+Once your device has been created, you can add the test under directory `test/`. 
 A couple examples have been added for your reference. 
 For example, if you want to test your device named `com.xxx`, 
 first create a test file `com.xxx.js`, and `com.xxx.cred.json` containing