GitHub - raikutro/kusari: BERT Tokenizer & Word2Vec Assisted Markov n-gram Language Model using Node.js

A Trigram Markov Language Model Assisted by a BERT WordPiece Tokenizer by 🤗 and Word2Vec by Google.

Start by running npm run train. Look at the comments inside train_models.js for details on training.

Run npm run test to test your model. Look inside test/sandbox.js for details on running.

Its output is underwhelming, to say the least.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
media		media
nlptoolkit-ngram		nlptoolkit-ngram
node-word2vec-win32 @ 8d42124		node-word2vec-win32 @ 8d42124
process		process
test		test
tokenizers		tokenizers
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md
index.js		index.js
package.json		package.json
train_models.js		train_models.js
yarn.lock		yarn.lock

Provide feedback