ZeusKnows

A QA system based on computer reading comprehension.

Preprocess

训练词向量

word2vec

pip install word2vec

训练

word2vec.word2vec('large_pre.dat', 'wordsVec.bin', size=300, verbose=True, sample=8, cbow=0,  threads=4, min_count=40, save_vocab="word2vec.dict")

训练Yes/No 判断程序

Fasttext

生成输入数据

generate_net.py

从DuReader数据中生成成为R-net data_loader可识别的数据，添加ID。

运行R-net，生成模型。
vote.py, ensemble，从多个候选答案中选择最靠谱的一个。
添加yes_no 的答案，在95 服务器

Tips:

word_embedding 40count 运行中

95: /home/libei/ljz/sougou_data/word_50.log
aliyun: ZeusKnows/word2vec.log

TODO:

add language_model(pytorch) implementation.

把所有的有关预处理和文章排序文件下放到另外的一个文件夹。
把language_model作为一个包。init.py可以引用vocabulary.

Name		Name	Last commit message	Last commit date
Latest commit History 134 Commits
DuReader		DuReader
R_net		R_net
language_model		language_model
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
api.py		api.py
char.dict		char.dict
docs.py		docs.py
generate_net.py		generate_net.py
idf.dict		idf.dict
idf.py		idf.py
params.py		params.py
requirements.txt		requirements.txt
run.sh		run.sh
syn.py		syn.py
translate.pdf		translate.pdf
translate.tex		translate.tex
utils.py		utils.py
vocab.dict		vocab.dict
vocab.py		vocab.py
vote.py		vote.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ZeusKnows

Preprocess

训练词向量

训练Yes/No 判断程序

生成输入数据

Tips:

TODO:

About

Releases

Packages

Contributors 2

Languages

License

gajanlee/ZeusKnows

Folders and files

Latest commit

History

Repository files navigation

ZeusKnows

Preprocess

训练词向量

训练Yes/No 判断程序

生成输入数据

Tips:

TODO:

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages