diff --git a/docs/source/tutorial/zh/pretrain.rst b/docs/source/tutorial/zh/pretrain.rst index 4520fc82..3d1acd19 100644 --- a/docs/source/tutorial/zh/pretrain.rst +++ b/docs/source/tutorial/zh/pretrain.rst @@ -43,6 +43,38 @@ Examples: 公开模型一览 ------------ +版本说明 +######### + +一级版本 + +* 全量版本(luna_private ): 高考 + 考试中心 + 题库中国 + 学库宝 +* 公开版本1(luna_pub1):高考 +* 公开版本2(luna_pub2):高考 + 题库中国 +* 当前luna标准库(luna_v0): 当前为高考 + 题库中国 + 考试中心 + +二级版本: + +* 小科(Chinese,Math,English,History,Geography,Politics,Biology,Physics,Chemistry) +* 大科(理科science、文科literal、全科all) + +三级版本:【待完成】 + +* 不使用第三方初始化词表 +* 使用第三方初始化词表 + + + +模型命名规则:一级版本 + 二级版本 + gensim_luna_stem + 分词规则 + 模型方法 + 维度 + +例子: + +:: + + 全量版本-全学科的D2V模型路径: + `/share/qlh/d2v_model/luna_private/luna_private_all_gensim_luna_stem_general_d2v_256.bin` + (备注:一个D2V模型含4个bin后缀的文件) + 模型训练数据说明: ######### diff --git a/docs/source/tutorial/zh/vectorization.rst b/docs/source/tutorial/zh/vectorization.rst index fac4c60c..2244aa82 100644 --- a/docs/source/tutorial/zh/vectorization.rst +++ b/docs/source/tutorial/zh/vectorization.rst @@ -59,12 +59,12 @@ Examples: 模型选择与使用 ######### -根据题目所属学科选择预训练模型:(表格问题待解决) +根据题目所属学科选择预训练模型: +--------------------+------------------------+ -| 预训练模型名称 | 模型训练数据的所属学科 | +| 预训练模型名称 | 模型训练数据的所属学科 | +====================+========================+ | d2v_all_256 | 全学科 | +--------------------+------------------------+ @@ -76,6 +76,8 @@ Examples: +--------------------+------------------------+ + + 处理的具体流程: 1.下载相应的预处理模型