From c77672bdb9b4488099caada2150a88a4f9465741 Mon Sep 17 00:00:00 2001 From: BAOOOOOM <82091145+BAOOOOOM@users.noreply.github.com> Date: Sun, 22 Aug 2021 17:30:21 +0800 Subject: [PATCH 1/6] Create vectorization.rst --- docs/source/tutorial/zh/vectorization.rst | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/docs/source/tutorial/zh/vectorization.rst b/docs/source/tutorial/zh/vectorization.rst index c3161bad..89175ba6 100644 --- a/docs/source/tutorial/zh/vectorization.rst +++ b/docs/source/tutorial/zh/vectorization.rst @@ -6,11 +6,11 @@ 总体流程 --------------------------- -1.对传入的item进行解析,得到SIF格式; +1.对传入的item进行 `语法解析 `_ ,得到SIF格式; -2.对sif_item进行成分分解; +2.对sif_item进行 `成分分解 `_ ; -3.对经过成分分解的item进行令牌化; +3.对经过成分分解的item进行 `令牌化 `_; 4.使用已有或者使用提供的预训练模型,将令牌化后的item转换为向量。 From 0dc15640c304144bd4697a2a1096075a16f2fc26 Mon Sep 17 00:00:00 2001 From: BAOOOOOM <82091145+BAOOOOOM@users.noreply.github.com> Date: Sun, 22 Aug 2021 17:31:11 +0800 Subject: [PATCH 2/6] Create seg.rst --- docs/source/tutorial/zh/seg.rst | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/source/tutorial/zh/seg.rst b/docs/source/tutorial/zh/seg.rst index 9996dcee..e91f0105 100644 --- a/docs/source/tutorial/zh/seg.rst +++ b/docs/source/tutorial/zh/seg.rst @@ -10,7 +10,7 @@ 主要处理内容 -------------------- -1.将字典输入形式的选择题通过语义成分分解转换为符合条件的item; +1.将字典输入形式的选择题通过 `语法解析 `_ 换为符合条件的item; 2.将输入的item按照元素类型进行切分、分组。 From 9288fcb06d0325c191a2eaa84ab622d1d2462277 Mon Sep 17 00:00:00 2001 From: BAOOOOOM <82091145+BAOOOOOM@users.noreply.github.com> Date: Sun, 22 Aug 2021 17:31:30 +0800 Subject: [PATCH 3/6] Create seg.rst --- docs/source/tutorial/zh/seg.rst | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/source/tutorial/zh/seg.rst b/docs/source/tutorial/zh/seg.rst index e91f0105..e1e1c0db 100644 --- a/docs/source/tutorial/zh/seg.rst +++ b/docs/source/tutorial/zh/seg.rst @@ -10,7 +10,7 @@ 主要处理内容 -------------------- -1.将字典输入形式的选择题通过 `语法解析 `_ 换为符合条件的item; +1.将字典输入形式的选择题通过 `语法解析 `_ 转换为符合条件的item; 2.将输入的item按照元素类型进行切分、分组。 From 8be67d697fb880ad237a96bb6276faf6b6bc9414 Mon Sep 17 00:00:00 2001 From: BAOOOOOM <82091145+BAOOOOOM@users.noreply.github.com> Date: Sun, 22 Aug 2021 17:31:43 +0800 Subject: [PATCH 4/6] Create seg.rst --- docs/source/tutorial/zh/seg.rst | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/source/tutorial/zh/seg.rst b/docs/source/tutorial/zh/seg.rst index e1e1c0db..b10cef57 100644 --- a/docs/source/tutorial/zh/seg.rst +++ b/docs/source/tutorial/zh/seg.rst @@ -10,7 +10,7 @@ 主要处理内容 -------------------- -1.将字典输入形式的选择题通过 `语法解析 `_ 转换为符合条件的item; +1.将字典输入形式的选择题通过`语法解析 `_转换为符合条件的item; 2.将输入的item按照元素类型进行切分、分组。 From d293cd234431e1d6afcaa0e93f02b7079c6ebec9 Mon Sep 17 00:00:00 2001 From: BAOOOOOM <82091145+BAOOOOOM@users.noreply.github.com> Date: Sun, 22 Aug 2021 17:32:06 +0800 Subject: [PATCH 5/6] Create seg.rst --- docs/source/tutorial/zh/seg.rst | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/source/tutorial/zh/seg.rst b/docs/source/tutorial/zh/seg.rst index b10cef57..e1e1c0db 100644 --- a/docs/source/tutorial/zh/seg.rst +++ b/docs/source/tutorial/zh/seg.rst @@ -10,7 +10,7 @@ 主要处理内容 -------------------- -1.将字典输入形式的选择题通过`语法解析 `_转换为符合条件的item; +1.将字典输入形式的选择题通过 `语法解析 `_ 转换为符合条件的item; 2.将输入的item按照元素类型进行切分、分组。 From d3a40e3ca9a68ca5b591fede78306df08a2bf099 Mon Sep 17 00:00:00 2001 From: BAOOOOOM <82091145+BAOOOOOM@users.noreply.github.com> Date: Sun, 22 Aug 2021 17:46:09 +0800 Subject: [PATCH 6/6] Create start.rst --- docs/source/tutorial/zh/pretrain/start.rst | 4 +++- 1 file changed, 3 insertions(+), 1 deletion(-) diff --git a/docs/source/tutorial/zh/pretrain/start.rst b/docs/source/tutorial/zh/pretrain/start.rst index 96db936c..f87d6afa 100644 --- a/docs/source/tutorial/zh/pretrain/start.rst +++ b/docs/source/tutorial/zh/pretrain/start.rst @@ -1,5 +1,7 @@ 训练模型 ---------- +------------ + +如需训练模型则可直接train_vector函数接口,来使使训练模型更加方便。模块调用gensim库中的相关训练模型,目前提供了"sg"、 "cbow"、 "fastext"、 "d2v"、 "bow"、 "tfidf"的训练方法,并提供了embedding_dim参数,使之可以按照需求确定向量的维度。 基本步骤 ##################