# 应用场景

如今，帮随着传统行业的数字化转型，各行各业都有着AI技术的应用，向量编码是AI技术中的一个重要环节。在nlp的领域中，向量编码是文本语义表示的过程，回顾文本表示的发展历程，经历了如下几个阶段。

- bow(bag of words)
- tf-idf
- n-gram
- word2vec、fasttext、glove
- ElMo
- Bert

文本语义向量在各个应用系统中起核心支撑的作用，比如搜索引擎、智能问答、知识检索、信息流推荐等。

在真实场景中，如搜索引擎、智能问答、知识检索、信息流推荐等系统中的召回、排序环节，通常面临的是如下任务：**从大量存储的 doc 中，选取与用户输入 query 最匹配的那个 doc。**

## 搜索场景

![search.jpeg](./imgs/search.jpeg)
在搜索引擎中，“doc”对应索引网页的相关信息，如 title、content 等，“query”对应用户的检索请求，“最匹配”对应（点击行为）相关度最高。query 会被表征为包含文本语义和用户信息的 embedding，doc 会被表征为包含索引网页各项信息的 embedding。

## 对话场景

![search.jpeg](./imgs/AnyQ.png)
在智能问答中，“doc”对应 FAQ 中的 question，“query”对应用户的问题，“最匹配”对应语义相似度最高。query 会被表征为以文本语义为主的 embedding，doc 同样表征为以文本语义为主的 embedding。

## 推荐场景

![search.jpeg](./imgs/tuijian.jpg)
在信息流推荐中，“doc”对应待推荐的 feed 流，“query”对应用户的画像，“最匹配”对应用户最感兴趣等众多度量标准。query 会被表征为包含文本特征各项信息的 embedding，doc 会被表征为包含用户历史、爱好等信息的 embedding。

# 文本语义向量的实践

## MatchPyramid

论文题目： Text Matching as Image Recognition    
论文地址：http://www.aaai.org/ocs/index.php/AAAI/AAAI16/paper/download/11895/12024
创新点：

- 受CNN在图像识别中的启发（可以提取到边、角等特征），作者提出先将文本使用相似度计算构造相似度矩阵，然后卷积来提取特征。把文本匹配处理成图像识别。【想法很特别】
- 根据结果显示，在文本方面使用作者提出的方法可以提取n-gram、n-term特征。

![image.png](attachment:image.png)
关于衡量单词之间的相似度，论文实验了3种做法，后面两个都是基于词向量的：
- 如果单词相同就是1，否则为0;   
- 计算词向量的余弦距离;    
- 计算词向量的内积;    

三个匹配矩阵叠加再用CNN在矩阵上进行特征提取是这篇整体的思想。 

## Sentence-Bert

论文题目：Sentence Embeddings using Siamese BERT-Networks   
论文地址：https://arxiv.org/abs/1908.10084

![sentence_bert](./imgs/sentence_bert.png)

![sentence_bert](./imgs/f404755d-9b6d-43fe-8193-aba6a35eb086.svg)

- **Classification Objective Function**：我们分别获得两句话的句子向量$u$和$v$,并将$u$ 、$v$和二者按位求差向量$|u-v|$进行拼接，再将拼接好的向量乘上一个可训练的权重$W_t\in R^{3n*k}$:$$\large O=softmax(W_t(u,v,|u-v|))$$

- **Triplet Objective Function**:在这个目标函数下，将模型框架进行修改，将原来的两个输入，变成三个句子输入。给定一个锚定句 $a$ ，一个肯定句 $p$ 和一个否定句 $n$ ，模型通过使 $a与p$ 的距离小于 $a与n$ 的距离，来优化模型。使其目标函数loss最小，即:   
$$\large O=max(||S_a-S_p||-||S_a-S_n||+\epsilon,0)$$
其中，$S_a,S_n,和S_p$ 表示句子$a,n,p$ 的向量， $||*||$ 表示距离度量， $\epsilon$ 表示边距。在论文中，距离度量为欧式距离，边距大小为1。

# 工业场景的应用案例

## 地图中的应用

地图场景下，用户一般会搜地址信息或者搜某个具体的poi,这里解释下什么是poi？poi是“Point of Interest”的缩写，中文可以翻译为“兴趣点”。在地理信息系统中，一个poi可以是一栋房子、一个商铺、一个邮筒、一个公交站等,或者说现实世界里你能看见的任何一个能叫得出名字的地点都可以认为是poi。  


用户在地图搜索框里面输入一个query，如果这个用户query的意图是想搜某个具体的poi，但是由于用户的query表述不清存在问题，可能是简写、多字、漏字或者错字别字造成的，那么即使数据库里存在用户想要的数据，可能也无法展现给用户。这时候就需要根据文本语义去匹配，找到用户可能想要的数据。

![sentence_bert](./imgs/src=http___img-blog.csdnimg.cn_3cc427399d9b475e8a6c5f89a6aebf81.png&refer=http___img-blog.csdnimg.webp)

![sentence_bert](./imgs/ditu.PNG)

## 电商中应用

电商场景下，当用户搜索一个商品时，输入用户query，系统会把用户query跟数据库里商品标题进行匹配，返回最匹配的商品信息，在首页展现给用户，所以用户query和商品标题匹配效果至关重要。

![sentence_bert](./imgs/jingdong.PNG)

![sentence_bert](./imgs/dianshang.PNG)

# 文本内容纠错项目实战课程介绍

- 应用场景广泛
- 课程大纲
- 现有产品服务对比