### 四、模型使用与评估
本部分代码在```save_and_eval.ipynb```和```sim_of_sen.py```

#### **模型使用**

模型的使用通过文件```sim_of_sen.py```中的类：```SimOfSen```

类名：```SimOfSen```  
类方法：  
``` 
self.__init__():
  功能：根据入参进行模型加载及相关初始化
  参数：model_path：pb模型的位置；
       vocab_path：BERT词典的位置
       max_seq_length：输入数据的最大长度

self._cos_sim()
  功能：内部函数，计算两个向量的余弦相似度
  参数：vector_a, vector_b：两个可计算的向量
  返回：两个入参向量的余弦相似度
  
self.get_sim():  
  功能：对外使用的类方法，返回两个句子的相似度
  参数：sen, sen2：两个文本数据
  返回：入参两个文本的语义相似度
  
  函数内部操作：1. 将文本转换为BERT格式的输入  
               2. 将数据喂进__init__初始化的模型中  
               3. 得到两个句子的句向量输出  
               4. 计算两个句子句向量余弦相似度
```

模型使用示例

In [21]:
from config import Config as cfg
from sim_of_sen import SimOfSen

model_name = cfg.model_name
sim_exe = SimOfSen(model_path='./release/' + model_name + '.pb', vocab_path='./model', max_seq_length=35)



Instructions for updating:
Use tf.gfile.GFile.


In [None]:
print('我要订票', '给我订票', sim_exe.get_sim('我要订票', '给我订票'))
print('我要订票', '我要查天气', sim_exe.get_sim('我要订票', '我要查天气'))

#### **模型评估**
代码见```save_and_eval.ipynb```

1. 使用上述类的```get_sim()```方法，遍历测试集的数据，  
2. 计算每个句子对的语义相似度，若相似度>0.8则视为模型判断正确，否则为错误  
3. 正确数 / 测试集总数 = 正确率

In [None]:
from tqdm import tqdm
with open('./raw_data/' + model_name + '_test.tsv', encoding='utf-8') as f:
    all_lines = f.readlines()
    count = 0
    for line in tqdm(all_lines) :
        sen1, sen2, _ = line.split('\t')
        if sim_exe.get_sim(sen1, sen2) > 0.8:
            count += 1
    print(count / len(all_lines))