tsv文件格式
训练数据示例如下:
label text
0 0 备胎是硬伤!
1 0 要说不满意的话,那就是动力了,1.5自然吸气发动机对这款车有种小马拉大车的感觉。如今天气这么热,上路肯定得开空调,开了后动力明显感觉有些不给力不过空调制冷效果还是不错的。
2 0 油耗显示13升还多一点,希望慢慢下降。没有倒车雷达真可恨
3 0 空调不太凉,应该是小问题。
4 0 1、后排座椅不能平放;2、科技感不强,还不如百万帝豪,最希望增加车联网的车机。像你好博越一样。3、全景摄像头不清楚,晚上基本上用处不大
5 1 车子外观好看,车内空间大。
6 1 最满意的真的不只一点,概括一下最满意的就是性价比了。ps:虽然没有s7性价比高(原厂记录仪,绿净)
7 0 底盘调教的很低,坐的感觉有些别扭,视角不是很好。
8 0 开空调时,一档起步动力不足。车子做工有点马虎。
from lightnlp.tc import SA
# 创建SA对象
sa_model = SA()
train_path = '/home/lightsmile/Projects/NLP/chinese_text_cnn/data/train.sample.tsv'
dev_path = '/home/lightsmile/Projects/NLP/chinese_text_cnn/data/dev.sample.tsv'
vec_path = '/home/lightsmile/Downloads/1410356697_浅笑哥fight/自然语言处理/词向量/sgns.zhihu.bigram-char'
# 只需指定训练数据路径,预训练字向量可选,开发集路径可选,模型保存路径可选。
sa_model.train(train_path, vectors_path=vec_path, dev_path=dev_path, save_path='./sa_saves')
# 加载模型,默认当前目录下的`saves`目录
sa_model.load('./sa_saves')
# 对train_path下的测试集进行读取测试
sa_model.test(train_path)
sa_model.load('./sa_saves')
from pprint import pprint
pprint(sa_model.predict('外观漂亮,安全性佳,动力够强,油耗够低'))
预测结果:
(1.0, '1') # return格式为(预测概率,预测标签)