In [1]:
# 导入需要的包
import pandas as pd
from snownlp import SnowNLP

In [2]:
# 加载训练好的模型(或者替换模型也可以，此方法比较方便)
from snownlp import sentiment
sentiment.classifier.load('./new.marshal')

In [3]:
# 载入数据
# 此数据为手工标注的100条情感倾向数据
df = pd.read_csv("cs.csv")  # 数据采集时间是：2020.01.06
df.head()  # 查看数据
# 删除不需要的列
df = df.drop(["Unnamed: 0"], axis=1)

In [4]:
# 验证人工标注的100条数据在新模型分析下的情感倾向
preds = []  # 用于存放每一条情感分析的结果
for i in df["content"]:  # 循环每一条评论
    s = SnowNLP(i)  # 情感分析
    if s.sentiments >= 0.5:
        preds.append(1)
    else:
        preds.append(0)

# 将分析结果合并到原始数据中
df["pred"] = preds
df.head()

Unnamed: 0,content,sentiment,pred
0,喜欢那个打黑拳！！,1.0,1
1,其实已经一口气狂看到了第七卷。前半的节奏还是意气风发无往不利，越到后面那种命运悲剧的感受越强...,1.0,1
2,2020年头的几天假期啥事没干，就看这几百万字了。真的要戒掉看书一定要看完的坏毛病。及时止损。,0.0,0
3,适合消遣看看，破梗废话太多……,0.0,0
4,N年前就看了几章看不下去，因为电视剧 重新拾起看了一遍，觉得还是看电视剧吧…范闲nb的一塌糊涂,0.0,0


In [5]:
# 查看前五条的评论和分析结果
print("【情感分析】")
print(list(df["pred"][:5]))
print("【评论内容】")
print(list(df["content"][:5]))

【情感分析】
[1, 1, 0, 0, 0]
【评论内容】
['喜欢那个打黑拳！！', '其实已经一口气狂看到了第七卷。前半的节奏还是意气风发无往不利，越到后面那种命运悲剧的感受越强，让人有些不忍看下去了。目前停在了萍萍遇见高达那儿，不知还会不会往后翻。另外，写的有那么一点啰嗦，加上意淫之爽的部分，跟大唐双龙传有点神似哈哈哈', '2020年头的几天假期啥事没干，就看这几百万字了。真的要戒掉看书一定要看完的坏毛病。及时止损。', '适合消遣看看，破梗废话太多……', 'N年前就看了几章看不下去，因为电视剧 重新拾起看了一遍，觉得还是看电视剧吧…范闲nb的一塌糊涂']


In [6]:
# 手动标注的原始结果列表
origin_list = list(df["sentiment"])
# 预测结果的列表
predict = list(df["pred"])

# 计数常量，每有一条预测正确，就+1
right_count = 0
for i in range(100):  # 循环对比每一条的预测结果与原始结果
    if origin_list[i] == predict[i]:
        right_count += 1

# 计算模型的准确率
total_count = df.shape[0]  # 训练数据总条数 100

# 输出结果
print("预测数据总条数：{}".format(total_count))
print("预测正确的个数：{}".format(right_count))
print("识别正确率：{:.2f}%".format((right_count / total_count) * 100))

预测数据总条数：100
预测正确的个数：96
识别正确率：96.00%
