# 英文文本的情感分析(TextBlob)

提前安装NLP相关包        
pip install snownlp      
pip install -U textblob

In [13]:
text = "I am happy today. I feel sad today."

In [14]:
from textblob import TextBlob
# TextBlob帮我们把一段文本分成了不同的句子
blob = TextBlob(text)
blob

TextBlob("I am happy today. I feel sad today.")

In [15]:
# 句子划分情况
blob.sentences

[Sentence("I am happy today."), Sentence("I feel sad today.")]

In [16]:
# 输出第一句的情感分析结果
blob.sentences[0].sentiment

Sentiment(polarity=0.8, subjectivity=1.0)

In [17]:
# 输出第一句的情感分析结果
blob.sentences[1].sentiment

Sentiment(polarity=-0.5, subjectivity=1.0)

In [18]:
# 整段文本的情感分析
blob.sentiment

Sentiment(polarity=0.15000000000000002, subjectivity=1.0)

# 中文文本情感分析(SnowNLP)

In [27]:
text = u"我今天很快乐。我今天很愤怒。"
# 在引号前面的字母u提示Python，“这一段我们输入的文本编码格式是Unicode"

In [29]:
from snownlp import SnowNLP 
s = SnowNLP(text)

In [32]:
for i in s.sentences:
    print(i)

我今天很快乐
我今天很愤怒


In [39]:
s1 = SnowNLP(s.sentences[0])
s1.sentiments

0.971889316039116

In [40]:
s2 = SnowNLP(s.sentences[1])
s2.sentiments

0.07763913772213482

结果解释：SnowNLP的情感分析取值，表达的是“这句话代表正面情感的概率”。也就是说，对“我今天很愤怒”一句，SnowNLP认为，它表达正面情感的概率很低很低。

总结：
可能会遇到问题，例如输入一些明确的负面情绪语句，得到的结果却很正面。可能的原因如下：

首先，许多语句的情感判定需要上下文和背景知识，因此如果这类信息缺乏，判别正确率就会受到影响。这就是人比机器（至少在目前）更强大的地方。
其次，任何一个情感分析工具，实际上都是被训练出来的。训练时用的是什么文本材料，直接影响到模型的适应性。
例如SnowNLP，它的训练文本就是评论数据。因此，你如果用它来分析中文评论信息，效果应该不错。但是，如果你用它分析其他类型的文本——例如小说、诗歌等，效果就会大打折扣。因为这样的文本数据组合方式，它之前没有见过。

解决办法就是用其他类型的文本去训练它。见多识广，自然就“见惯不怪”了。至于该如何训练，请和相关软件包的作者联系咨询。