# Sentiment Analyse mit TextBlob
#### WAS KANN TextBlob ALLES?

In [1]:
from textblob_de import TextBlobDE as TB

In [2]:
text1 = '''Das ist alles wunderschön. Ich freue mich.''' 

In [3]:
text2 = '''Heute ist der 3. Mai 2014 und Dr. Meier feiert\
seinen 43. Geburtstag. Ich muss unbedingt daran denken, \
Mehl, usw. für einen Kuchen einzukaufen. Aber leider \
habe ich nur noch EUR 3,50 in meiner Brieftasche.'''

In [4]:
text3 = '''Es ist so schlimm und so furchtbar. \
Es war alles so traurig und grässlich.'''

In [25]:
blob1 = TB(text1)

In [15]:
blob2 = TB(text2)

In [16]:
blob3 = TB(text3)

In [137]:
blob1.translate(to="en")

TextBlobDE("That's all beautiful. I'm glad.")

#### Ausgabe der einzelnen Sätze

In [26]:
print(blob1.sentences)

[Sentence("Das ist alles wunderschön."), Sentence("Ich freue mich.")]


In [18]:
print(blob2.sentences)

[Sentence("Heute ist der 3. Mai 2014 und Dr. Meier feiert seinen 43. Geburtstag."), Sentence("Ich muss unbedingt daran denken, Mehl, usw. für einen Kuchen einzukaufen."), Sentence("Aber leider habe ich nur noch EUR 3,50 in meiner Brieftasche.")]


In [19]:
print(blob3.sentences)

[Sentence("Es ist so schlimm und so furchtbar."), Sentence("Es war alles so traurig und grässlich.")]


#### Tokenisierung

In [27]:
print(blob1.tokens)

['Das', 'ist', 'alles', 'wunderschön', '.', 'Ich', 'freue', 'mich', '.']


In [20]:
print(blob2.tokens)

['Heute', 'ist', 'der', '3.', 'Mai', '2014', 'und', 'Dr.', 'Meier', 'feiert', 'seinen', '43.', 'Geburtstag', '.', 'Ich', 'muss', 'unbedingt', 'daran', 'denken', ',', 'Mehl', ',', 'usw.', 'für', 'einen', 'Kuchen', 'einzukaufen', '.', 'Aber', 'leider', 'habe', 'ich', 'nur', 'noch', 'EUR', '3,50', 'in', 'meiner', 'Brieftasche', '.']


In [21]:
print(blob3.tokens)

['Es', 'ist', 'so', 'schlimm', 'und', 'so', 'furchtbar', '.', 'Es', 'war', 'alles', 'so', 'traurig', 'und', 'grässlich', '.']


#### Wortarten

In [28]:
print(blob1.tags)

[('Das', 'DT'), ('ist', 'VB'), ('alles', 'DT'), ('wunderschön', 'JJ'), ('Ich', 'PRP'), ('freue', 'NN'), ('mich', 'PRP')]


In [22]:
print(blob2.tags)

[('Heute', 'RB'), ('ist', 'VB'), ('der', 'DT'), ('3.', 'LS'), ('Mai', 'NN'), ('2014', 'CD'), ('und', 'CC'), ('Dr.', 'NN'), ('Meier', 'NN'), ('feiert', 'NN'), ('seinen', 'PRP$'), ('43.', 'CD'), ('Geburtstag', 'NN'), ('Ich', 'PRP'), ('muss', 'VB'), ('unbedingt', 'RB'), ('daran', 'RB'), ('denken', 'VB'), ('Mehl', 'NN'), ('usw.', 'IN'), ('für', 'IN'), ('einen', 'DT'), ('Kuchen', 'JJ'), ('einzukaufen', 'NN'), ('Aber', 'CC'), ('leider', 'VBN'), ('habe', 'VB'), ('ich', 'PRP'), ('nur', 'RB'), ('noch', 'IN'), ('EUR', 'NN'), ('3,50', 'CD'), ('in', 'IN'), ('meiner', 'JJ'), ('Brieftasche', 'NN')]


In [23]:
print(blob3.tags)

[('Es', 'PRP'), ('ist', 'VB'), ('so', 'RB'), ('schlimm', 'JJ'), ('und', 'CC'), ('so', 'RB'), ('furchtbar', 'JJ'), ('Es', 'PRP'), ('war', 'VB'), ('alles', 'DT'), ('so', 'RB'), ('traurig', 'JJ'), ('und', 'CC'), ('grässlich', 'JJ')]


#### Nominalphrasen

In [29]:
print(blob1.noun_phrases)

[]


In [30]:
print(blob2.noun_phrases)

['Mai 2014', 'Dr. Meier', 'seinen 43. Geburtstag', 'Kuchen einzukaufen', 'meiner Brieftasche']


In [31]:
print(blob3.noun_phrases)

[]


### Sentiment Analyse

#### Interpretation
- Werte zwischen -1,0 und 1,0
    - -1,0 -> sehr negativ
    - 1,0 -> sehr positiv

In [32]:
print(blob1.sentiment)

Sentiment(polarity=0.5, subjectivity=0.0)


In [34]:
print(blob2.sentiment)

Sentiment(polarity=0.0, subjectivity=0.0)


In [33]:
print(blob3.sentiment)

Sentiment(polarity=-1.0, subjectivity=0.0)


## Versuche fürs Programm

- auf die InnerKeys des Dictionarys anwenden -- Zahl als Value verwenden

In [147]:
test_dic = {"A_B": {"Das ist alles wunderschön. Ich freue mich." : 0, "Mir geht es super!": 0, "Alles ist schön!": 0, "Das ist das Beste!": 0}, "B_A": {"Es ist so schlimm und so furchtbar. \
Es war alles so traurig und grässlich.": 0, "Alles ist blöd.": 0, "Heute ist schlechtes Wetter.": 0, "Ich hasse Wochenenden.": 0}}

In [148]:
a = "Das ist scheiße!"
b = TB(a)
print(b.sentiment)

Sentiment(polarity=0.0, subjectivity=0.0)


#### Gesagtem wird Sentiment zugeordnet

In [149]:
for key in test_dic:
    for innerkey in test_dic[key]:
        senti = TB(innerkey)
        test_dic[key][innerkey] = senti.sentiment.polarity


In [150]:
test_dic

{'A_B': {'Das ist alles wunderschön. Ich freue mich.': 0.5,
  'Mir geht es super!': 0.0,
  'Alles ist schön!': 1.0,
  'Das ist das Beste!': 0.0},
 'B_A': {'Es ist so schlimm und so furchtbar. Es war alles so traurig und grässlich.': -1.0,
  'Alles ist blöd.': -1.0,
  'Heute ist schlechtes Wetter.': 0.0,
  'Ich hasse Wochenenden.': 0.0}}

#### Durchschnitt aller Sentiments eines Charakters wird gebildet und in neues Dict geschrieben

In [145]:
all_in_all = {}
for key in test_dic:
    x = 0
    for innerkey, value in test_dic[key].items():
        x = (x + value)
        all_in_all[key] = x
for key,value in all_in_all.items():
    all_in_all[key] = value/len(test_dic[key])

In [146]:
all_in_all

{'A': 0.375, 'B': -0.5}