In [3]:
#load library and dataset
from feel_it import EmotionClassifier, SentimentClassifier
import re
import pandas as pd
import numpy as np
emotion_classifier = EmotionClassifier()
sentiment_classifier = SentimentClassifier()
corpus = pd.read_csv("../csv/cleaned_svevo_dataset_ITA.csv")

In [4]:
#return a list of the distribution of emotions of the document taken in input 
def compute_sentiment_one_document(document):
    doc_split = re.split(r'(?<=\w\.)\s', document)
    num_phrases = len(doc_split)
    anger = 0
    joy = 0
    fear = 0
    sadness = 0
    positive = 0
    negative = 0
    for i in range(0,num_phrases):
        emotion = emotion_classifier.predict([doc_split[i]])[0]
        sentiment = sentiment_classifier.predict([doc_split[i]])[0]
        if(emotion == 'anger'):
            anger += 1
        if(emotion == 'joy'):
            joy += 1
        if(emotion == 'fear'):
            fear += 1
        if(emotion == 'sadness'):
            sadness += 1
        if(sentiment == 'positive'):
            positive += 1
        if(sentiment == 'negative'):
            negative += 1
    anger = round((anger/num_phrases) * 100)
    joy = round((joy/num_phrases) * 100)
    fear = round((fear/num_phrases) * 100)
    sadness = round((sadness/num_phrases) * 100)
    positive = round((positive/num_phrases) * 100)
    negative = round((negative/num_phrases) * 100)
    sentiment = {"anger":anger,"fear":fear, "joy":joy, "sadness":sadness, "positive":positive,"negative":negative}
    return sentiment
        

In [5]:
#return a dataframe where rows are the distribution of emotions for each document of the corpus
def compute_sentiment_corpus(corpus):
    data =[]
    sentiment_frame = pd.DataFrame(data, columns = [ "anger", 'fear','joy',"sadness", "positive", "negative"])
    dim_corpus = len(corpus["text"])
    for i in range(0,dim_corpus):
        em_values = compute_sentiment_one_document(corpus["text"][i])
        sentiment_frame = sentiment_frame.append(em_values, ignore_index=True)
    return sentiment_frame

In [6]:
#take a document in input an return the emotions for each phrase in the document
def control_sentiment_one_document(document):
    data =[]
    df= pd.DataFrame(data, columns = [ "phrase", "emotion", "sentiment"])
    doc_split = re.split(r'(?<=\w\.)\s', document)
    df["phrase"] = doc_split
    num_phrases = len(doc_split)
    anger = 0
    joy = 0
    fear = 0
    sadness = 0
    for i in range(0,num_phrases):
        emotion = emotion_classifier.predict([doc_split[i]])
        sentiment = sentiment_classifier.predict([doc_split[i]])
        df["emotion"][i] = emotion
        df["sentiment"][i] = sentiment
        if(emotion == 'anger'):
            anger += 1
        if(emotion == 'joy'):
            joy += 1
        if(emotion == 'fear'):
            fear += 1
        if(emotion == 'sadness'):
            sadness += 1
    anger = round((anger/num_phrases) * 100)
    joy = round((joy/num_phrases) * 100)
    fear = round((fear/num_phrases) * 100)
    sadness = round((sadness/num_phrases) * 100)
    sentiment = {"anger": anger,"fear" : fear, "joy" : joy, "sadness" : sadness}
    return df

In [8]:
#compute emotion  to entire corpus and the emotions columns to the original dataframe
corpus_sentiment = compute_sentiment_corpus(corpus)
corpus.join(corpus_sentiment)

Unnamed: 0.1,Unnamed: 0,X,letter_number,pair,index,date,year,sender,senderLocation,recipient,...,text,tokens,doc,lemmatized_tokens,anger,fear,joy,sadness,positive,negative
0,0,17,18,Svevo Joyce,18,27/03/1928,1928,Ettore Schmitz,Trieste,James Joyce,...,"Trieste, li 27 Marzo 1928 Caro amico, Qui ho t...",trieste marzo caro amico trovare lette...,trieste marzo caro amico trovato lettere ...,trieste marzo caro amico trovare lette...,0,0,78,22,89,11
1,1,20,21,Svevo Larbaud,2,15/01/1925,1925,Ettore Schmitz,Trieste,Valéry Larbaud,...,"Trieste 10 Villa Veneziani, 15 Gennaio 1925 Es...",trieste villa veneziano gennaio esimio signore...,trieste villa veneziani gennaio esimio signore...,trieste villa veneziano gennaio esimio signore...,4,4,38,54,46,54
2,2,21,22,Svevo Larbaud,3,16/02/1925,1925,Ettore Schmitz,Trieste,Valéry Larbaud,...,Villa Veneziani Trieste 10. 16.2.1925 Esimio S...,villa veneziano trieste esimio signore caro...,villa veneziani trieste esimio signore cara ...,villa veneziano trieste esimio signore caro...,18,9,45,27,36,64
3,3,27,28,Svevo Larbaud,9,15/09/1925,1925,Ettore Schmitz,Trieste,Valéry Larbaud,...,Villa Veneziani Trieste 10 15 Settembre 1925 E...,villa veneziano trieste settembre esimio car...,villa veneziani trieste settembre esimio caro...,villa veneziano trieste settembre esimio car...,17,4,35,43,43,57
4,4,38,39,Svevo Crémieux,5,02/08/1926,1926,Ettore Schmitz,Tarasp,Benjamin Crémieux,...,"Vulpera Tarasp, [2] Agosto 1926 Carissimo amic...",vulpera tarasp agosto caro amico mille grazia ...,vulpera tarasp agosto carissimo amico mille gr...,vulpera tarasp agosto caro amico mille grazia ...,0,0,69,31,69,31
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
510,510,882,883,Svevo Prezzolini,13,12/04/1928,1928,Ettore Schmitz,Trieste,Giuseppe Prezzolini,...,"A Giuseppe Prezzolini Villa Veneziani, Trieste...",giuseppe prezzolini villa veneziano trieste ...,giuseppe prezzolini villa veneziani trieste a...,giuseppe prezzolini villa veneziano trieste ...,0,0,75,25,67,33
511,511,883,884,Svevo Rusconi Besso,14,19/04/1928,1928,Ettore Schmitz,Trieste,Bice Rusconi Besso,...,"A Bice Rusconi Besso Villa Veneziani, Trieste,...",bice rusconi besso villa veneziano trieste a...,bice rusconi besso villa veneziani trieste ap...,bice rusconi besso villa veneziano trieste a...,16,0,29,55,26,74
512,512,887,888,Svevo Rossi,24,07/07/1928,1928,Ettore Schmitz,Trieste,Adalberto Rossi,...,Ad Alberto Rossi Ella indovinò: il mio success...,alberto rosso indovin successo tutt ...,alberto rossi indovin successo tutt gran...,alberto rosso indovin successo tutt ...,0,0,80,20,80,20
513,513,888,889,Svevo Pasini,25,09/07/1928,1928,Ettore Schmitz,Trieste,Ferdinando Pasini,...,"A Ferdinando Pasini Trieste, 9 Luglio 1928 Pr...",ferdinando pasini trieste luglio pregiato si...,ferdinando pasini trieste luglio pregiatissim...,ferdinando pasini trieste luglio pregiato si...,14,0,71,14,57,43


In [12]:
corpus = corpus.join(corpus_sentiment)

In [13]:
#save the new dataframe
corpus.to_csv("../csv/cleaned_svevo_dataset_ITA.csv")

In [106]:
# How does it work for a single document??
control_sentiment_one_document(corpus["text"][3])

Unnamed: 0,phrase,emotion,sentiment
0,Villa Veneziani Trieste 10 15 Settembre 1925 E...,[sadness],[positive]
1,Io fui per brevi ore un'altra volta a Parigi e...,[joy],[positive]
2,Poi venne l'aspro: Io ero quasi sicuro che a V...,[joy],[negative]
3,"C'era, ma avevo avuto il torto d'inviarle i mi...",[sadness],[negative]
4,E le voci dal Luglio in poi si fecero sempre p...,[sadness],[negative]
5,Ma io il ricordo non voglio perderlo ed ecco c...,[joy],[positive]
6,Devo ammettere di aver esperito che anche l'in...,[fear],[negative]
7,Io vivo qui restituito interamente alla mia pi...,[sadness],[positive]
8,Il successo (io lo ebbi per qualche ora e Lei ...,[anger],[negative]
9,Vorrei cancellare il ricordo mio di quei giorni.,[sadness],[negative]


In [99]:
sentiment_classifier.predict(["in realta  so cosa dire"])[0]

'positive'