# Análise de Sentimento - Exemplos introdutórios

In [None]:
from textblob import TextBlob
import pandas as pd
import nltk

In [None]:
# Normalmente apenas necessário se usar o google colab
nltk.download('punkt')

Considere os seguintes textos:

In [None]:
textos = [ "The movie was good.",
          "I hate the movie",
          "The movie was not good.",
          "I really think this product sucks.",
          "Really great product.",
          "I don't like this product"]

De seguida, vamos aplicar duas estratégias básicas para atribuir o sentimento a um texto.
1. Aplicar uma ferramenta já treinada
2. aplicar um léxico de sentimento

## Aplicação de uma ferramenta pré-treinada
Existem já um conjunto de bibliotecas que permitem classificar um pedaço de texto quanto ao sentimento. Uma dessas bibliotecas é a "textblob".

In [None]:
for t in textos:
    print(t, "==>", TextBlob(t).sentiment.polarity)

The previous code assumes that the text is already split into sentences, which may not be the case of texts comming from sources, such as *web pages* or *blogs*. An alternate solution would be to give the whole text to `textblob` as follows.

In [None]:
texto=TextBlob("""The movie was good. The movie was not good. I really think this product sucks.
Really great product. I don't like this product""")

In [None]:
for s in texto.sentences:
    print("=>", s)

In [None]:
for s in texto.sentences:
    print(s, "==> ", s.sentiment.polarity)

## Aplicação de um léxico de sentimento

Leitura do léxico de sentimento

In [None]:
#data = pd.read_csv("../data/en/NCR-lexicon.csv", encoding="utf-8")
data = pd.read_csv("https://raw.githubusercontent.com/fmmb/Text-Mining/main/data/NRC-lexicon.csv", encoding="utf-8")
data.sample(5)

In [None]:
data.set_index("English", inplace=True)
lex1 = data["Positive"] - data["Negative"]
lex1.sample(5)

Por vezes, os dataframes e as séries são pouco eficientes e, neste caso, a informação pode ser facilmente representada por um simples dicionário, o que tornará o nosso código muito mais rápido...

In [None]:
lex2 = lex1.to_dict()

Como usar este lexico para processar um texto? 

In [None]:
texto = 'I hate to say goodbye but I love chocolate'
soma = 0
for w in texto.split():
    soma = soma + lex2.get(w, 0)
    print(w, lex2.get(w, 0) )
print("Soma:" , soma)

Ou melhor ainda, fazendo uma função...

In [None]:
def sentimento(texto):
    soma = 0
    for w in texto.split():
        soma = soma + lex2.get(w, 0)
        #print(w, lex2.get(w, 0) )
    #print("Soma:" , soma)
    if soma >= 0:
        return "POS"
    else:
        return "NEG"

In [None]:
text = 'I hate to say goodbye but I love chocolate'
sentimento(text)

In [None]:
for texto in textos:
    print(sentimento(texto))