# VADER (Valence Aware Dictionary and sEntiment Reasoner)

***

### Funcionamento do VADER

A abordagem utilizada, conhecida como VADER, baseia-se em um conjunto de técnicas que utilizam um dicionário predefinido de palavras e regras para atribuir polaridade de sentimentos (positivos, negativos ou neutros) ao texto. Como os textos analisados não possuem rótulos, não há necessidade de um modelo treinado ou de uma comparação direta com dados rotulados.

A biblioteca VADER aplica essas regras diretamente ao texto, permitindo uma análise rápida e eficiente, sem a necessidade de aprendizado a partir de grandes volumes de dados, como é comum em modelos de Machine Learning. Essa característica torna o VADER particularmente útil para a análise de sentimentos em textos curtos e informais, como postagens em redes sociais, onde a linguagem pode ser mais variada e expressiva.

Além disso, pode ser interessante usar o VADER como uma etapa inicial para classificar os textos. Posteriormente, um modelo de Machine Learning pode ser aplicado para comparar os resultados e avaliar o desempenho, o que pode ser feito de diversas maneiras, dependendo do objetivo da análise.

As duas principais funcionalidades utilizadas serão o *polarity score* e o *textblob*:

#### Polarity Score

Nessa funcionalidade, uma sentença é recebida e o retorno é um dicionário contendo as classificações de **Negativo**, **Neutro** e **Positivo** para o texto, além de um valor **Compound**, que varia entre -1 (muito negativo) e 1 (muito positivo) e representa o sentimento geral da sentença.

#### Textblob

Retorna dois índices polares, similares ao Compound do **Polarity Score**, variando entre -1 (muito negativo) e 1 (muito positivo). Além disso, há o **Subjectivity**, que indica o grau de subjetividade ou objetividade da sentença. Quanto mais próximo de 1, mais subjetiva é a sentença; quanto mais próximo de 0, mais objetiva.

***

### Importação dos dados

In [1]:
import nltk
from nltk.sentiment.vader import SentimentIntensityAnalyzer
from textblob import TextBlob

nltk.download("vader_lexicon")

[nltk_data] Downloading package vader_lexicon to
[nltk_data]     C:\Users\andrr\AppData\Roaming\nltk_data...
[nltk_data]   Package vader_lexicon is already up-to-date!


True

In [2]:
# Instanciando analyzer
analyzer = SentimentIntensityAnalyzer()

### Polarity Score

#### Frases Negativas

In [3]:
# Criando sentenças puramente negativas
neg1 = 'I HATE this movie.'
neg2 = 'I hate this movie.'
neg3 = 'I really hate this movie.'
neg4 = 'I really HATE this movie.'

In [4]:
# Analisando os retornos
print(f'Frase 1: {analyzer.polarity_scores(neg1)}')
print(f'Frase 2: {analyzer.polarity_scores(neg2)}')
print(f'Frase 3: {analyzer.polarity_scores(neg3)}')
print(f'Frase 4: {analyzer.polarity_scores(neg4)}')

Frase 1: {'neg': 0.689, 'neu': 0.311, 'pos': 0.0, 'compound': -0.6633}
Frase 2: {'neg': 0.649, 'neu': 0.351, 'pos': 0.0, 'compound': -0.5719}
Frase 3: {'neg': 0.571, 'neu': 0.429, 'pos': 0.0, 'compound': -0.6115}
Frase 4: {'neg': 0.612, 'neu': 0.388, 'pos': 0.0, 'compound': -0.6933}


Os exemplos fornecidos ilustram como o VADER analisa o sentimento em frases com variações sutis: 

A sentença "*I HATE this movie*" apresenta a maior proporção negativa (68,9%) e um valor compound de **-0.6633**, devido ao uso da palavra "ODEIO" em letras maiúsculas, que confere mais potencialidade ao sentimento. 

Na frase "*I hate this movie*", a intensidade do sentimento negativo diminui ligeiramente, resultando em uma proporção de 64,9% e um valor compound de **-0.5719**. 

A terceira sentença: "*I really hate this movie*" incorpora o modificador "*really*", que suaviza a força da palavra "hate", levando a uma proporção negativa de 57,1% e um compound de **-0.6115**.

Por fim, a última sentença contém o "realmente ODEIO" e possui a nota mais negativa, com **-0.6933**. 



#### Frases Neutras

In [5]:
# Criando sentenças negativas neutra
neu1 = 'The movie`s plot is old.'
neu2 = 'The movie`s plot is very old.'
neu3 = 'I have seen this plot before.'

In [6]:
# Analisando os retornos
print(f'Frase 1: {analyzer.polarity_scores(neu1)}')
print(f'Frase 2: {analyzer.polarity_scores(neu2)}')
print(f'Frase 3: {analyzer.polarity_scores(neu3)}')

Frase 1: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}
Frase 2: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}
Frase 3: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}


Os exemplos mostram como o VADER classifica frases neutras. Na frase "The movie's plot is old," o resultado é {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}, indicando que não há polaridade emocional. O mesmo acontece com "The movie's plot is very old," onde, apesar do modificador "very," a frase continua neutra. Na terceira frase, "I have seen this plot before," o resultado é idêntico, reforçando que todas as frases analisadas são avaliadas como neutras, sem carga emocional.

#### Emojis

In [7]:
# Criando emojis
emj1 = ':)'
emj2 = '=D'
emj3 = ':/'
emj4 = ':|'

In [8]:
# Analisando os retornos
print(f'Frase 1: {analyzer.polarity_scores(emj1)}')
print(f'Frase 2: {analyzer.polarity_scores(emj2)}')
print(f'Frase 3: {analyzer.polarity_scores(emj3)}')
print(f'Frase 4: {analyzer.polarity_scores(emj4)}')

Frase 1: {'neg': 0.0, 'neu': 0.0, 'pos': 1.0, 'compound': 0.4588}
Frase 2: {'neg': 0.0, 'neu': 0.0, 'pos': 1.0, 'compound': 0.5106}
Frase 3: {'neg': 1.0, 'neu': 0.0, 'pos': 0.0, 'compound': -0.34}
Frase 4: {'neg': 1.0, 'neu': 0.0, 'pos': 0.0, 'compound': -0.1027}


Os resultados da análise de emojis pelo VADER revelam como expressões não verbais são interpretadas.

O emoji :) apresenta uma pontuação totalmente positiva, com 100% de positividade e um valor compound de **0.4535**.

O emoji =D, que indica risada, também é classificado como positivo, com 100% de positividade e um compound de **0.7031**.

Já o emoji :/ expressa tristeza, resultando em 100% de negatividade compound levemente negativo de **-0.0506**.

Por fim, o emoji :|, que sugere certa indiferença, é interpretado como totalmente negativo - porém, com uma baixa intensidade -, resultando em um valor compound de **-0.1027**, indicando um sentimento levemente negativo

### TextBlob

In [9]:
# Instanciando os objetos TextBlob
txtb1 = TextBlob(neg1)
txtb2 = TextBlob(neg2)
txtb3 = TextBlob(neg3)
txtb4 = TextBlob(neg4)

In [10]:
# Analisando os retornos
print(f'Frase 1: {txtb1.sentiment}')
print(f'Frase 2: {txtb2.sentiment}')
print(f'Frase 3: {txtb3.sentiment}')
print(f'Frase 4: {txtb4.sentiment}')

Frase 1: Sentiment(polarity=-0.8, subjectivity=0.9)
Frase 2: Sentiment(polarity=-0.8, subjectivity=0.9)
Frase 3: Sentiment(polarity=-0.8, subjectivity=0.9)
Frase 4: Sentiment(polarity=-0.8, subjectivity=0.9)


Ao experimentar as mesmas frases negativas pelo TextBlob, observamos uma mesma polaridade e subjetividade em cada uma delas.

In [11]:
# Nova frase
txtb5 = TextBlob('I hate this movie. It`s very sad.')
print(f'Frase 5: {txtb5.sentiment}')

Frase 5: Sentiment(polarity=-0.7250000000000001, subjectivity=0.95)


Em contraste, a nova frase "I hate this movie. It’s very sad." resultou em uma polaridade de -0.725 e subjetividade de 0.95. 

De forma que, embora a frase ainda expresse um sentimento negativo, a adição da expressão "It’s very sad" diminui a intensidade da negatividade em relação às sentenças anteriores.