# Uso de Bibliotecas Python

Existem várias bibliotecas que podem ser utilizadas para realizar análise de sentimento e emoção. Vamos conhecer algumas delas:

- **TextBlob** (https://textblob.readthedocs.io)
- **NLTK** (https://www.nltk.org/)
- **Pattern** (https://www.clips.uantwerpen.be/pages/pattern-en#sentiment)

# Análise de Sentimento com TextBlob

**APRESENTAÇÃO**:

O TextBlob visa fornecer acesso a operações comuns de processamento de texto através de uma interface familiar. Você pode tratar os objetos TextBlob como se fossem cadeias Python que aprenderam como processar o idioma natural.

**ESPECIFICAÇÕES**:

A propriedade sentiment retorna uma tupla (polaridade, subjetividade). 
- POLARITY - é um valor contínuo que varia de -1.0 a 1.0, sendo -1.0 referente a 100% negativo e 1.0 a 100% positivo.
- SUBJECTIVITY - que também é um valor contínuo que varia de 0.0 a 1.0, sendo 0.0 referente a 100% objetivo e 1.0 a 100% subjetivo. 

**apenas em inglês**. 

- Site oficial: https://textblob.readthedocs.io
- Documentação: https://textblob.readthedocs.io/en/dev/quickstart.html

# Exemplo TextBlob

In [1]:
# Exemplo TextBlob - Passo 1
#
# Instalando a biblioteca do TextBlob
#
!pip install --upgrade textblob

Collecting textblob
  Using cached https://files.pythonhosted.org/packages/7c/7d/ad09a26b63d4ad3f9395840c72c95f2fc9fa2b192094ef14e9e720be56f9/textblob-0.15.2-py2.py3-none-any.whl
Collecting nltk>=3.1 (from textblob)
Collecting singledispatch (from nltk>=3.1->textblob)
  Using cached https://files.pythonhosted.org/packages/c5/10/369f50bcd4621b263927b0a1519987a04383d4a98fb10438042ad410cf88/singledispatch-3.4.0.3-py2.py3-none-any.whl
Installing collected packages: singledispatch, nltk, textblob
Successfully installed nltk-3.4 singledispatch-3.4.0.3 textblob-0.15.2


In [2]:
# Exemplo TextBlob - Passo 2
#
# Realizando uma chamada simples com texto em inglês
#
from textblob import TextBlob
# Definindo um texto a ser analisado
sentence = TextBlob('Team, I know that times are tough! Product '\
        'sales have been disappointing for the past three '\
        'quarters. We have a competitive product, but we '\
        'need to do a better job of selling it!')
# Imprimindo o resultado da análise
print(sentence.sentiment)
print('Polaridade: {}'.format(sentence.sentiment.polarity))
print('-------------------------------------------------------------')    

Sentiment(polarity=-0.17777777777777776, subjectivity=0.5708333333333333)
Polaridade: -0.17777777777777776
-------------------------------------------------------------


In [3]:
# Exemplo TextBlob - Passo 3
#
# Traduzindo para o inglês antes de submeter
#
from textblob import TextBlob
# Definindo um texto a ser analisado
sentence = TextBlob('O resultado da primeira chamada do Sistema de Seleção Unificada (Sisu) '\
        'foi divulgado nesta segunda-feira (28). Para acessar a lista de aprovados, '\
        'é preciso entrar no site do programa. As matrículas ocorrerão entre 30 de '\
        'janeiro e 4 de fevereiro. Nesse período, os candidatos precisarão reunir '\
        'os documentos exigidos e comparecer ao endereço informado pela instituição de ensino em que estudarão.')
# Detectando o idoma e traduzindo para o inglês
print('Idioma: {}'.format(sentence.detect_language()))
print('-------------------------------------------------------------')
sentence = sentence.translate(to='en')
print('Tradução: {}'.format(sentence))
print('-------------------------------------------------------------')
# Imprimindo o resultado da análise
print(sentence.sentiment)
print('Polaridade: {}'.format(sentence.sentiment.polarity))
print('-------------------------------------------------------------')

Idioma: pt
-------------------------------------------------------------
Tradução: The result of the first call of the Unified Selection System (Sisu) was released on Monday (28). To access the approved list, you must enter the program's website. Registration will take place between January 30 and February 4. During this period, candidates will need to gather the required documents and attend the address informed by the educational institution in which they will study.
-------------------------------------------------------------
Sentiment(polarity=0.25, subjectivity=0.29166666666666663)
Polaridade: 0.25
-------------------------------------------------------------


---

### Exercício 1

Copie e cole a célula acima

Busque três textos em português na Internet e salve-os em um arquivo à parte.

Para cada um dos textos, substitua a variável original_text pelo texto, execute e anote os resultados no arquivo. Avalie os resultados.

Dica: Se o texto for grande, utilize as aspas triplas ''' para separar o texto. Ex: 

original_text = '''
    exemplo de texto
    ... 
    final do texto
    '''

---

# Análise de Sentimento com NLTK Vader

**APRESENTAÇÃO**:

O NLTK vem com um módulo interno de análise de sentimentos - nltk.sentiment.vader - que pode analisar um trecho de texto e classificar as sentenças em polaridade positiva, negativa e neutra de sentimentos. 

**ESPECIFICAÇÕES**:

Provê uma pontuação de intensidade de sentença às sentenças. Retorna no formato 
- neg: valor de 0 a 1 que representa sentimento negativo
- neu: valor de 0 a 1 que representa sentimento neutro
- pos: valor de 0 a 1 que representa sentimento positivo
- compound: Valor composto pela normalização da soma dos sentimentos do texto 

**apenas em inglês**. 

- Site oficial e documentação: http://www.nltk.org/api/nltk.sentiment.html

# Exemplo NLTK Vader

In [4]:
# Exemplo NLTK Vader - Passo 1
#
# Instalando a biblioteca do NLTK, baixando a base léxica do Vader
# Baixando também a biblioteca googletrans para fazer tradução com o Google Translate
#
!pip install --upgrade nltk
import nltk
nltk.download('vader_lexicon')
!pip install googletrans

Requirement already up-to-date: nltk in /home/03662232677/anaconda3/envs/pln_ase/lib/python3.6/site-packages (3.4)


[nltk_data] Downloading package vader_lexicon to
[nltk_data]     /home/03662232677/nltk_data...
[nltk_data]   Package vader_lexicon is already up-to-date!


Collecting googletrans
Installing collected packages: googletrans
Successfully installed googletrans-2.4.0


In [5]:
# Exemplo NLTK Vader - Passo 2
#
# Realizando uma chamada simples com texto em inglês
#
import nltk
from nltk.sentiment.vader import SentimentIntensityAnalyzer 
# Definindo um texto a ser analisado
sentence = 'Team, I know that times are tough! Product '\
        'sales have been disappointing for the past three '\
        'quarters. We have a competitive product, but we '\
        'need to do a better job of selling it!'
print(sentence)
print('-------------------------------------------------------------')
# Fazendo a chamada  
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)
for k in ss:
    print('{0}: {1}, '.format(k, ss[k]), end='\n')
print('-------------------------------------------------------------')    

Team, I know that times are tough! Product sales have been disappointing for the past three quarters. We have a competitive product, but we need to do a better job of selling it!
-------------------------------------------------------------
neg: 0.095, 
neu: 0.74, 
pos: 0.165, 
compound: 0.5321, 
-------------------------------------------------------------


In [6]:
# Exemplo NLTK Vader - Passo 2
#
# Traduzindo para o inglês antes de submeter
#
from googletrans import Translator
import nltk
from nltk.sentiment.vader import SentimentIntensityAnalyzer 
# Definindo um texto a ser analisado
sentence = 'O resultado da primeira chamada do Sistema de Seleção Unificada (Sisu) '\
        'foi divulgado nesta segunda-feira (28). Para acessar a lista de aprovados, '\
        'é preciso entrar no site do programa. As matrículas ocorrerão entre 30 de '\
        'janeiro e 4 de fevereiro. Nesse período, os candidatos precisarão reunir '\
        'os documentos exigidos e comparecer ao endereço informado pela instituição de ensino em que estudarão.'
translator = Translator()
translation = translator.translate(sentence, dest='en').text
print('Tradução: {}'.format(translation))
print('-------------------------------------------------------------')
# Fazendo a chamada  
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)
for k in ss:
    print('{0}: {1}, '.format(k, ss[k]), end='\n')
print('-------------------------------------------------------------')

Tradução: The result of the first call of the Unified Selection System (Sisu) was released on Monday (28). To access the list of approved, you must enter the website of the program. Registration will take place between January 30 and February 4. During this period, candidates will need to gather the required documents and attend the address informed by the educational institution in which they will study.
-------------------------------------------------------------
neg: 0.039, 
neu: 0.961, 
pos: 0.0, 
compound: -0.296, 
-------------------------------------------------------------


---

### Exercício 2

Copie e cole a célula acima

Utilizando os três textos salvos no Exercício 1, faça:
    
Para cada um dos textos, substitua a variável original_text pelo texto, execute e anote os resultados no arquivo. 

Avalie os resultados. Foi melhor ou pior que o TextBlob?

---

# Análise de Sentimento com Pattern

**APRESENTAÇÃO**:

O módulo pattern.en contém um tagger fast-of-speech para o inglês (identifica substantivos, adjetivos, verbos, etc. em uma frase), análise de sentimento, ferramentas para conjugação de verbos em inglês e singularização e pluralização de substantivos e uma interface WordNet.

**ESPECIFICAÇÕES**:

A função **sentiment()** retorna um parâmetro (polaridade, subjetividade) para a frase dada, com base nos adjetivos que ela contém, onde:
- **polaridade** é um valor entre -1,0 e +1,0 
- **subjetividade** entre 0,0 e 1,0. 

A sentença pode ser uma string, texto, frase, pedaço, palavra ou uma sincronia (veja abaixo).

A função **positive()** retorna True se a polaridade da sentença dada estiver acima do limite. O limite pode ser reduzido ou aumentado, mas, em geral, o +0.1 fornece os melhores resultados para análises de produtos. A precisão é de cerca de 75% para revisões de filmes.

Nota: Existe que esteja instalado o pacote libmysqlclient-dev no Linux

**apenas em inglês**. 

- Site oficial e documentação: https://www.clips.uantwerpen.be/pages/pattern-en#sentiment

# Exemplo Pattern

In [7]:
# Exemplo Pattern - Passo 1
#
# Instalando a biblioteca do Pattern
#
# Executar primeiro: 
#   sudo apt-get install libmysqlclient-dev
!pip install --upgrade pattern

Collecting pattern
Collecting future (from pattern)
Collecting backports.csv (from pattern)
  Using cached https://files.pythonhosted.org/packages/71/f7/5db9136de67021a6dce4eefbe50d46aa043e59ebb11c83d4ecfeb47b686e/backports.csv-1.0.6-py2.py3-none-any.whl
Collecting beautifulsoup4 (from pattern)
  Using cached https://files.pythonhosted.org/packages/1d/5d/3260694a59df0ec52f8b4883f5d23b130bc237602a1411fa670eae12351e/beautifulsoup4-4.7.1-py3-none-any.whl
Collecting feedparser (from pattern)
Collecting pdfminer.six (from pattern)
  Using cached https://files.pythonhosted.org/packages/8a/fd/6e8746e6965d1a7ea8e97253e3d79e625da5547e8f376f88de5d024bacb9/pdfminer.six-20181108-py2.py3-none-any.whl
Collecting scipy (from pattern)
  Using cached https://files.pythonhosted.org/packages/67/e6/6d4edaceee6a110ecf6f318482f5229792f143e468b34a631f5a0899f56d/scipy-1.2.0-cp36-cp36m-manylinux1_x86_64.whl
Collecting mysqlclient (from pattern)
Collecting python-docx (from pattern)
Collecting cherrypy (from pa

In [8]:
# Exemplo Pattern - Passo 2
#
# Realizando uma chamada simples da função sentiment() com texto em inglês
#
from pattern.en import sentiment 
from pattern.en import positive 
# Definindo um texto a ser analisado
sentence = 'Team, I know that times are tough! Product '\
        'sales have been disappointing for the past three '\
        'quarters. We have a competitive product, but we '\
        'need to do a better job of selling it!'
print(sentence)
print('-------------------------------------------------------------')
# Fazendo a chamada de sentiment()
print('Sentimento: {}'.format(sentiment(sentence)))
print('-------------------------------------------------------------')
# Fazendo a chamada de positive()
print('Sentimento Positivo: {}'.format(positive(sentence,threshold=0.1)))
print('-------------------------------------------------------------')

Team, I know that times are tough! Product sales have been disappointing for the past three quarters. We have a competitive product, but we need to do a better job of selling it!
-------------------------------------------------------------
Sentimento: (-0.17777777777777776, 0.5708333333333333)
-------------------------------------------------------------
Sentimento Positivo: False
-------------------------------------------------------------


In [9]:
# Exemplo Pattern - Passo 3
#
# Traduzindo para o inglês antes de submeter
#
from googletrans import Translator
import nltk
from nltk.sentiment.vader import SentimentIntensityAnalyzer 
# Definindo um texto a ser analisado
sentence = 'O resultado da primeira chamada do Sistema de Seleção Unificada (Sisu) '\
        'foi divulgado nesta segunda-feira (28). Para acessar a lista de aprovados, '\
        'é preciso entrar no site do programa. As matrículas ocorrerão entre 30 de '\
        'janeiro e 4 de fevereiro. Nesse período, os candidatos precisarão reunir '\
        'os documentos exigidos e comparecer ao endereço informado pela instituição de ensino em que estudarão.'
translator = Translator()
translation = translator.translate(sentence, dest='en').text
print('Tradução: {}'.format(translation))
print('-------------------------------------------------------------')
# Fazendo a chamada de sentiment()
print('Sentimento: {}'.format(sentiment(translation)))
print('-------------------------------------------------------------')
# Fazendo a chamada de positive()
print('Sentimento Positivo: {}'.format(positive(translation,threshold=0.1)))
print('-------------------------------------------------------------')

Tradução: The result of the first call of the Unified Selection System (Sisu) was released on Monday (28). To access the list of approved, you must enter the website of the program. Registration will take place between January 30 and February 4. During this period, candidates will need to gather the required documents and attend the address informed by the educational institution in which they will study.
-------------------------------------------------------------
Sentimento: (0.25, 0.29166666666666663)
-------------------------------------------------------------
Sentimento Positivo: True
-------------------------------------------------------------


---

### Exercício 3

Copie e cole a célula acima

Utilizando os três textos salvos no Exercício 1, faça:
    
Para cada um dos textos, substitua a variável original_text pelo texto, execute e anote os resultados no arquivo. 

Avalie os resultados. Foi melhor ou pior que o TextBlob e NLTK-Vader?

E em comparação ao NLU do notebook anterior, qual foi melhor?

---

FIM