### Aula 2 
#### Análise de Sentimentos de tweets com textblob

Uma forma muito útil afim de recolher dados de algum assunto requerido é a ultilização de interpretação de linguagem natural, nesta aula vamos aplicar tal técnica em dados baixados do twitter.

Para baixar os tweets em tempo real você precisa de uma conta de desenvolvedor que pode ser criada [aqui]("https://developer.twitter.com")
Caso não tenha a conta você pode baixar seus datasets para treino [aqui]("https://twitter-sentiment-csv.herokuapp.com")

A biblioteca ultilizada para realizar as análises é a [textblob]("https://textblob.readthedocs.io/en/dev/") essa biblioteca realiza análize de linguagem de uma forma muito simples de usar, clique [aqui]("https://textblob.readthedocs.io/en/dev/install.html") e siga os passos para instalação. Existem outras bibliotecas mais complexas com muitas outras funções para reconhecimento e interpretaação de linguagem natural, se você quer se aprofundar nesse conteúdo vale a pena dar uma olhada pois tais bibliotecas são ultilizadas em aplicações reais e robustas, nosso exemplo é didático.

* [NLTK]("https://www.nltk.org")
* [SPACY]("https://spacy.io")


#### Primeiro vamos ver como textblob funciona com alguns comandos básicos para trabalhar com strings


In [2]:
from textblob import TextBlob as tb
string = tb("Arara Makerspace")
string[0:6]      #pega posição 0 até 6

TextBlob("Arara ")

In [3]:
string.upper()  #passa pra maiusculo 

TextBlob("ARARA MAKERSPACE")

In [4]:
string2 = tb(" - Luan para presidente") 
string + string2 #concatena as strings

TextBlob("Arara Makerspace - Luan para presidente")

## Tokenização

O textblob transforma as mensagens em uma sequencia tokens para que assim elas possam ser processadas.
Criando um objeto do tipo tb (textblob) e ultilizando o metodo sentences pode-se ver as sentenças tokenizadas.

In [5]:
blob = tb("Luan Manao is a wonderful person, he should be our president.")
blob.sentences

[Sentence("Luan Manao is a wonderful person, he should be our president.")]

#### Em um laço for podemos visualizar as sentenças separadamente

In [6]:
for words in blob.sentences[0].words:  ## imprime as palavras da primeira sentença
 print (words)

Luan
Manao
is
a
wonderful
person
he
should
be
our
president


### Extraindo substantivos
Como extraímos as palavras da seção anterior, em vez disso, podemos extrair as frases nominais do textblob. A extração de frase de substantivo é particularmente importante quando você deseja analisar o “quem” em uma frase. Vamos ver um exemplo abaixo.

In [7]:
for np in blob.noun_phrases:
 print (np)

luan manao
wonderful person


## Análise de sentimentos

A análise de sentimentos basicamente captura as sentenças na frase e processa elas para verificar verificar o contexto assim determinando se a emoção é positiva, negativa ou neutra.

A função sentiment do textblob retorna dois valores, ***polarity***, e ***subjectivity***

***polarity*** Varia de -1 a 1, onde 1 representa um sentimento positivo e -1 negativo.
***Subjectivity*** Varia de 0 a 1 e esta relacionado a opinião, quanto maior maior a probabilidade de que a sentença seja uma opinião pessoal.

In [8]:
blob.sentiment

Sentiment(polarity=1.0, subjectivity=1.0)

#### Obtivemos nessa sentença 1 e 1, onde a polatiry 1 representa que estamos falando bem de luan e subjective representa que é uma opinião pessoal, não uma constatação.

#### Agora vamos alterar a sentença e verificar o resultado

In [9]:
blob = tb("Luan is a sucker, I never want to talk about this asshole anymore.")
blob.sentiment

Sentiment(polarity=-0.3, subjectivity=0.8)

#### Obtivemos nessa sentença -0.3 e 1, onde a polatiry negativa representa que estamos falando mal de luan e subjective em 0.8 representa que é uma opinião pessoal, não uma constatação.

# Tradutor nativo

O textblob também tem uma ferramenta de tradução, e isso é muito útil pois a base de dados esta treinada para ter o melhor funcionamento em ingles, portanto antes de fazer a análise traduzimos ultilizando o textblob para ingles. A função detect_language já detecta automaticamente o idioma nativo.


In [21]:
blob = tb("O gabriel com certeza é a pessoa mais legal do makerspace")
blob.detect_language()

'pt'

***Para traduzir ultilizamos o comando translate***

In [22]:
blob.translate()

TextBlob("Gabriel is certainly the coolest person on the makerspace.")

*** Em seguida realizamos a análise***

In [23]:
blob.sentiment

Sentiment(polarity=0.2, subjectivity=0.2)

Analisando o resultado obtemos 0.2 e 0.2, que por sua vez indica que o sentimento é positivo sobre Gabriel e como subjectivity é baixo não se trata de uma opinião pessoal e sim uma constatação. ***Atenção, palavras como certamente influenciam diretamente o subjectivity***

# Vamos aplicar esses conceitos