# O que o twitter está pensando?

# Extraindo informações em redes sociais utilizando Python

`> por: `[@profadolfoguimaraes](http://www.twitter.com/profadolfoguimaraes)

Estes tutoriais apresentam os principais scritps desenvolvidos no minicurso: **O que o twitter está pensando? Extraindo informações em redes sociais utilizando Python**. O conteúdo está dividio em dois repositórios: (1) [d2l-minicursotwitter-notebook](http://github.com/adolfoguimaraes/d2l-minicursotwitter-notebook) que possui estes notebooks e (2) [d2l-minicursotwitter-web](http://github.com/adolfoguimaraes/d2l-minicursotwitter-web) que possui a página web desenvolvida.

O material completo do minicurso pode ser encontrado em: http://www.data2learning.com/cursos.

# 04 - Análise de Texto

O exemplo a seguir ilustra o uso de ferramentas de análise e extração de informações de textos. No exemplo, iremos usar a ferramenta de *Natural Language Understanding* do IBM Watyson. Para usar a API é necessário se cadastrar no [IBM Cloud](https://www.ibm.com/cloud/). Detalhes em como usar a ferramenta estão disponíveis em: https://www.ibm.com/watson/developercloud/natural-language-understanding/api/v1/. Outros grandes players como Google, Microsoft e Amazon possui ferramentas semelhantes. Normalmente, o seu uso tem um custo, mas muitas delas fornecem uso limitado sem cobrança.  


O primeiro passo é instalar o pacote `watson-developer-cloud`. 

In [None]:
!pip install --upgrade watson-developer-cloud

Em seguida, devemos instanciar a classe `NaturalLanguageUnderstandingV1`. Os atributos `username` e `password` devem ser gerados a partir de sua conta da IBM Cloud no momento da criação do serviço de *Natural Language Understanding*. 

In [None]:
import json
from watson_developer_cloud import NaturalLanguageUnderstandingV1
from watson_developer_cloud.natural_language_understanding_v1 \
  import Features, EntitiesOptions, KeywordsOptions

natural_language_understanding = NaturalLanguageUnderstandingV1(
  username='username',
  password='password',
  version='2018-10-18')

Em seguida, definimos uma função que dado um texto usa a API do IBM Watson para fazer a análise do texto. O retorno é um json com o resultado da análise. O parâmetros da análise e o que é retornado pelo método estão descritos na documentação da API disponível [neste link](https://www.ibm.com/watson/developercloud/natural-language-understanding/api/v1/).

In [None]:
def analyse_text(text): 
    
    print("Texto: %s" % text )
    
    response = natural_language_understanding.analyze(
    text=text,
    features=Features(
        entities=EntitiesOptions(
            emotion=True,
            sentiment=True
        ),
        keywords=KeywordsOptions(
            emotion=True,
            sentiment=True
        )
    )
    ).get_result()
    
    return response;


O método `print_result` recebe como parâmetro o retorno do método anterior e imprime informações relevantes do resultado da análise.

In [None]:
def print_result(response):
    
    print("Language: %s" % response['language'])
    print("")
    print("Keywords")
    for keyword in response['keywords']:
        
        print("\t%s (%s, %f)" % (keyword['text'], keyword['sentiment']['label'], keyword['relevance']))
    
    print("")
    print("Entities")
    for entitie in response['entities']:
        
        print("\t%s (%s, %s)" % (entitie['text'], entitie['type'], entitie['sentiment']['label'] ))
    

### Exemplo

In [None]:
text = 'IBM is an American multinational technology company ' \
       'headquartered in Armonk, New York, United States, ' \
       'with operations in over 170 countries.'

In [None]:
response = analyse_text(text)
print_result(response)

Podemos passar um texto em portugês. No entanto, o reconhecimento é mais preciso no texto em inglês, mas de forma geral funciona bem. Vejamos o exemplo a seguir:

In [None]:
text_pt = "O Brasil passa por um momento muito difícil. A polarizada disputa entre " \
            "os principais candidatos a presidência, Fernando Haddad e Jair Bolsonaro, " \
            "tem gerado muita discussão e disseminação de fake news na internet."

In [None]:
response = analyse_text(text_pt)
print_result(response)

É isso. Esse é um material inicial de análise de texto. Pretendo ao longo das execuções deste minicurso ir ampliando cada vez mais essa parte do material. Acompanhe as atualizações no repositório. Qualquer dúvida ou sugestão, só entrar em contado: [@profadolfoguimaraes](http://www.instagram.com/profadolfoguimaraes) ou [adolfo@data2learning.com](mailto:adolfo@data2learning.com).