Skip to content

lauraDamacenoAlmeida/Twitter_Analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Text visualization with tweets

Esse repositório foi criado para coletar tweets referente a um assunto específico, e com isso criar visualizações para facilitar a análise do que as pessoas estão falando sobre. Esses códigos foram utilizados no meu artigo onde eu explico com mais detalhes a lógica utilizada e o que seria cada função criada, para acessar clique aqui.

Requisitos

  1. TwitterSearch: para fazer a coleta de dados no Twitter

  2. Pandas: para leitura e manipulação de dados

  3. Nltk: para processar e manipular dados textuais

  4. https://matplotlib.org/: para criar o gráfico de barras

  5. Seaborn: para criar o gráfico de barras

  6. Wordcloud: para visualizar a nuvem de palavras com os dados do twitter

  7. Re: para utilizarmos regex no código

  8. Unidecode:

  9. Json: Para ler os dados do arquivo json

Estrutura do projeto

Atualmente o projeto está dividido assim:

  • Analysis_tweets.ipynb: contém o código construído.
  • tweets.json: dados coletados do twitter gerados pelo arquivo acima.

Entendendo a coleta e o processamento dos dados

Para você extrair os dados do Twitter, precisa colocar nos parâmetros: chave, chave secrete, token, token secreto, o assunto que você precisa e a lingua(se é em português: pt, se é em inglês: en, etc..) no seguinte método:

generate_tweet('xx','xx','xxx','xxx', 'assunto','pt')

Após isso os dados extraídos do twitter serão armazenados em um arquivo chamado 'tweets.json'

conteudo = open('tweets.json').read()

E depois esse arquivo é lido através da biblioteca json, e é necessário normalizá-lo por conta da estrutura que os dados estão vindo.

_json = json.loads(conteudo)
df = json_normalize(_json)

Após isso essas informações são transformadas em DataFrame para facilitar a manipulação dos dados.

df= pd.read_json(conteudo)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published