Text visualization with tweets

Esse repositório foi criado para coletar tweets referente a um assunto específico, e com isso criar visualizações para facilitar a análise do que as pessoas estão falando sobre. Esses códigos foram utilizados no meu artigo onde eu explico com mais detalhes a lógica utilizada e o que seria cada função criada, para acessar clique aqui.

Requisitos

TwitterSearch: para fazer a coleta de dados no Twitter
Pandas: para leitura e manipulação de dados
Nltk: para processar e manipular dados textuais
https://matplotlib.org/: para criar o gráfico de barras
Seaborn: para criar o gráfico de barras
Wordcloud: para visualizar a nuvem de palavras com os dados do twitter
Re: para utilizarmos regex no código
Unidecode:
Json: Para ler os dados do arquivo json

Estrutura do projeto

Atualmente o projeto está dividido assim:

Analysis_tweets.ipynb: contém o código construído.
tweets.json: dados coletados do twitter gerados pelo arquivo acima.

Entendendo a coleta e o processamento dos dados

Para você extrair os dados do Twitter, precisa colocar nos parâmetros: chave, chave secrete, token, token secreto, o assunto que você precisa e a lingua(se é em português: pt, se é em inglês: en, etc..) no seguinte método:

generate_tweet('xx','xx','xxx','xxx', 'assunto','pt')

Após isso os dados extraídos do twitter serão armazenados em um arquivo chamado 'tweets.json'

conteudo = open('tweets.json').read()

E depois esse arquivo é lido através da biblioteca json, e é necessário normalizá-lo por conta da estrutura que os dados estão vindo.

_json = json.loads(conteudo)
df = json_normalize(_json)

Após isso essas informações são transformadas em DataFrame para facilitar a manipulação dos dados.

df= pd.read_json(conteudo)

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Analysis_tweets.ipynb		Analysis_tweets.ipynb
README.md		README.md
tweets.json		tweets.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Text visualization with tweets

Requisitos

Estrutura do projeto

Entendendo a coleta e o processamento dos dados

About

Releases

Packages

Languages

lauraDamacenoAlmeida/Twitter_Analysis

Folders and files

Latest commit

History

Repository files navigation

Text visualization with tweets

Requisitos

Estrutura do projeto

Entendendo a coleta e o processamento dos dados

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages