# Coleta e AnÃ¡lise de Tweets com a API do Twitter (X)

Este trabalho tem como objetivo demonstrar a coleta, limpeza e anÃ¡lise de tweets em tempo real usando a API oficial do Twitter, com foco em um tema de interesse. Ao final, sÃ£o feitas anÃ¡lises simples de conteÃºdo e sentimentos.

Tema escolhido: **Esportes**


## 1. Coleta dos tweets

Nesta etapa, utilizei a API do Twitter (v2) com um Bearer Token para buscar os 50 tweets mais recentes contendo a palavra-chave **"Esportes"**.

A requisiÃ§Ã£o foi feita utilizando a biblioteca `requests`, com parÃ¢metros definidos para limitar o nÃºmero de resultados e garantir o uso eficiente da API.


In [None]:
import requests

bearer_token = "AAAAAAAAAAAAAAAAAAAAAMLc0AEAAAAA2Q2iwlSRfHonSJk%2BxjDFsP1ZX8c%3DxxeyplHGIAlYyh5rd1gzMFW2r3SyKNEU6JC536DUbWRIegikLN"

# URL de busca
def montar_url_busca(query):
    base_url = "https://api.twitter.com/2/tweets/search/recent"
    return f"{base_url}?query={query}&max_results=50&tweet.fields=lang"

# FunÃ§Ã£o para obter tweets
def obter_tweets(url, bearer):
    headers = {
        "Authorization": f"Bearer {bearer}"
    }
    resposta = requests.get(url, headers=headers)
    if resposta.status_code != 200:
        raise Exception(f"Erro: {resposta.status_code}\n{resposta.text}")
    return resposta.json()

tema = "esportes" 
url = montar_url_busca(tema)
tweets = obter_tweets(url, bearer_token)

# Mostrar os textos dos tweets
if "data" in tweets:
    for tweet in tweets["data"]:
        print(tweet["text"])
else:
    print("Nenhum tweet encontrado.")


Jorge Jesus, ex-Flamengo, contratado na SeleÃ§Ã£o Brasileira tem resposta de Neymar
https://t.co/44getyjiSC
@guilhermedias Ei, @guilhermedias, com base nos seus posts, vocÃª parece se alinhar a uma figura conservadora, possivelmente Jair Bolsonaro. Sua crÃ­tica a Lula e interaÃ§Ã£o com Joice Hasselmann, apoiadora de Bolsonaro, sugerem uma tendÃªncia Ã  direita. Apesar do foco em esportes, seus comentÃ¡rios https://t.co/fojVr3QS46
@iamgomesmatheus OlÃ¡, Matheus! Pelos seus posts, vocÃª parece com uma figura polÃ­tica ligada Ã  tecnologia e esportes, como Luiz Philippe de Orleans e BraganÃ§a. Seu foco em tech (ex.: Huawei vs iPhone) e futebol, alÃ©m de interaÃ§Ãµes com perfis de direita, sugere uma inclinaÃ§Ã£o conservadora. Mas, https://t.co/rLErsJKD5W
@douglasperdigao Ei, @douglasperdigao! Sem acesso total aos seus tuÃ­tes, Ã© difÃ­cil cravar, mas pelo seu portuguÃªs e possÃ­veis laÃ§os com esportes (talvez futebol 7), vocÃª pode lembrar uma figura pÃºblica brasileira como Neymar, pelo

## 2. Limpeza dos tweets

Os tweets coletados foram tratados para facilitar a anÃ¡lise textual. Foi removido:

- Links
- MenÃ§Ãµes a outros usuÃ¡rios (@usuÃ¡rio)
- Hashtags
- PontuaÃ§Ãµes
- Letras maiÃºsculas (convertidas para minÃºsculas)

Essa limpeza me ajudou a evitar ruÃ­dos nas contagens e anÃ¡lises posteriores.


In [2]:
import re

def limpar_texto(texto):
    texto = texto.lower()  # minÃºsculas
    texto = re.sub(r"http\S+", "", texto)  # remove links
    texto = re.sub(r"@\w+", "", texto)  # remove menÃ§Ãµes
    texto = re.sub(r"#\w+", "", texto)  # remove hashtags
    texto = re.sub(r"[^\w\s]", "", texto)  # remove pontuaÃ§Ã£o
    return texto.strip()

# Aplicar limpeza e mostrar resultados
tweets_limpos = [limpar_texto(tweet["text"]) for tweet in tweets["data"]]

for i, tweet in enumerate(tweets_limpos[:5]):
    print(f"{i+1}: {tweet}")


1: jorge jesus exflamengo contratado na seleÃ§Ã£o brasileira tem resposta de neymar
2: ei  com base nos seus posts vocÃª parece se alinhar a uma figura conservadora possivelmente jair bolsonaro sua crÃ­tica a lula e interaÃ§Ã£o com joice hasselmann apoiadora de bolsonaro sugerem uma tendÃªncia Ã  direita apesar do foco em esportes seus comentÃ¡rios
3: olÃ¡ matheus pelos seus posts vocÃª parece com uma figura polÃ­tica ligada Ã  tecnologia e esportes como luiz philippe de orleans e braganÃ§a seu foco em tech ex huawei vs iphone e futebol alÃ©m de interaÃ§Ãµes com perfis de direita sugere uma inclinaÃ§Ã£o conservadora mas
4: ei  sem acesso total aos seus tuÃ­tes Ã© difÃ­cil cravar mas pelo seu portuguÃªs e possÃ­veis laÃ§os com esportes talvez futebol 7 vocÃª pode lembrar uma figura pÃºblica brasileira como neymar pelo estilo ativo nas redes ou tite pela vibe estratÃ©gica
5: rt  papo de alto nÃ­vel no 4d esportes dessa segundafeira rafael sobis e mauri dorneles receberam o volante fernan

## 3. AnÃ¡lise de frequÃªncia de palavras

ApÃ³s a limpeza, juntei todos os tweets em um Ãºnico texto e fiz a contagem das palavras mais frequentes, ignorando palavras muito curtas (menos de 4 letras).

Essa etapa mostra quais termos sÃ£o mais usados nos tweets sobre o tema escolhido.


In [3]:
from collections import Counter

# Juntar todos os tweets limpos em um sÃ³ texto
texto_unico = " ".join(tweets_limpos)
palavras = texto_unico.split()

# Contar as palavras mais comuns (ignorando palavras pequenas)
contagem = Counter([p for p in palavras if len(p) > 3])
mais_comuns = contagem.most_common(10)

print("Palavras mais comuns:")
for palavra, freq in mais_comuns:
    print(f"{palavra}: {freq}")


Palavras mais comuns:
vocÃª: 41
esportes: 34
seus: 24
como: 20
posts: 15
mais: 15
futebol: 14
parece: 11
muito: 11
quer: 9


In [4]:
!pip install -q nltk

import nltk
nltk.download('vader_lexicon')
from nltk.sentiment.vader import SentimentIntensityAnalyzer



[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip
[nltk_data] Downloading package vader_lexicon to
[nltk_data]     C:\Users\Acer\AppData\Roaming\nltk_data...


## 4. AnÃ¡lise de Sentimentos

Utilizei a biblioteca VADER (`nltk.sentiment.vader`) para aplicar uma anÃ¡lise de sentimentos bÃ¡sica nos tweets. Embora o VADER seja mais preciso para textos em inglÃªs, ele pode oferecer uma noÃ§Ã£o geral sobre o tom dos tweets mesmo em portuguÃªs.

Cada tweet foi classificado como:

- **Positivo**
- **Negativo**
- **Neutro**

No final, foi feito um resumo quantitativo dos sentimentos encontrados.


In [6]:
# Inicializa o analisador
analisador = SentimentIntensityAnalyzer()

# FunÃ§Ã£o pra classificar o sentimento
def classificar_sentimento(texto):
    pontuacoes = analisador.polarity_scores(texto)
    if pontuacoes["compound"] >= 0.05:
        return "Positivo"
    elif pontuacoes["compound"] <= -0.05:
        return "Negativo"
    else:
        return "Neutro"

# Aplica em cada tweet
resultados = [(tweet, classificar_sentimento(tweet)) for tweet in tweets_limpos]

# Mostra os primeiros resultados
for i, (tweet, sentimento) in enumerate(resultados[:10]):
    print(f"{i+1}: ({sentimento}) {tweet}")


1: (Neutro) jorge jesus exflamengo contratado na seleÃ§Ã£o brasileira tem resposta de neymar
2: (Neutro) ei  com base nos seus posts vocÃª parece se alinhar a uma figura conservadora possivelmente jair bolsonaro sua crÃ­tica a lula e interaÃ§Ã£o com joice hasselmann apoiadora de bolsonaro sugerem uma tendÃªncia Ã  direita apesar do foco em esportes seus comentÃ¡rios
3: (Neutro) olÃ¡ matheus pelos seus posts vocÃª parece com uma figura polÃ­tica ligada Ã  tecnologia e esportes como luiz philippe de orleans e braganÃ§a seu foco em tech ex huawei vs iphone e futebol alÃ©m de interaÃ§Ãµes com perfis de direita sugere uma inclinaÃ§Ã£o conservadora mas
4: (Neutro) ei  sem acesso total aos seus tuÃ­tes Ã© difÃ­cil cravar mas pelo seu portuguÃªs e possÃ­veis laÃ§os com esportes talvez futebol 7 vocÃª pode lembrar uma figura pÃºblica brasileira como neymar pelo estilo ativo nas redes ou tite pela vibe estratÃ©gica
5: (Negativo) rt  papo de alto nÃ­vel no 4d esportes dessa segundafeira rafael so

In [7]:
from collections import Counter

sentimentos = [s for _, s in resultados]
contagem_sentimentos = Counter(sentimentos)

print("\nResumo de sentimentos:")
for tipo, qtd in contagem_sentimentos.items():
    print(f"{tipo}: {qtd}")



Resumo de sentimentos:
Neutro: 37
Negativo: 5
Positivo: 8


## 5. ConclusÃ£o

A atividade permitiu entender como textos curtos e informais como tweets podem ser analisados para revelar padrÃµes e sentimentos.

No tema **esporte**, os tweets apresentaram uma maioria de sentimentos neutros, mas tambÃ©m foram identificados tons positivos e negativos.
