# Sript para recuperar os últimos 800 tweets, não importando de qual perfil, que contenham a palavra ou expressão-chave definida

## Configuração do notebook

In [1]:
# Conexão do Colab ao Google Drive (arquivos)

from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
# Instalação da bibliteca python que consome a API do Twitter

!pip install tweepy==4.5.0

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting tweepy==4.5.0
  Downloading tweepy-4.5.0-py2.py3-none-any.whl (66 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m66.0/66.0 kB[0m [31m3.0 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: tweepy
  Attempting uninstall: tweepy
    Found existing installation: tweepy 4.13.0
    Uninstalling tweepy-4.13.0:
      Successfully uninstalled tweepy-4.13.0
Successfully installed tweepy-4.5.0


In [3]:
# Importação das bibliotecas python necessárias

import tweepy # Biblioteca de chamada à API
import pandas as pd # Biblioteca para manipulação/estruturação dos dados

## Autenticação na API

In [4]:
# Autenticação
"""
O token é obtido por meio de app criado no portal de desenvolvedores
 da rede social: https://developer.twitter.com/en
"""
bearer_token = # "<INSERT>"

# Variável de chamada à API
client = tweepy.Client(bearer_token=bearer_token)

## Requisição e manipulação dos resultados (dados)

In [5]:
# Criação de listas vazias para armazenar os dados resultante da requisição
id = []
data = []
texto = []
retweets = []
respostas = []
likes = []
mentions = []

# Variável para guardar a palavra ou termo-chave de interesse, usada na requisição
# Apresenta parâmetros opcionais (exclui retweets)
query = "lysoform -is:retweet"

# Chamada à API com loop e paginação de resultados para extração da quantidade máxima de tweets permitida pelo endpoint (limit)
for tweet in tweepy.Paginator(client.search_recent_tweets, query=query,
                            tweet_fields=["id","text","created_at","public_metrics"],max_results=100).flatten(limit=800):

  # Inserção dos resultados nas listas
  id.append(tweet['id'])
  data.append(tweet['created_at'])
  texto.append(tweet['text'])
  retweets.append(tweet['public_metrics']['retweet_count'])
  respostas.append(tweet['public_metrics']['reply_count'])
  likes.append(tweet['public_metrics']['like_count'])
  mentions.append(tweet['public_metrics']['quote_count'])

  # Criação de dicionário para armazenar as listas
  df = {'tweet id':id, 'data':data, 'texto':texto, 'likes':likes, 'retweets':retweets, 'respostas':respostas, 'menções':mentions}

# Transformação do dicionário (python) em dataframe (pandas)
dados_tweets = pd.DataFrame(df)

In [6]:
dados_tweets

Unnamed: 0,tweet id,data,texto,likes,retweets,respostas,menções
0,1646261589635366913,2023-04-12 21:18:43+00:00,@tanqueapedales El vendedor de lysoform al día...,0,0,0,0
1,1646243830583250944,2023-04-12 20:08:09+00:00,✨ AMAZON: PROMOÇÃO | CUPOM | DESCONTO ✨\n\n💖 O...,0,0,0,0
2,1646226466873520130,2023-04-12 18:59:09+00:00,@monni_tuiteira Eu vejo ela tomar banho todo d...,0,0,0,0
3,1646220425297264643,2023-04-12 18:35:09+00:00,@doncomedia Desinfectante bucal dijo el manant...,0,0,0,0
4,1646197047316430869,2023-04-12 17:02:15+00:00,@Dantinhas Haja Lysoform pra tirar a nhaca,0,0,0,0
...,...,...,...,...,...,...,...
67,1644045421155610626,2023-04-06 18:32:27+00:00,Me compre un desodorante rexona al asar y resu...,1,0,0,0
68,1643977751286927368,2023-04-06 14:03:34+00:00,@Lorrayn40084667 @kellyybarreto @Dantinhas Car...,0,0,0,0
69,1643822196299649027,2023-04-06 03:45:26+00:00,me enojé tanto por las mocas rompe bolas q no ...,0,0,0,0
70,1643790261963685888,2023-04-06 01:38:33+00:00,Tô aqui lembrando de quando eu liguei no SAC d...,0,0,1,0


In [7]:
# Salvando dataframe como arquivo csv no Drive

dados_tweets.to_csv(r'/content/drive/MyDrive/SCRIPTS/tt_kargs.csv')