# Scrapping Twitter API Menggunakan Tweepy

## Daftar Developer Twitter
Pendaftaran Developer Twitter ini bertujuan untuk mendapatkan Bearer Token yang nantinya akan digunakan pada library Tweepy untuk mengambil data dari Twitter API

[![IMAGE_ALT](https://img.youtube.com/vi/E_h1HNjsd-U/0.jpg)](https://www.youtube.com/watch?v=E_h1HNjsd-U)

## Instalasi library Tweepy
Gunakan perintah berikut pada terminal untuk menginstall library tweepy
```
pip install tweepy
```

In [1]:
import tweepy
import pandas as pd

In [2]:
BEARER_TOKEN = "AAAAAAAAAAAAAAAAAAAAAEkYWAEAAAAAiCZ95QEqxNKuluivi0dNKwu%2BUIA%3DpXPhzD5xrJFlCx6roDUnzjJ6jtuh8wr2AyPhfZls4g4Yo4kH8y"
client = tweepy.Client(bearer_token=BEARER_TOKEN)

In [3]:
tweets = client.search_recent_tweets(
  query="sepatu", # Required
  max_results = 10, # Optional, default 10
  tweet_fields = ["created_at", "text"], # Optional
  user_fields = ["name", "username", "description"], # Optional
  expansions='author_id' # Optional
)

### Penjelasan
```query``` digunakan untuk menentukan keyword tweet yang akan dicari\
Selengkapnya: https://developer.twitter.com/en/docs/twitter-api/tweets/search/integrate/build-a-query

```max_results``` untuk menentukan jumlah maksimal tweet yang akan dicari, minimal 10 sampai 100

```tweet_fileds``` digunakan untuk menentukan atribut mana saja yang akan didapatkan\
atribut yang tersedia: ```attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, public_metrics, organic_metrics, promoted_metrics, possibly_sensitive, referenced_tweets, reply_settings, source, text, withheld```

```user_fields``` digunakan untuk menentukan atribut informasi user mana saja yang akan didapatkan\
atribut yang tersedia: ```created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified, withheld```

```expansions``` digunakan untuk mengambil data tambahan\
atribut yang tersedia: ```attachments.poll_ids, attachments.media_keys, author_id, entities.mentions.username, geo.place_id, in_reply_to_user_id, referenced_tweets.id, referenced_tweets.id.author_id```

Selengkapnya dapat dilihat pada tautan berikut:
https://developer.twitter.com/en/docs/twitter-api/tweets/search/api-reference/get-tweets-search-recent

Jika proses scrapping sudah selesai, Tweepy menghasilkan beberapa data seperti berikut:

In [4]:
# tweets data yang berisi atribut yang telah ditentukan pada tweet_fields
tweets.data

[<Tweet id=1557272025135460353 text='@solinepmenfess Banyak jalan, kalau sepatu kekecilan jadi kurang nyaman.'>,
 <Tweet id=1557271929157201920 text='RT @HafidzAlattas: Rehat sejenak untuk makan siang, seorang ayah menyuapi anaknya.\n\nIbu melahirkanmu tapi ayah yg rela menjadi penjamin hid…'>,
 <Tweet id=1557271871938494464 text='RT @joshuafuture_: SEPATU CONVERSE\n⭐ 4.9\n💵 175k\n🖇️ https://t.co/nVlwuwP0V4\n\n#Shopee88 #zonauang #ShopeeBagiHuaweiMatePad #ShopeePayTHR #Sho…'>,
 <Tweet id=1557271865537622016 text='Buat kalian ni yang mau cuci sepatu di area surabaya!\nCek ig ini\nhttps://t.co/X5rh8fyqJ7\n\nFREE PICK UP AND DELIVERY! \nRamaikan slurd😚 https://t.co/9QRhzc86hb'>,
 <Tweet id=1557271812299313153 text='RT @tvOneNews: Polisi Turut Geledah Rumah Mertua Ferdy Sambo di Kemang, Penyidik Sita Sepatu hingga Baju https://t.co/VG0m8VknNF'>,
 <Tweet id=1557271808357048320 text='🎨Sandal Sepatu/Sandal Tali Wanita 🎨\n\n1. 🖇️: https://t.co/nVjDZ4Iusg\n💰:87.500 - ⭐:4.7\n2. 🖇️: https://t.co/

In [5]:
# Berisi tentang data tambahan yang telah ditentukan pada user_fields dan expansions
tweets.includes

{'users': [<User id=1412174798 name=MORNINGSTAR username=darkcov3r>,
  <User id=4749592932 name=rachman gojali username=gojali_rachman>,
  <User id=1548452927701864451 name=fb, help rt & like username=hidubahagia>,
  <User id=1107113770805936134 name=kukuh buka cucian sepatu !!!! sibuk rame bgt1! username=pakuaji24>,
  <User id=1477284857168289797 name=Apo Subhan username=apo_subhan>,
  <User id=1255634035453263873 name=zaza • freetag username=hzayass>,
  <User id=416066763 name=🤡Zee🎪 username=ZEEDROID7>,
  <User id=1018730819735580672 name=BEAUTY MENFESS username=beauthingy>,
  <User id=1386350562665320452 name=Portgas D. K͟a͟i͟♡.ೃ࿐ || Read pinned pls. username=unattr4ctive>,
  <User id=2339760644 name=Online Shop Makassar username=TerkiniGaul>]}

In [6]:
# Berisi tentang informasi tambahan
tweets.meta

{'newest_id': '1557272025135460353',
 'oldest_id': '1557271616287305728',
 'result_count': 10,
 'next_token': 'b26v89c19zqg8o3fpz5n29zpokuc62md9o1oaikolnq0t'}

## Mapping Tweets Response ke DataFrame

In [7]:
tweet_response_list = []

for tweet, user in zip(tweets.data, tweets.includes["users"]):
  tweet_response = {
    'id': tweet.id,
    'created_at': tweet.created_at,
    'text': tweet.text,
    'name': user.name,
    'username': user.username,
    'description': user.description
  }
  tweet_response_list.append(tweet_response)


tweets_df = pd.DataFrame(tweet_response_list)

tweets_df.head()

Unnamed: 0,id,created_at,text,name,username,description
0,1557272025135460353,2022-08-10 07:45:58+00:00,"@solinepmenfess Banyak jalan, kalau sepatu kek...",MORNINGSTAR,darkcov3r,MAY WE ALL DIE TWICE.
1,1557271929157201920,2022-08-10 07:45:35+00:00,RT @HafidzAlattas: Rehat sejenak untuk makan s...,rachman gojali,gojali_rachman,
2,1557271871938494464,2022-08-10 07:45:21+00:00,RT @joshuafuture_: SEPATU CONVERSE\n⭐ 4.9\n💵 1...,"fb, help rt & like",hidubahagia,rekomendasi shopee
3,1557271865537622016,2022-08-10 07:45:20+00:00,Buat kalian ni yang mau cuci sepatu di area su...,kukuh buka cucian sepatu !!!! sibuk rame bgt1!,pakuaji24,Pengamat kaum muda sosialita terutama mahasisw...
4,1557271812299313153,2022-08-10 07:45:07+00:00,RT @tvOneNews: Polisi Turut Geledah Rumah Mert...,Apo Subhan,apo_subhan,Topi
