# Example Usage

We intends to fetch *all* tweets from BTS SkyTrain's account (`@BTS_SkyTrain`) to train and label the model

In [1]:
import tweepy
import credentials
import bts_classifier
import pandas

For the sake of simplicity, the API/Token key/secret is defined in `credentials.py`. You can grab these values from Twitter developers.

In [2]:
auth = tweepy.OAuthHandler(credentials.api_key, credentials.api_secret)
auth.set_access_token(credentials.token_key, credentials.token_secret)
api = tweepy.API(auth)

Twitter's limitation is that ones can query a maximum of 200 user tweets per query. However, we can define `max_id` so that older tweets will be fetched. Repeat this process untill desire.

In [3]:
tweets = api.user_timeline('BTS_SkyTrain', count=200)
for i in range(15):
    tweets += api.user_timeline('BTS_SkyTrain', count=200, max_id=tweets[-1].id)

Obtain the dataframe...

In [4]:
df = pandas.DataFrame(
    {"tweet_text": [t.text for t in tweets],
     "date": [t.created_at for t in tweets],
     "status": [bts_classifier.classify(t.text) for t in tweets] # Here's where the magic goes
    })
df

Unnamed: 0,tweet_text,date,status
0,07.18 น. ระบบอาณัติสัญญาณขัดข้องในสายสีลม ส่งผ...,2018-06-26 00:23:30,delay
1,06.52 น. ระบบอาณัติสัญญาณในสายสีลมและสายสุขุมว...,2018-06-25 23:56:26,normal
2,06.26 น. เนื่องจากระบบอาณัติสัญญาณขัดข้อง ในสา...,2018-06-25 23:27:43,delay
3,06.20 น. รถไฟฟ้าที่ขัดข้องได้รับการแก้ไขและนำอ...,2018-06-25 23:22:45,delay
4,06.15 น. รถไฟฟ้าขัดข้องระหว่างสถานีช่องนนทรีแล...,2018-06-25 23:16:55,disrupted
5,21.37 ระบบอาณัติสัญญาณในสายสีลมและสายสุขุมวิทไ...,2018-06-25 14:39:11,normal
6,20.52 รถไฟฟ้าที่ขัดข้องได้รับการแก้ไขและนำออกจ...,2018-06-25 13:53:04,delay
7,20.40 ขบวนรถไฟฟ้าขัดข้องที่สถานีบางหว้า ขบวนรถ...,2018-06-25 13:46:39,disrupted
8,19.00 เนื่องจากระบบอาณัติสัญญาณขัดข้องในสายสุข...,2018-06-25 12:02:44,delay
9,15.40 เนื่องจากระบบอาณัติสัญญาณขัดข้อง ในสายสุ...,2018-06-25 08:41:20,delay
