# Get data from Twitter using API

## Set library
Help document of tweepy in Japanese is [here](https://dividable.net/programming/python/python-twitter-api-get-followers-count).

In [30]:
import pandas as pd
import tweepy

## Set Twitter API

In [4]:
# set key and token
API_KEY = 
API_SECRET = 
ACCESS_TOKEN = 
ACCESS_TOKEN_SECRET = 

# authorize for tweepy
auth = tweepy.OAuthHandler(API_KEY, API_SECRET)
auth.set_access_token(ACCESS_TOKEN, ACCESS_TOKEN_SECRET)

## Test using tweepy

- Arguments of api.search() are documented [here](https://docs.tweepy.org/en/v3.5.0/api.html).
- Results of api.search() are documented [here](https://developer.twitter.com/en/docs/twitter-api/v1/data-dictionary/object-model/tweet)

In [13]:
# get a tweet included "Python"
api = tweepy.API(auth)
tweets = api.search(q=['Python'], count=5, tweet_mode='extended')

In [18]:
# tweets is array
print(len(tweets))

5


### user data

In [67]:
# id
print("id:")
print(tweets[0].user.id)
print("\n")

# followers
print("number of followers:")
print(tweets[0].user.followers_count)
print("\n")

# friends
print("number of friends:")
print(tweets[0].user.friends_count)
print("\n")

# description
print("account description:")
print(tweets[0].user.description)

id:
1331320133654962176


number of followers:
928


number of friends:
10


account description:
Built by @codepratik using Nodejs.
I retweet #javascript, #Nodejs & #100DaysofCode. Improving every day 🦾.


In [111]:
# id
print("text")
print(tweets[0].id)
print("\n")

# text
print("text")
print(tweets[0].full_text)
print("\n")

# date
print("date")
print(tweets[0].created_at)
print("\n")

# favrorites
print("favorites")
print(tweets[0].favorite_count)
print("\n")

# RT
print("RT")
print(tweets[0].retweet_count)

text
1376431283232862210


text
@yu_yu_yu_dm 残念ハズレ…💦

クラフトボスフルーツティーは
4月20日に新発売します！

クラフトボスTEAについて詳しくはこちら↓
https://t.co/BdaurLlpOs https://t.co/7Kl0stoSeg


date
2021-03-29 07:09:25


favorites
0


RT
0


## Get tweets included "クラフトボス"

In [153]:
# get tweets
tweets = api.search(q=["クラフトボス"], count=100, tweet_mode='extended')

In [155]:
tweet_list = []
for tweet in tweets:
    tweet_list.append([tweet.user.id, tweet.user.followers_count,
                      tweet.user.friends_count, tweet.user.description,
                      tweet.id, tweet.full_text, tweet.favorite_count, 
                      tweet.retweet_count])

In [156]:
df_tweet_list = pd.DataFrame(tweet_list)

In [157]:
tweet_list[50]

[817644193522647040,
 38,
 604,
 '',
 1376432228922576898,
 'RT @POINTJP_TSUTOMU: げつようびのプレゼント企画\n\nスタバドリンクチケット\n応募方法：フォロー＆RT\n締め切り：本日18時\n当選人数：1名様\n発送方法：DMでクーポン送信\n\nスタバドリンクチケットをプレゼント。スタバの新作をまだ飲まれてない方は是非ご参加下さ…',
 0,
 4392]

In [158]:
df_tweet_list = pd.DataFrame(tweet_list)
df_tweet_list.columns = ['user_id', 'followers', 'friends', 'account_description', 
                         'tweet_id', 'text', 'favorites_count', 'retweet_count']
df_tweet_list.head()

Unnamed: 0,user_id,followers,friends,account_description,tweet_id,text,favorites_count,retweet_count
0,762963046608187392,650,4995,食べるの大好きな20代大食い女子🌸 甘いものに目がない😍🍰🍧🍡🍮🍭🍩,1376436972986589189,RT @POINTJP_TSUTOMU: げつようびのプレゼント企画\n\nスタバドリンクチ...,0,4392
1,846955649053417473,107,4041,,1376436806565064705,RT @POINTJP_TSUTOMU: げつようびのプレゼント企画\n\nスタバドリンクチ...,0,4392
2,1351385213713088512,25,848,当たりますように！,1376436648615927808,RT @POINTJP_TSUTOMU: げつようびのプレゼント企画\n\nスタバドリンクチ...,0,4392
3,1082276274985349126,37,1759,当てたい！,1376436648410370049,RT @POINTJP_TSUTOMU: げつようびのプレゼント企画\n\nスタバドリンクチ...,0,4392
4,1105657394770538496,224,3221,好きなもの→NBA.バスケ観賞好き　詳しくはないが映画好き　食べるの大好き　たまに雰囲気飲み...,1376436638801305600,RT @POINTJP_TSUTOMU: げつようびのプレゼント企画\n\nスタバドリンクチ...,0,4392


## Define function

In [162]:
def get_tweet_data(key_words):
    tweets = api.search(q=[key_words], count=100, tweet_mode='extended', lang = 'ja')
    
    tweet_list = []
    for tweet in tweets:
        tweet_list.append([tweet.id, tweet.full_text, tweet.favorite_count, 
                      tweet.retweet_count,tweet.user.id, tweet.user.followers_count,
                      tweet.user.friends_count, tweet.user.description])
    
    if len(tweet_list) == 0:
        return("Error: No Data")
    
    else:
        df_tweet_list = pd.DataFrame(tweet_list)
        df_tweet_list.columns = ['tweet_id', 'text', 'favorites_count', 'retweet_count',
                            'user_id', 'followers', 'friends', 'account_description']
        return(df_tweet_list)

In [165]:
get_tweet_data("ポッキー")

Unnamed: 0,tweet_id,text,favorites_count,retweet_count,user_id,followers,friends,account_description
0,1376438562011238400,小腹すいてきた。ポッキー食べたい。ないけど,0,0,1368457460843868160,7,13,主にapex。初心者。 ブロンズ 。 オクタン、ブラハ練習中 。たまにスプラ2。
1,1376438558429339649,RT @Okay_amazon: 第207弹🌸\n／\n週末💪新生活応援\n #キャンペーン...,0,393,1328599324138360833,2961,4747,👑3人の母ちゃん❤️孫3人♡❤️9人の大家族❤️食べる事←大食いです🍴ネイル💅コスメ💄釣り🎣...
2,1376438448131764226,RT @Okay_amazon: 第207弹🌸\n／\n週末💪新生活応援\n #キャンペーン...,0,392,1105657394770538496,224,3221,好きなもの→NBA.バスケ観賞好き　詳しくはないが映画好き　食べるの大好き　たまに雰囲気飲み...
3,1376438203473797126,ポッキーを半分にするにはどうするのか教えて？\n↓\n━一\n↓\nふざけないで！\n↓\n...,0,0,1725633962,17,0,田中の髪は短い坊主♪
4,1376438110737682433,9.ぜのぷろ\n はじめしゃちょー\n ポッキー\nその他約90組,0,0,1252687607546302464,128,459,のんびり生きてます。 人類全員に人見知り /#ぜのぷろ 最高♨️ /アニメ好き ラブライブ！...
...,...,...,...,...,...,...,...,...
95,1376429209497653251,〆切昨日までのところもたくさんフォロー外れてて、イラっとしてポッキー一気食いしちゃった,0,0,1345299785171963904,2151,2944,11ヶ月男児かなたん👶を育てるアラサー主婦/育休中/無言フォロー大歓迎✨/教育関係のお仕事/...
96,1376429170822017030,RT @smallp331: アイマス史上初(？)の海外商品とのコラボキャンペーン？台湾の城...,0,105,3152390852,347,317,社畜なニコ生主です！おもにバイク、仮面ライダー、FPSやPCゲーム、シャニマス、デレマス、ミ...
97,1376428995684691970,ポッキーの音鳴らせません（笑）,0,0,1282993303,9,1,ニンジン嫌いなかばさん。ちっちゃいかばさん。ちなみに猿と同じ身長 トーク ほとんどbotに頼る
98,1376428933445419012,↓ポッキーサイズ,0,0,1394254448,62,13,


## Get data for analysis

In [175]:
df_pocky = get_tweet_data("ポッキー")
df_toppo = get_tweet_data("トッポ")

In [177]:
# output as csv file
df_pocky.to_csv('pocky_tweets.csv', index = False)
df_toppo.to_csv('toppo_tweets.csv', index = False)