# API 資料串接 - 以 Dcard API 實作範例

* 利用 urllib 套件的 urlretrieve 方法下載檔案
* 了解 Python File I/O 讀檔、寫檔的用法
* 能用運用資源管理器 With Statement 優化寫法

## 作業目標

* 請利用 API: https://www.dcard.tw/_api/forums/pet/posts?popular=true 回答下列問題：

1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？
2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」

In [19]:
# 1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？

import requests
r = requests.get('https://www.dcard.tw/_api/forums/pet/posts?popular=true')
response = json.loads(r.text)


print("一次會回傳",len(response),"筆資料")

print("每一筆資料包含欄位：",response[0].keys())


一次會回傳 30 筆資料
每一筆資料包含欄位： dict_keys(['id', 'title', 'excerpt', 'anonymousSchool', 'anonymousDepartment', 'pinned', 'forumId', 'replyId', 'createdAt', 'updatedAt', 'commentCount', 'likeCount', 'withNickname', 'tags', 'topics', 'meta', 'forumName', 'forumAlias', 'gender', 'school', 'department', 'replyTitle', 'mediaMeta', 'reactions', 'hidden', 'customStyle', 'isSuspiciousAccount', 'layout', 'withImages', 'withVideos', 'media', 'reportReasonText', 'postAvatar'])


In [32]:
# 2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
import pandas as pd
pop = []
for item in response:
    pop.append([item['title'],item['createdAt'],item['commentCount'],item['likeCount']])
pop_df=pd.DataFrame(pop,columns=['標題','貼文時間','留言人數','按讚人數'])
pop_df



Unnamed: 0,標題,貼文時間,留言人數,按讚人數
0,找回失蹤狗狗😭 原來妳也在找我們,2019-11-29T22:33:34.440Z,129,6537
1,我家的貓每天睡覺前一定會做的事,2019-11-30T06:52:29.882Z,37,967
2,被擠床原來是一件幸福的事,2019-11-30T04:15:42.699Z,7,312
3,#哈士奇 滿一歲啦 文長 滿滿的二哈,2019-11-30T16:30:51.154Z,8,111
4,媽 晚餐好了沒,2019-11-30T10:42:58.582Z,2,108
5,有貓快拜！！,2019-11-30T03:07:22.599Z,3,95
6,有人要吸兔嗎？,2019-11-30T04:58:10.195Z,19,86
7,你到底是貓還是狗？,2019-11-30T14:32:06.500Z,1,28
8,白圍巾白手套橘貓❤️,2019-11-30T07:44:14.420Z,6,26
9,#柴 #影片 到底有多討厭洗澡,2019-11-30T03:24:55.897Z,1,23


In [53]:
# 3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」
    #以定義的方式來計算
def get_comment_and_count_avg(popular):
    r = requests.get('https://www.dcard.tw/_api/forums/pet/posts?popular='+popular) #popular=true是熱門 popular=false是非熱門
    
    response = r.text
    data = json.loads(response) #讀取檔案
    article= []
    for item in data:
        article.append([item['title'],item['createdAt'],item['commentCount'],item['likeCount']])
    df = pd.DataFrame(article,columns=['標題','貼文時間','留言人數','按讚人數']) #製成表格
    # print(df)
    if popular == 'true': #popular=true是熱門 popular=false是非熱門
        stype = '熱門'
    else:   #popular=false是非熱門
        stype = '非熱門'
    print(stype+'平均留言人數: '+str(round(df['留言人數'].mean(),1))) #取至小數點後一位, 並轉為str字串
    print(stype+'平均按讚人數: '+str(round(df['按讚人數'].mean(),1)))
    

In [55]:

get_comment_and_count_avg('true')

熱門平均留言人數: 9.0
熱門平均按讚人數: 316.9


In [56]:
get_comment_and_count_avg('false')

非熱門平均留言人數: 1.8
非熱門平均按讚人數: 10.0
