# API 資料串接 - 以 Dcard API 實作範例

* 利用 urllib 套件的 urlretrieve 方法下載檔案
* 了解 Python File I/O 讀檔、寫檔的用法
* 能用運用資源管理器 With Statement 優化寫法

## 作業目標

* 請利用 API: https://www.dcard.tw/_api/forums/pet/posts?popular=true 回答下列問題：

1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？
2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」

In [1]:
# 1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？
import requests
import json

r = requests.get('https://www.dcard.tw/_api/forums/pet/posts?popular=true')
content = json.loads(r.text)
print('一次回傳 {} 筆資料'.format(len(content)))
print('資料欄位包含: \n{}'.format(', '.join(content[0].keys())))

一次回傳 30 筆資料
資料欄位包含: 
id, title, excerpt, anonymousSchool, anonymousDepartment, pinned, forumId, replyId, createdAt, updatedAt, commentCount, likeCount, withNickname, tags, topics, meta, forumName, forumAlias, gender, school, replyTitle, mediaMeta, reactions, hidden, customStyle, isSuspiciousAccount, layout, withImages, withVideos, media, reportReasonText, postAvatar


In [27]:
# 2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
import pandas as pd

col = ['title', 'createdAt', 'commentCount', 'likeCount']
df = pd.DataFrame(columns=col)

for article in content:
    df = df.append(
        pd.DataFrame([[article[i] for i in col]],
        columns = col)
    )
df

Unnamed: 0,title,createdAt,commentCount,likeCount
0,把鼠鼠交出來！,2019-12-10T07:09:01.647Z,139,3486
0,不是貓的貓,2019-12-10T02:41:33.923Z,80,2506
0,這是我寶貝不准搶喔,2019-12-10T03:02:15.704Z,13,1320
0,#心情 第一次感受到養寵物的重量可以有多沈重,2019-12-10T05:29:22.850Z,10,824
0,寵物展之自己的飼料自己賺🐰,2019-12-10T12:03:52.215Z,8,284
0,#貓 #圖 先森你的頭忘在外面了喔,2019-12-10T14:48:09.589Z,2,211
0,92歲 vs 3歲,2019-12-10T04:05:49.110Z,9,209
0,蛋蛋脫皮脫到一半大便了,2019-12-10T12:23:07.331Z,15,117
0,每次都懷疑貓咪的身體裡面裝人的靈魂⋯,2019-12-10T06:22:49.320Z,4,94
0,吃可愛長大的法鬥,2019-12-11T02:48:48.276Z,9,69


In [37]:
# 3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」
import numpy as np

popular_article = requests.get('https://www.dcard.tw/_api/forums/pet/posts?popular=true')
nonpopular_article = requests.get('https://www.dcard.tw/_api/forums/pet/posts?popular=false')

popular_json = json.loads(popular_article.text)
nonpopular_json = json.loads(nonpopular_article.text)

print('熱門文章的平均留言人數： {}'.format(np.mean([art['commentCount'] for art in popular_json])))
print('熱門文章的平均按讚人數： {}'.format(np.mean([art['likeCount'] for art in popular_json])))
print('非熱門文章的平均留言人數： {}'.format(np.mean([art['commentCount'] for art in nonpopular_json])))
print('非熱門文章的平均按讚人數： {}'.format(np.mean([art['likeCount'] for art in nonpopular_json])))

熱門文章的平均留言人數： 13.1
熱門文章的平均按讚人數： 332.73333333333335
非熱門文章的平均留言人數： 2.466666666666667
非熱門文章的平均按讚人數： 7.3
