# API 資料串接 - 以 Dcard API 實作範例

* 利用 urllib 套件的 urlretrieve 方法下載檔案
* 了解 Python File I/O 讀檔、寫檔的用法
* 能用運用資源管理器 With Statement 優化寫法

## 作業目標

* 請利用 API: https://www.dcard.tw/_api/forums/pet/posts?popular=true 回答下列問題：

1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？
2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」

In [1]:
# 1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？

import requests
import json

url = 'https://www.dcard.tw/_api/forums/pet/posts?popular=true'

htmlfile = requests.get(url)

response = htmlfile.text
data = json.loads(response)


In [2]:
print('retrurn {} 筆資料'.format(len(data)))
print('每一筆包含以下欄位：{}'.format([i for i in data[0]]))

retrurn 30 筆資料
每一筆包含以下欄位：['id', 'title', 'excerpt', 'anonymousSchool', 'anonymousDepartment', 'pinned', 'forumId', 'replyId', 'createdAt', 'updatedAt', 'commentCount', 'likeCount', 'withNickname', 'tags', 'topics', 'meta', 'forumName', 'forumAlias', 'nsfw', 'gender', 'school', 'replyTitle', 'mediaMeta', 'reactions', 'hidden', 'customStyle', 'isSuspiciousAccount', 'isModerator', 'layout', 'spoilerAlert', 'withImages', 'withVideos', 'media', 'reportReasonText', 'excerptComments', 'postAvatar', 'verifiedBadge']


In [3]:
# 2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」

for item in data:
    print('標題:{}\t 貼文時間:{}\t 留言人數:{}\t 按讚人數:{}'.format(item['id'], item['createdAt'], item['commentCount'], item['likeCount']))

標題:234906280	 貼文時間:2020-12-02T07:07:02.700Z	 留言人數:94	 按讚人數:4415
標題:234905607	 貼文時間:2020-12-02T05:02:47.100Z	 留言人數:47	 按讚人數:1310
標題:234906405	 貼文時間:2020-12-02T07:32:33.536Z	 留言人數:36	 按讚人數:727
標題:234907930	 貼文時間:2020-12-02T12:16:08.227Z	 留言人數:25	 按讚人數:414
標題:234906744	 貼文時間:2020-12-02T08:38:43.556Z	 留言人數:17	 按讚人數:301
標題:234905393	 貼文時間:2020-12-02T04:26:34.694Z	 留言人數:9	 按讚人數:231
標題:234904477	 貼文時間:2020-12-01T23:32:31.629Z	 留言人數:14	 按讚人數:207
標題:234906481	 貼文時間:2020-12-02T07:46:10.219Z	 留言人數:13	 按讚人數:153
標題:234905463	 貼文時間:2020-12-02T04:39:30.030Z	 留言人數:26	 按讚人數:149
標題:234906682	 貼文時間:2020-12-02T08:27:05.761Z	 留言人數:14	 按讚人數:73
標題:234908986	 貼文時間:2020-12-02T15:03:59.438Z	 留言人數:5	 按讚人數:54
標題:234907554	 貼文時間:2020-12-02T11:00:02.284Z	 留言人數:2	 按讚人數:43
標題:234904129	 貼文時間:2020-12-01T18:22:27.095Z	 留言人數:24	 按讚人數:33
標題:234911635	 貼文時間:2020-12-03T04:42:52.314Z	 留言人數:0	 按讚人數:32
標題:234910410	 貼文時間:2020-12-02T20:18:55.273Z	 留言人數:5	 按讚人數:30
標題:234909570	 貼文時間:2020-12-02T16:23:51.653Z	 留言人數:3	 按讚人數:30
標題:

In [4]:
# 3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」

url_pop = 'https://www.dcard.tw/_api/forums/pet/posts?popular=true'
url_nopop = 'https://www.dcard.tw/_api/forums/pet/posts?popular=false'

pop_htmlfile = requests.get(url_pop)
nopop_htmlfile = requests.get(url_nopop)

pop_response = pop_htmlfile.text
nopop_response = nopop_htmlfile.text

pop_data = json.loads(pop_response)
nopop_data = json.loads(nopop_response)

In [5]:
print('熱門文章共 {} 筆'.format(len(pop_data)))
print('總留言人數： {} 筆'.format(sum([int(item['commentCount']) for item in pop_data ])))
print('平均留言人數： {} 筆'.format(round(sum([int(item['commentCount']) for item in pop_data ]) / len(pop_data), 2)))
print('總按讚人數： {} 筆'.format(sum([int(item['likeCount']) for item in pop_data ])))
print('平均按讚人數： {} 筆'.format(round(sum([int(item['likeCount']) for item in pop_data ]) / len(pop_data), 2)))
print("-" * 30)
print('非熱門文章共 {} 筆'.format(len(nopop_data)))
print('總留言人數： {} 筆'.format(sum([int(item['commentCount']) for item in nopop_data ])))
print('平均留言人數： {} 筆'.format(round(sum([int(item['commentCount']) for item in nopop_data ]) / len(nopop_data),2)))
print('總按讚人數： {} 筆'.format(sum([int(item['likeCount']) for item in nopop_data ])))
print('平均按讚人數： {} 筆'.format(round(sum([int(item['likeCount']) for item in nopop_data ]) / len(nopop_data),2)))

熱門文章共 30 筆
總留言人數： 391 筆
平均留言人數： 13.03 筆
總按讚人數： 8409 筆
平均按讚人數： 280.3 筆
------------------------------
非熱門文章共 30 筆
總留言人數： 54 筆
平均留言人數： 1.8 筆
總按讚人數： 279 筆
平均按讚人數： 9.3 筆


In [6]:
import pandas as pd

df = pd.DataFrame(data)
df[['title', 'createdAt', 'commentCount', 'likeCount']]

Unnamed: 0,title,createdAt,commentCount,likeCount
0,書包偷塞了一隻喵喵😽帶去學校！,2020-12-02T07:07:02.700Z,94,4415
1,我有一隻光煞！,2020-12-02T05:02:47.100Z,47,1310
2,麒麟尾炸毛，好萌🤤,2020-12-02T07:32:33.536Z,36,727
3,真·女鵝🦢,2020-12-02T12:16:08.227Z,25,414
4,虎斑配橘貓😍,2020-12-02T08:38:43.556Z,17,301
5,狗狗當志工：在上班時間跟同事撒嬌！,2020-12-02T04:26:34.694Z,9,231
6,貓貓睡哪兒？,2020-12-01T23:32:31.629Z,14,207
7,貓大十八變 #被騙,2020-12-02T07:46:10.219Z,13,153
8,【寵物類】年度銷售強者集結💪 好物明星商品大選✨,2020-12-02T04:39:30.030Z,26,149
9,小狗遭巨蟒纏住，女主人勇猛上前「徒手抓起」狂甩,2020-12-02T08:27:05.761Z,14,73
