# API 資料串接 - 以 Dcard API 實作範例

* 利用 urllib 套件的 urlretrieve 方法下載檔案
* 了解 Python File I/O 讀檔、寫檔的用法
* 能用運用資源管理器 With Statement 優化寫法

## 作業目標

* 請利用 API: https://www.dcard.tw/_api/forums/pet/posts?popular=true 回答下列問題：

1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？
2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」

In [1]:
# 1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？

'''
Your Code
'''

import requests
import json

url = 'https://www.dcard.tw/_api/forums/pet/posts?popular=true'

htmlfile = requests.get(url)

response = htmlfile.text
data = json.loads(response)


In [2]:
print('retrurn {} 筆資料'.format(len(data)))
print('每一筆包含以下欄位：{}'.format([i for i in data[0]]))

retrurn 30 筆資料
每一筆包含以下欄位：['id', 'title', 'excerpt', 'anonymousSchool', 'anonymousDepartment', 'pinned', 'forumId', 'replyId', 'createdAt', 'updatedAt', 'commentCount', 'likeCount', 'withNickname', 'tags', 'topics', 'meta', 'forumName', 'forumAlias', 'gender', 'school', 'department', 'replyTitle', 'mediaMeta', 'reactions', 'hidden', 'customStyle', 'isSuspiciousAccount', 'layout', 'withImages', 'withVideos', 'media', 'reportReasonText', 'postAvatar']


In [3]:
# 2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」

'''
Your Code
'''
for item in data:
    print('標題:{}\t 貼文時間:{}\t 留言人數:{}\t 按讚人數:{}'.format(item['id'], item['createdAt'], item['commentCount'], item['likeCount']))

標題:232612477	 貼文時間:2019-12-02T12:11:28.555Z	 留言人數:52	 按讚人數:2491
標題:232612340	 貼文時間:2019-12-02T11:45:50.709Z	 留言人數:34	 按讚人數:960
標題:232611252	 貼文時間:2019-12-02T08:31:17.626Z	 留言人數:18	 按讚人數:397
標題:232610358	 貼文時間:2019-12-02T05:29:49.540Z	 留言人數:16	 按讚人數:392
標題:232609600	 貼文時間:2019-12-02T02:51:47.393Z	 留言人數:0	 按讚人數:306
標題:232610616	 貼文時間:2019-12-02T06:22:36.958Z	 留言人數:12	 按讚人數:263
標題:232613910	 貼文時間:2019-12-02T15:47:50.672Z	 留言人數:5	 按讚人數:176
標題:232617090	 貼文時間:2019-12-03T07:01:36.591Z	 留言人數:3	 按讚人數:163
標題:232614155	 貼文時間:2019-12-02T16:16:39.331Z	 留言人數:10	 按讚人數:152
標題:232609530	 貼文時間:2019-12-02T02:38:35.799Z	 留言人數:5	 按讚人數:117
標題:232613404	 貼文時間:2019-12-02T14:42:42.738Z	 留言人數:6	 按讚人數:60
標題:232610239	 貼文時間:2019-12-02T05:06:34.886Z	 留言人數:11	 按讚人數:58
標題:232609524	 貼文時間:2019-12-02T02:36:37.309Z	 留言人數:5	 按讚人數:56
標題:232611487	 貼文時間:2019-12-02T09:16:23.658Z	 留言人數:3	 按讚人數:49
標題:232613410	 貼文時間:2019-12-02T14:43:24.475Z	 留言人數:1	 按讚人數:40
標題:232615789	 貼文時間:2019-12-03T03:00:15.230Z	 留言人數:17	 按讚人數:39
標題:23

In [4]:
# 3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」

url_pop = 'https://www.dcard.tw/_api/forums/pet/posts?popular=true'
url_nopop = 'https://www.dcard.tw/_api/forums/pet/posts?popular=false'

pop_htmlfile = requests.get(url_pop)
nopop_htmlfile = requests.get(url_nopop)

pop_response = pop_htmlfile.text
nopop_response = nopop_htmlfile.text

pop_data = json.loads(pop_response)
nopop_data = json.loads(nopop_response)

In [5]:
print('熱門文章共 {} 筆'.format(len(pop_data)))
print('總留言人數： {} 筆'.format(sum([int(item['commentCount']) for item in pop_data ])))
print('平均留言人數： {} 筆'.format(round(sum([int(item['commentCount']) for item in pop_data ]) / len(pop_data), 2)))
print('總按讚人數： {} 筆'.format(sum([int(item['likeCount']) for item in pop_data ])))
print('平均按讚人數： {} 筆'.format(round(sum([int(item['likeCount']) for item in pop_data ]) / len(pop_data), 2)))
print("-" * 30)
print('非熱門文章共 {} 筆'.format(len(nopop_data)))
print('總留言人數： {} 筆'.format(sum([int(item['commentCount']) for item in nopop_data ])))
print('平均留言人數： {} 筆'.format(round(sum([int(item['commentCount']) for item in nopop_data ]) / len(nopop_data),2)))
print('總按讚人數： {} 筆'.format(sum([int(item['likeCount']) for item in nopop_data ])))
print('平均按讚人數： {} 筆'.format(round(sum([int(item['likeCount']) for item in nopop_data ]) / len(nopop_data),2)))

熱門文章共 30 筆
總留言人數： 240 筆
平均留言人數： 8.0 筆
總按讚人數： 5985 筆
平均按讚人數： 199.5 筆
------------------------------
非熱門文章共 30 筆
總留言人數： 76 筆
平均留言人數： 2.53 筆
總按讚人數： 305 筆
平均按讚人數： 10.17 筆


In [7]:
import pandas as pd

df = pd.DataFrame(data)
df[['title', 'createdAt', 'commentCount', 'likeCount']]

Unnamed: 0,title,createdAt,commentCount,likeCount
0,同學你的貓貓,2019-12-02T12:11:28.555Z,52,2491
1,我到底養了什麼貓....（...微西斯）,2019-12-02T11:45:50.709Z,34,960
2,有這麼不爽嗎(･ัω･ั),2019-12-02T08:31:17.626Z,18,397
3,餵養的浪貓得了乳腺瘤,2019-12-02T05:29:49.540Z,16,392
4,散步好夥伴🐶漆黑寒冷的夜晚也找得到便便💩,2019-12-02T02:51:47.393Z,0,306
5,我家的老阿公,2019-12-02T06:22:36.958Z,12,263
6,我發誓牠們的食物是一樣的……,2019-12-02T15:47:50.672Z,5,176
7,#CP值爆棚🔥包準可以安心侍奉主子們的安心居家清潔劑～隆重登場！,2019-12-03T07:01:36.591Z,3,163
8,覺得認同,2019-12-02T16:16:39.331Z,10,152
9,我在日本養了一隻貓(圖多,2019-12-02T02:38:35.799Z,5,117
