# API 資料串接 - 以 Dcard API 實作範例

* 了解 Dcard API 使用方式與回傳內容
* 撰寫程式存取 API 且解析 JSON 格式資料


## 作業目標

* 請利用 API: https://www.dcard.tw/_api/forums/pet/posts?popular=true 回答下列問題：

1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？
2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」

In [1]:
from selenium import webdriver
from selenium.webdriver.support.ui import Select
from bs4 import BeautifulSoup
import time
import json

In [2]:
# 1. 這個 API 一次會回傳幾筆資料？每一筆資料包含哪些欄位？
browser = webdriver.Chrome(executable_path='chromedriver')
browser.get("https://www.dcard.tw/_api/forums/pet/posts?popular=true")

time.sleep(7)

# 取得資料（等瀏覽器資料出現後才執行）
html_source = browser.page_source
html = BeautifulSoup(html_source, 'lxml')
data = json.loads(html.text)

In [3]:
print('一次傳：%s 筆' % len(data))
data[:3]

一次傳：30 筆


[{'id': 235356124,
  'title': '表情管理逐漸失控的貓',
  'excerpt': '一開始我覺得我家天使的表情總是這樣，或者是這樣的，反正就是美美的小公舉，最近發現不對欸事情好像不是這樣的，逐漸越來越多奇怪的照片出現在我的相簿裡，而且還越來越多，像是這樣，還有這樣，哇靠 這表情，只差',
  'anonymousSchool': False,
  'anonymousDepartment': False,
  'pinned': False,
  'forumId': '7ee21581-1307-4ba9-b9dc-82028bdcca49',
  'replyId': None,
  'createdAt': '2021-02-15T11:46:56.738Z',
  'updatedAt': '2021-02-15T11:47:39.270Z',
  'commentCount': 24,
  'likeCount': 825,
  'withNickname': True,
  'tags': [],
  'topics': ['貓'],
  'meta': {'layout': 'classic'},
  'forumName': '寵物',
  'forumAlias': 'pet',
  'nsfw': False,
  'gender': 'F',
  'school': '兩隻布偶的媽',
  'department': 'mia__0915',
  'replyTitle': None,
  'mediaMeta': [{'id': 'fb98fc81-832a-4c22-9afb-3570437edf25',
    'url': 'https://i.imgur.com/SN7lvDwl.jpg',
    'normalizedUrl': 'https://i.imgur.com/SN7lvDwl.jpg',
    'thumbnail': 'https://i.imgur.com/SN7lvDwl.jpg',
    'type': 'image/thumbnail',
    'tags': ['ANNOTATED'],
    'createdAt': '2021-02-15T11:46:56.738

In [4]:
# 2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
posts = dict()

for d in data:
    posts[d['id']]= [d['title']]+[d['createdAt']]+[str(d['commentCount'])]+[str(d['likeCount'])]
    print('id:', d['id'])
    print('Info:',posts[d['id']])
#print(posts.items())

id: 235356124
Info: ['表情管理逐漸失控的貓', '2021-02-15T11:46:56.738Z', '24', '825']
id: 235356123
Info: ['What’s in my 返鄉 bag｜貓咪篇🐱', '2021-02-15T11:46:42.070Z', '16', '173']
id: 235355860
Info: ['摸著摸著就翻臉', '2021-02-15T10:49:45.951Z', '12', '145']
id: 235355160
Info: ['（影片）貓咪睡死ㄌ🙀', '2021-02-15T08:04:03.788Z', '11', '116']
id: 235358273
Info: ['貓生初見狗的灰鵝', '2021-02-15T17:25:51.819Z', '5', '68']
id: 235354715
Info: ['貓大18變', '2021-02-15T06:20:31.044Z', '5', '58']
id: 235357058
Info: ['小貓🐱', '2021-02-15T14:37:47.233Z', '11', '44']
id: 235358201
Info: ['兔子眼睛長出一顆東西', '2021-02-15T17:14:58.726Z', '10', '34']
id: 235360823
Info: ['男生是不是都比較喜歡男生', '2021-02-16T07:43:48.370Z', '6', '29']
id: 235360697
Info: ['愛馬仕小拖鞋', '2021-02-16T07:17:16.030Z', '3', '22']
id: 235355437
Info: ['恭喜發財肉泥拿來', '2021-02-15T09:15:25.736Z', '3', '14']
id: 235354470
Info: ['問 寵物鼠飼料推薦', '2021-02-15T05:26:32.578Z', '7', '14']
id: 235358228
Info: ['流浪貓對鄰居造成困擾怎麼辦', '2021-02-15T17:18:41.146Z', '22', '13']
id: 235353897
Info: ['輾狗男打卡火鍋店！業

In [5]:
# 3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」
#計算熱門文章的「平均留言人數」與「平均按讚人數」
commentTotal = 0
likeTotal = 0
for v, w in posts.items():
    commentTotal += int(w[2])
    likeTotal += int(w[3])
print('平均留言人數: ', commentTotal/len(data))
print('平均按讚人數: ', likeTotal/len(data))

平均留言人數:  5.6
平均按讚人數:  56.06666666666667


In [6]:
#非熱門文章
browser = webdriver.Chrome(executable_path='chromedriver')
browser.get("https://www.dcard.tw/_api/forums/pet/posts?popular=false")

time.sleep(7)

# 取得資料（等瀏覽器資料出現後才執行）
html_source = browser.page_source
html = BeautifulSoup(html_source, 'lxml')
data = json.loads(html.text)

In [7]:
print('一次傳：%s 筆' % len(data))
data[:3]

一次傳：30 筆


[{'id': 235362721,
  'title': '老狗減肥日誌',
  'excerpt': '嗨大家好 我家的狗勾已經13即將邁向14歲了喔，一年前他36.7公斤，現在他23.4公斤，很多人都會覺得浮誇 老狗是怎麼瘦的瘦成這樣，我就給他吃一些健康食品（啊我不是葉佩雯，所以不講是啥）然後他就瘦了',
  'anonymousSchool': False,
  'anonymousDepartment': False,
  'pinned': False,
  'forumId': '7ee21581-1307-4ba9-b9dc-82028bdcca49',
  'replyId': None,
  'createdAt': '2021-02-16T13:57:09.299Z',
  'updatedAt': '2021-02-16T13:57:09.299Z',
  'commentCount': 0,
  'likeCount': 0,
  'withNickname': True,
  'tags': ['HIDE_THUMBNAIL'],
  'topics': [],
  'meta': {'layout': 'classic'},
  'forumName': '寵物',
  'forumAlias': 'pet',
  'nsfw': False,
  'gender': 'F',
  'school': '匿名',
  'department': 'margaret0114012',
  'replyTitle': None,
  'reportReason': '',
  'mediaMeta': [{'id': '3c81d9fc-1c26-46cd-884f-53e244347eab',
    'url': 'https://www.dcard.tw/v2/vivid/videos/a9fbc240-299d-45d0-83da-577082b40ff8?r=1.7777777777777777',
    'normalizedUrl': '',
    'thumbnail': 'https://vivid.dcard.tw/Public/a9fbc240-299d-45d0-83da-577082b40ff8/thumbna

In [8]:
# 2. 取出每一筆資料的「標題」、「貼文時間」、「留言人數」、「按讚人數」
posts = dict()

for d in data:
    posts[d['id']]= [d['title']]+[d['createdAt']]+[str(d['commentCount'])]+[str(d['likeCount'])]
    print('id:', d['id'])
    print('Info:',posts[d['id']])

id: 235362721
Info: ['老狗減肥日誌', '2021-02-16T13:57:09.299Z', '0', '0']
id: 235362450
Info: ['#問 貓耳朵旁的皮膚有紅點', '2021-02-16T13:15:14.218Z', '0', '0']
id: 235362163
Info: ['每次玩逗貓棒都嘴開開', '2021-02-16T12:19:28.115Z', '0', '0']
id: 235362118
Info: ['起飛～夢到變成超人的貓？', '2021-02-16T12:12:59.878Z', '0', '0']
id: 235362026
Info: ['被人嫌棄的身柴', '2021-02-16T11:54:04.607Z', '2', '1']
id: 235361816
Info: ['請教如何讓幼貓吃飼料', '2021-02-16T11:12:24.193Z', '1', '1']
id: 235361538
Info: ['我最愛狗狗💕', '2021-02-16T10:17:44.850Z', '0', '3']
id: 235361191
Info: ['貓吃人類的食物好嗎？', '2021-02-16T09:02:17.102Z', '8', '5']
id: 235361077
Info: ['請問這樣的眼睛是發炎了嗎？', '2021-02-16T08:38:05.491Z', '2', '1']
id: 235360959
Info: ['倉鼠食物', '2021-02-16T08:13:19.329Z', '2', '0']
id: 235360958
Info: ['偷窺貓', '2021-02-16T08:12:58.596Z', '0', '1']
id: 235360823
Info: ['男生是不是都比較喜歡男生', '2021-02-16T07:43:48.370Z', '6', '29']
id: 235360814
Info: ['關於貓侍飼料，主子便便會黏在屁股上', '2021-02-16T07:42:03.118Z', '0', '0']
id: 235360809
Info: ['我是邊牧，我愛藏手收', '2021-02-16T07:41:28.1

In [9]:
# 3. 計算熱門/非熱門文章的「平均留言人數」與「平均按讚人數」
#計算非熱門文章的「平均留言人數」與「平均按讚人數」
commentTotal = 0
likeTotal = 0
for v, w in posts.items():
    commentTotal += int(w[2])
    likeTotal += int(w[3])
print('平均留言人數: ', commentTotal/len(data))
print('平均按讚人數: ', likeTotal/len(data))

平均留言人數:  1.2
平均按讚人數:  3.6


In [10]:
#API              URL
#看板資訊(meta)   http://dcard.tw/_api/forums
#文章資訊(meta)   http://dcard.tw/_api/forums/{看板名稱}/posts
#文章內文         http://dcard.tw/_api/posts/{文章編號}
#文章內引用連結    http://dcard.tw/_api/posts/{文章編號}/links
#文章內留言       http://dcard.tw/_api/posts/{文章編號}/comments

#popular=true：代表抓的是熱門文章，把 true 改成 false 的話會照時間順序把文章抓下來。
#limit=30：代表一次抓30篇文章，如果不加上這串的話預設就是抓30篇。
#before=229848524：代表抓取文章 id 是 229848524 之前的文章。