# HTTP 動態網頁架構說明


* 了解動態網頁的資料爬蟲策略
* 知道非同步網頁載入機制（Ajax）
* 學習兩種對應動態網頁爬蟲的的策略


## 作業目標

回答以下問題：

1. 動態網頁跟靜態網頁的差別是什麼？原本靜態網頁的做法會產生什麼問題或是缺點？
2. 還記得我們在 ETTODAY 靜態爬蟲實作練習中，有請大家完成一個題目「取出今天所有的發文」，但仔細看其實並沒有真的把當天所有的新聞都抓回來， 試著回答看看原因是什麼？及該如何檢查？


### 1. 動態網頁跟靜態網頁的差別是什麼？原本靜態網頁的做法會產生什麼問題或是缺點？

In [1]:
import requests
import re
from bs4 import BeautifulSoup
# 查看目前上映那些電影，並擷取出其ID資訊
url = 'https://www.newscan.com.tw/all-faq/faq-detail-15.htm'
resp = requests.get(url)
resp.encoding = 'utf-8'

soup = BeautifulSoup(resp.text, 'lxml')
content = soup.find("div", attrs={'class':'answer-box'})
a = content.text.split()
for i in range(len(a)-1):
  print(a[i])

靜態網頁
超文件標示語言HyperText
Markup
Language，簡稱：HTML，HTML是網站建置的基礎技術，常與CSS與Javascript配合成一個適合觀看的網頁，讓瀏覽器去讀取，一般判斷方式為網頁副檔名為html或htm皆為靜態網頁，靜態網頁的優勢為容易為搜尋引擎所接受，所以很多動態網頁會將動態網頁轉變成靜態方式，就是所謂的【偽靜態網頁】來提高搜尋引擎的友善度達到排名優化的成效。
動態網頁
動態網頁主要是搭配伺服器與資料庫共同運作，主要是使用大量編譯的地方，如會員功能、購物車、討論區等等..，意思是指可以與網頁做互動編譯的網頁，動態網頁的內容隨著用戶的輸入和互動而有所不同有Perl、PHP、ASP、JSP、ColdFusion等編譯方式，從而對動態網頁的內容進行改變。
靜態網頁與動態的區別
靜態網頁與動態網頁是可以同時存在一個網站上的，二種語言各有其優勢，靜態網站主要是用於較於簡單，更新的不頻繁的網頁，反之動態網站較適合用於，資料內容較大，更新快速的網頁，讓維護人員可以更方便管理網站，也大幅降低維護成本。


### 2. 還記得我們在 ETTODAY 靜態爬蟲實作練習中，有請大家完成一個題目「取出今天所有的發文」，但仔細看其實並沒有真的把當天所有的新聞都抓回來， 試著回答看看原因是什麼？及該如何檢查？

    => 滑鼠滾動至頁面底部後，網站自動更新加入不同的內容。

    => 使用動態網頁爬蟲技術 抓取資訊內容。

In [2]:
import requests
from bs4 import BeautifulSoup

url = 'https://www.ettoday.net/news/news-list.htm'
r = requests.get(url)

soup = BeautifulSoup(r.text, "html5lib")

for d in soup.find(class_="part_list_2").find_all('h3'):
    print(d.find(class_="date").text, d.find_all('em')[-1].text, d.find_all('a')[-1].text)

2019/12/17 07:51 體育 下一個簽約的是柳賢振？　至少6隊競爭藍鳥道奇最積極
2019/12/17 07:46 生活 快訊／07：41花蓮規模4.0地震！　最大震度5級
2019/12/17 07:33 時尚 精選6雙「經典藍」球鞋，最低2千元就能穿回家
2019/12/17 07:29 政治 「下架吳斯懷」發酵！黃復興黨部爆分裂　上萬韓粉「心機加入國民黨」
2019/12/17 07:29 政治 1221高雄大遊行「若有韓粉搗亂」　葉元之分析：一定是反串
2019/12/17 07:10 影劇 謝和弦小三「無P原裝真面目」被挖出！　粗手腫臉爆全身動刀…驚人黑歷史曝
2019/12/17 07:07 社會 七星煤礦大爆炸49名礦工罹難　誤送52具棺材「竟補滿變死52人」
2019/12/17 07:05 國際 56歲「大齡女學霸」找不到伴　終遇小學畢業男墜愛河...甜蜜完婚
2019/12/17 07:01 旅遊 40年來銷售10萬個　亞都巴賽麗廳消費經典套餐送法式酥芙蕾
2019/12/17 07:00 影劇 「職人劇」專門戶李善均演魯蛇檢察官　《檢察官內傳》舌戰鄭麗媛飆戲
2019/12/17 07:00 健康 悲劇！最愛「在節日前提分手」星座男Top3　渣雙子排第2：有新的妹了
2019/12/17 06:58 財經 勞動部清查張綱維公司結果今出爐　勞長許銘春10點說明
2019/12/17 06:51 生活 張綱維爆「掏空遠航22億」藏錢處曝光　編造假債權遭法官打臉
2019/12/17 06:44 政治 波特王燒出前兩次大選關鍵　謝震武：2016年周子瑜一站翻盤
2019/12/17 06:29 國際 波音宣布1月起停止製造737 Max　兩空難奪346命...停飛9月難挽回
2019/12/17 06:10 時尚 年度最狂巨星Lizzo造型盤點　亮片、緊身衣與爆表的愛自己
2019/12/17 05:56 社會 板橋黑衣男深夜持刀碎念「北山歡迎你」　隨手割機車坐墊嚇壞路人
2019/12/17 05:56 生活 今飆29度周三一早就變天…最低溫時間曝　跨年前有強冷空氣？彭啟明說話了
2019/12/17 05:47 國際 貿易戰趨緩帶氣勢！美股道瓊上漲100點　美媒：年底前股市樂觀
2019/12/17 01:56 社會 國道火燒車！休旅急