# Ettoday 網路爬蟲實作練習


* 能夠利用 Request + BeatifulSour 撰寫爬蟲，並存放到合適的資料結構


## Ettoday 網頁爬蟲

### 先複習一下原本純靜態的爬法

In [3]:
# 先複習一下原本純靜態的爬法

import requests
from bs4 import BeautifulSoup

url = 'https://www.ettoday.net/news/news-list.htm'
r = requests.get(url)

soup = BeautifulSoup(r.text, "html5lib")

for d in soup.find(class_="part_list_2").find_all('h3'):
    print(d.find(class_="date").text, d.find_all('a')[-1].text)


AttributeError: 'NoneType' object has no attribute 'find_all'

### 從上面的結果來看，你會發現它只會抓到最近的資料。原因是因為資料是透過下滑的過程中，利用 JavaScript 動態載入的。因此，這邊我們必須利用 selenium 這樣的工具來輔助：

In [8]:
# 打開瀏覽器

from selenium import webdriver
from bs4 import BeautifulSoup

browser = webdriver.Chrome(executable_path='chromedriver')

browser.get("https://www.ettoday.net/news/news-list.htm")


In [9]:
# 每個兩秒鐘自動往下滑

import time
for i in range(10):
    time.sleep(2)
    browser.execute_script("window.scrollTo(0, 10000);")


In [10]:
# 取得資料，丟到 BeautifulSoup 解析

html_source = browser.page_source
soup = BeautifulSoup(html_source, "html5lib")

for d in soup.find(class_="part_list_2").find_all('h3'):
    print(d.find(class_="date").text, d.find_all('a')[-1].text)


2019/07/30 23:36 快訊／近千人夜圍葵涌警署　警方施放「胡椒噴霧」驅趕更一度舉槍
2019/07/30 23:35 她為3汪造夢幻豪宅…坐擁花台、超大廳　網看呆：比我家還高級
2019/07/30 23:34 老脫皮又爆癢！醫提4招「擺脫香港腳」：公用拖鞋別亂穿
2019/07/30 23:33 林書豪原本是2010年第15順位？火箭總管坦承因亞裔身分沒選他
2019/07/30 23:27 《哈利波特》衍生影集真的來了！　官方宣布：全球招募演員「素人也可報名」
2019/07/30 23:26 余文樂認了彭于晏是「妻」！　抱兒甜靠男神曬「新1家3口」…王棠云說話了
2019/07/30 23:23 宣明智談胡定華「超平凡的偉大」　以足球憶師生情　
2019/07/30 23:19 《玩命關頭：特別行動》5大看點解密！「片尾3個彩蛋」：出現2大咖
2019/07/30 23:17  情人節來場浪漫約會　全台17家法國外交部認證的法式餐廳
2019/07/30 23:10 警察出手敲破路邊車窗…那一刻眾人竟圍觀鼓掌　近看原來為了牠
2019/07/30 23:10 林依晨嬌羞放閃「老公送這個很甜蜜」　卻和林柏宏穿情侶裝
2019/07/30 23:08 上海北京來回飛2次！12小後還在虹橋機場...返京乘客「生無可戀」
2019/07/30 22:59 布袋鎮過溝建德宮「火燈夜巡」　萬把火炬齊燃驅鬼求平安
2019/07/30 22:45 價美物廉做愛心　黃偉哲：集愛挺庇護有情過中秋
2019/07/30 22:43 脖子「種草莓」黑青超大一片！　網驚嚇：真的會出人命
2019/07/30 22:40 接機粉絲空歡喜一場　郭台銘返國時間尚未確定
2019/07/30 22:39 大林樂齡課程師資具水準　彰縣樂齡團隊專程南下取經
2019/07/30 22:39 香港校長公然詛咒警察子女「活不過7歲」　梁振英怒批：教育界之恥
2019/07/30 22:38 弟弟立正「2→8cm」算正常？高中男憂：包莖卡卡害的...醫曝癌變下場
2019/07/30 22:35 U-12世界盃壘球錦標賽落幕　中華隊是大贏家
2019/07/30 22:35 中職／廖健富致勝安MVP　賽後繼續特打
2019/07/30 22:35 比鬼屋更寫實血腥　台南麻豆代天府附設十八層

In [None]:
# 關閉瀏覽器
browser.quit();

## 作業目標

根據範例：

1. 取出今天所有的新聞
2. 取出現在時間兩小時內的新聞
3. 根據範例，取出三天前下午三點到五點的新聞