# 東森新聞雲爬蟲練習
## 練習從東森新聞雲網站中，爬取新聞摘要及詳細內容。
## 學習利用Selenium模擬人為操作，更新動態網頁後爬取新聞內容。

In [1]:
import requests
import time
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

### 以財經新聞為例，先連結到財經新聞網頁，複製其URL。

In [2]:
ETtoday_url = "https://www.ettoday.net/news/focus/%E8%B2%A1%E7%B6%93/"  #財經新聞

### 用Selenium打開一個瀏覽器，連結到網站。然後模擬下拉網頁的動作，讓網頁完成更新，再處理後續動作。

In [6]:
browser = webdriver.Chrome(executable_path='./chromedriver')
browser.get(ETtoday_url)  # 打開瀏覽器並連到東森新聞雲網頁

SCROLL_PAUSE_TIME = 1

#
# 以下是用Selenium模擬下拉網頁動作，讓網頁更新
#
last_height = browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
while True:
    '''
    Your code here
    
    提示：可參考以下的Stack Overflow: 
    https://stackoverflow.com/questions/48850974/selenium-scroll-to-end-of-page-indynamically-loading-webpage/48851166
    https://stackoverflow.com/questions/20986631/how-can-i-scroll-a-web-page-using-selenium-webdriver-in-python
    '''
    # Wait to load the page.
    time.sleep(2)

    # Calculate new scroll height and compare with last scroll height.
    new_height = browser.execute_script("return document.body.scrollHeight")

    if new_height == last_height:

        break

    last_height = new_height

### 到這裡網頁已經更新完畢，所有的新聞都已經出現在網頁上。接下來做爬取收集新聞的動作。

In [4]:
#
# 這裡先建立一個函數，其功能是連到外部連結，並爬取新聞內容。
#
def getNewsDetailContent(link_url):
    resp = requests.get(link_url)
    resp.encoding = 'utf-8'
    #print(resp.text)

    soup = BeautifulSoup(resp.text, 'lxml')
    news_content = soup.find("div", attrs={'class':'story'}).find_all("p")
    for p in news_content:
        """
        .string屬性說明：
        (1) 若當前tag節點底下沒有其他tag子節點，會直接抓取內容(返回"NavigableString")
        (2) 若當前tag節點底下只有唯一的一個tag子節點，也會直接抓取tag子節點的內容(返回"NavigableString")
        (3) 但若當前tag節點底下還有很多個tag子節點，.string就無法判斷，(返回"None")
        """
        if ((p.string) is not None):
            print(p.string)

### 解析HTML並萃取新聞摘要，若有外部的連結，再連到外部連結並把詳細新聞內容抓取下來。

In [7]:
# 爬取網頁內容，解析後萃取新聞摘要
html = browser.page_source
soup = BeautifulSoup(html, "lxml")
all_news = soup.find("div", attrs={'class':'block block_1 infinite_scroll'})

news_block = all_news.find_all('div', attrs={'class':'piece clearfix'})

for i, news_item in enumerate(news_block):
    print("----------------------------------------------------------------------")
    news_body = news_item.find('h3')
    print("\n[%d] %s\n" % (i, news_body.a.string))
    
    # 
    # 連到外部連結，擷取詳細新聞內容
    #
    externalLink = "https://www.ettoday.net" + news_body.a["href"]
    getNewsDetailContent(externalLink)

----------------------------------------------------------------------

[0] 台北國際書展是否舉行「最晚3月底決定」　主題國韓國疫情嚴重影響參展意願

記者林育綾／台北報導
近來歐洲疫情延燒，英國更創下單日確診人數最高紀錄，倫敦書展主辦單位4日才宣布取消10日至12日的書展活動，影響了至少2.5萬名來自世界各地的出版人，更惹來不少抱怨。許多業者對於主辦方沒有及早做決定感到憤怒，迫使他們必須自行善後和吸收損失，批評主辦方「很不負責」、「應該早些決定」。
而眼看台北國際書展距離只剩2個月，指揮中心目前已公布「全國集會活動因應指引」，建議千人以上大型活動「非必要則避免」，不過目前僅訂定軟性的規範，表示主管機關與主辦單位應確實做風險評估，若要舉辦，則要訂定應變計畫，同時根據計畫是否確實作為駁准依據。
台北書基金會董事長林訓民表示，目前書展基金會與文化部合組「延期應變小組討論」每週開會，原則上除非疫情嚴重，中央明令不允許舉辦，還是希望能如期舉行。「但若要取消，最晚會在3月底決定，不會拖到最後一刻。」
有出版業者表示，希望主辦單位的決定可以超前部署，尤其今年書展主題國「韓國」的疫情相當嚴重，國外出版社參展意願可能也不高，加上疫情發展和消費者的心理顧慮等因素，對於台北國際書展如期舉行的看法不樂觀，但是要縮減書展規模？或是取消？希望能提早通知參展的廠商，有完整配套措施。
----------------------------------------------------------------------

[1] 林忠正／全球產業從單一世界工廠走向多核心產業鏈

▲經歷美中貿易戰及新冠疫情後，外資可能會重新考量產業的全球佈局。（圖／視覺中國）
由於新冠肺炎疫情快速惡化，確診人數、死亡人數，以及中國內部封城或封閉式管理的大都市和省份都還在封城中。鄰近南韓的第三大都市大丘情況危險、日本全國各地也爆出確診案例，甚至遠在義大利的十多個城鎮都相繼出現了封城的現象，而且傳染的威力還遠及歐洲、中亞、中東、甚至美國和南美國家。衝擊遠遠高於17年前SARS的疫情；加上中國春節假期延長，復工時程遞延不定，中國的消費和生產都受到嚴重的打擊。
目前國際經濟的狀況也比2003年更為疲弱，不但中國出口受到美中貿易戰影響，中國國內房

文/邱莉燕  攝影/張智傑
目前全球深陷新冠肺炎陰霾，但各國搶人才大戰卻未曾停歇，鄰近的韓國、香港、新加坡等，都將人才視為經濟轉型發展契機。 面對這場激戰，台灣在兩年前即端出「外國專業人才延攬及雇用法」，核發四證合一的「就業金卡」，向海外精英招手。YouTube創辦人陳士駿就是第一張就業金卡持卡人，包括天使投資人陳柏雨在內，多位矽谷台灣幫已陸續來台設立新創企業。這一波政策開放，除了招攬到「矽二代」鮭魚返鄉，更吸引至少15個國家的白領精英，帶起「超級金腦」湧進台灣的微趨勢。然而，新政落實到執行面時，仍有美中不足之處。《遠見》專訪陳士駿，請他分享親身經歷；並請科技部部長陳良基深入剖析，政府解決人才荒的具體作法。
台灣向來是人才外流的死地，一項施行了24個月的新政：「外國專業人才延攬及雇用法」，卻正企圖改寫宿命。
一群「超級大腦」逐漸湧進台灣，裡面的成員包含了矽谷台灣幫，以及至少15個國家的白領精英，帶起了一股海外人才來台的「微趨勢」。
「矽二代」鮭魚返台，以美國出生長大的陳柏雨為代表，他的父親是人稱矽谷創投之神的橡子園創投董事長陳五福。
畢業於康乃爾大學資訊系，陳柏雨先在矽谷工作，再到大陸創業，後來公司被愛點擊（iClick）併購。2017年跟著眾人一起到那斯達克為新東家上市敲鐘，等於是人生再次攀上高峰。
原本與妻小一起住在上海，陳柏雨從未想過回到一海之隔的台灣。但與他一同創業的兩位台灣人，三人功成名就後，起心動念想回饋台灣。
恰好在這個時候，父親陳五福告訴他台灣施行「外國專業人才延攬及雇用法」，針對外籍人士發行「就業金卡」，便興沖沖去申請，將事業重心和家庭移到台灣。
「兩個月就辦好卡，」笑嘻嘻露出一口白牙的陳柏雨說，2018年4月決定搬到台灣，6月領取就業金卡，剛好趕在8月開學前安排好3個小孩入學。
禮遇外國專才 吸引「超級大腦」定居台灣
國發會推動的就業金卡，2018年2月開始實施，是針對外國特定專業人才所設計的尊榮禮遇措施，目的是有效引進國際「超級大腦」定居台灣。
其中比較大的開放在於政策的鬆綁，包括工作許可、居留簽證、外僑居留證及重入國許可「四合一」的個人准證，這意味著持卡的外國人士不再需要像以前一樣，得先找好台灣的工作，才能透過雇主協助申請居留簽證，如今可以自由尋職及轉換工作。換句話說，不需要雇主，無論停職、就業或創業，皆可自由進出台灣。
「四合一」的好處則是

▲亞都麗緻集團旗下台中亞緻大飯店今年拿下「優良觀光旅館及旅館業團隊獎」，卻不敵新冠肺炎疫情與租金成本過高衝擊，董事會決議將停止營運。（圖／亞都提供）
記者林淑慧／台北報導
新冠肺炎（COVID-19）疫情延燒，觀光飯店產業成為重災區。亞都麗緻集團旗下台中亞緻大飯店今（6）日宣佈，因不敵疫情衝擊，單月營收已下滑三至四成，為避免虧損持續擴大，將自本月9日起熄燈，業界也盛傳房東國泰集團旗下觀光飯店事業擬接手，因租約保密條款雙方仍在協商中。
米其林摘星飯店亞都麗緻集團今（6）日召開重大訊息記者會，宣佈旗下台中亞緻飯店因累計虧損達3.5億元，新冠肺炎（COVID-19）疫情延燒，衝擊觀光旅運需求，加上租金過高不利後續營運，董事會今天決議台中亞緻飯店將停止營運。
亞都集團主管表示，台中亞緻近年來因固定成本相關費用，以及沈重租金壓力年年增高，且新飯店陸續加入台中餐旅市場，營收無法隨固定成本逐年增加導致持續虧損，新冠肺炎疫情全面重創飯店市場，導致單月營收下滑三至四成，停止營運是不得已的決定。
台中亞緻飯店座落於台中市英才路上的國泰金融大樓，據了解，台中亞緻與房東國泰建設的租約還有七年，提前解約勢將面臨相關賠償，對此亞都表示，提前終止租約乃受新冠肺炎疫情影響，屬租約另有約定外無法控制之事件，將依此向房東提出不得請求任何損害賠償或違約金，目前雙方已交付仲裁。
對於台中亞緻飯店的租址，國泰集團旗下「國泰觀光飯店事業」表示，集團長期尋找位於台中的據點，若有機會不排除爭取，以補足國泰飯店旗下商務旅館重要的一塊拼圖。
----------------------------------------------------------------------

[15] 不敵疫情衝擊台中亞緻9日熄燈　200名員工恐裁員

▲亞都麗緻集團旗下台中亞緻大飯店今年拿下「優良觀光旅館及旅館業團隊獎」，卻不敵新冠肺炎疫情與租金成本過高衝擊，董事會決議將停止營運。（圖／亞都提供）
記者林淑慧／台北報導
亞都麗緻集團旗下台中亞緻大飯店今（6）日宣佈3月9日起停止營運，亞都表示，台中亞緻約有200名員工，將依據勞基法辦理所屬同仁之資遣程序，換言之200名員工恐面臨裁員，惟亞都主管表示目前公司仍在討論中，將儘量協助同仁轉任集團其他業務。
台中亞緻飯店為麗緻餐旅集團直營據點，也是亞都麗緻大飯店旗下重要子公司，座落於

▲三八婦女節將至，專家提醒，各世代女性可透過保險規劃來分散風險，活出更漂亮的人生。（圖／示意圖／達志影像）
記者紀佳妘／台北報導
一年一度的「三八婦女節」即將到來，元大人壽提醒，獨立自主的現代女性，在照顧家人前更應將自己照顧好，透過保險規劃來分散人生各階段風險，如20世代女性可強化意外及醫療等保障，30世代女性則可用利變壽險累積資產等，就是要用不同的方式愛自己。
根據勞動部統計處2019年「近年我國女性勞動參與狀況」資料顯示，近20年來女性勞動力人數增加超過150萬人，勞動力參與率提升了5.5個百分點，由此可見女性經濟獨立的比例日益提高。越來越多的女性選擇保險來規劃保障及累積資產，由於不同的人生階段需求不同，元大人壽建議，可依自身狀況及經濟能力來進行規劃，同時針對各世代提出不同的投保重點。
針對剛畢業或職場資歷尚淺的20世代小資女，由於年輕且多為單身，元大人壽認為，先確認父母是否曾為自己投保過保單，可先針對不足之處補齊，若完全沒有任何保險，由於此階段收入較少，建議先投保如定期壽險、意外傷害保險及實支實付醫療險，作好基礎保障，另定期壽險及意外傷害保險也可選擇網路投保，不但保費較實體通路低、又沒有投保時間及空間的限制，輕鬆又方便。
走入婚姻或已為人母的30世代女性，人生多了妻子和媽媽的角色，家庭責任也變得不一樣。這階段除了補強自己的保障外，也要開始準備孩子的教育金，可選擇長年分期繳的利率變動型增額終身壽險，兼具保障及資產累積功能，如果孩子未來有留學國外的計畫也可以選擇美元利率變動型增額終身壽險，但須留意匯兌風險並檢視自身承受匯率風險的能力。
職場全盛期的40世代女性，由於工作資歷深，收入也是人生最豐厚的階段，此階段除了繼續累積子女教育金外，元大人壽指出，可開始著手退休準備，將老年最需要的醫療帳戶基金先準備好，如日額醫療險、失能扶助險、重大傷病險或癌症險，把未來的醫療照護率先備齊。
待子女經濟獨立後，進入空巢期的50世代女性可開始透過較短年期的利率變動型增額還本終身壽險來為自己創造被動式收入，成為退休後的現金流，未來還具有傳承功能，既能照顧自己退休後的生活，未來還能照顧下一代。
----------------------------------------------------------------------

[26] 高雄25期重劃區講究生活機能　中古房價竟大