# 東森新聞雲爬蟲練習
## 練習從東森新聞雲網站中，爬取新聞摘要及詳細內容。
## 學習利用Selenium模擬人為操作，更新動態網頁後爬取新聞內容。

In [1]:
import requests
import time
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

### 以財經新聞為例，先連結到財經新聞網頁，複製其URL。

In [2]:
ETtoday_url = "https://www.ettoday.net/news/focus/%E8%B2%A1%E7%B6%93/"  #財經新聞

### 用Selenium打開一個瀏覽器，連結到網站。然後模擬下拉網頁的動作，讓網頁完成更新，再處理後續動作。

In [12]:
browser = webdriver.Chrome()
browser.get(ETtoday_url)  # 打開瀏覽器並連到東森新聞雲網頁

SCROLL_PAUSE_TIME = 1


#
# 以下是用Selenium模擬下拉網頁動作，讓網頁更新
#
last_height = browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
while True:

        # Scroll down to the bottom.
        browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")

        # Wait to load the page.
        time.sleep(2)

        # Calculate new scroll height and compare with last scroll height.
        new_height = browser.execute_script("return document.body.scrollHeight")

        if new_height == last_height:

            break

        last_height = new_height
        print('網頁讀取完畢')
        '''
        Your code here
        提示：可參考以下的Stack Overflow: 
        https://stackoverflow.com/questions/48850974/selenium-scroll-to-end-of-page-indynamically-loading-webpage/48851166
        '''

網頁讀取完畢


### 到這裡網頁已經更新完畢，所有的新聞都已經出現在網頁上。接下來做爬取收集新聞的動作。

In [13]:
#
# 這裡先建立一個函數，其功能是連到外部連結，並爬取新聞內容。
#
def getNewsDetailContent(link_url):
    resp = requests.get(link_url)
    resp.encoding = 'utf-8'
    #print(resp.text)

    soup = BeautifulSoup(resp.text, 'lxml')
    news_content = soup.find("div", attrs={'class':'story'}).find_all("p")
    for p in news_content:
        """
        .string屬性說明：
        (1) 若當前tag節點底下沒有其他tag子節點，會直接抓取內容(返回"NavigableString")
        (2) 若當前tag節點底下只有唯一的一個tag子節點，也會直接抓取tag子節點的內容(返回"NavigableString")
        (3) 但若當前tag節點底下還有很多個tag子節點，.string就無法判斷，(返回"None")
        """
        if ((p.string) is not None):
            print(p.string)

### 解析HTML並萃取新聞摘要，若有外部的連結，再連到外部連結並把詳細新聞內容抓取下來。

In [14]:
# 爬取網頁內容，解析後萃取新聞摘要
html = browser.page_source
soup = BeautifulSoup(html, "lxml")
all_news = soup.find("div", attrs={'class':'block block_1 infinite_scroll'})

news_block = all_news.find_all('div', attrs={'class':'piece clearfix'})

for i, news_item in enumerate(news_block):
    print("----------------------------------------------------------------------")
    news_body = news_item.find('h3')
    print("\n[%d] %s\n" % (i, news_body.a.string))
    
    # 
    # 連到外部連結，擷取詳細新聞內容
    #
    externalLink = "https://www.ettoday.net" + news_body.a["href"]
    getNewsDetailContent(externalLink)


----------------------------------------------------------------------

[0] 裕民打造智慧化幸福上班空間　17套視訊會議設施疫情期間立大功

▲左上為天氣預報系統、左下為船舶點位圖、右上為系統運作綜合圖、右下為船舶營運狀況圖。(圖／記者張佩芬攝)
記者張佩芬／台北報導
裕民航運依據數位轉型政策，經過近半年規劃，去年3月啟用全新裝潢辦公室，建立智能化辦公系統，不同部門間設置休閒沙發區或開放式茶水間，打造員工幸福空間，另配置多達17個視訊會議空間，意外讓疫情期間很難外出或出國洽公的主管與員工，能透過視訊會議完成諸多任務。
▲裕民航運員工幸福空間。（圖／記者張佩芬攝）
在智能設備完成建置後，去年9月裕民與電信設備廠愛立信合作建立船舶效能管理系統 (FPM)，該系統全面導入裕民航運船隊資訊，透過速度監控自動化功能，估計每次航程平均可省下2％燃料。
▲裕民開放式視訊會議空間。(圖／張佩芬攝)
辦公室內包括5間獨立會議室、8個部門與4個主管房間，都有視訊會議設備，17套超前部屬的視訊設備，讓公司在疫情期間不用高價搶購視訊設施，連修船監工都可運用上，意外在新冠肺炎疫情爆發後，成為高利用率與高效率的海內外業務聯繫與執行公務重要工具。
散裝船公司因為做的是整船運送業務，不像貨櫃船公司需要有大批業務與文件製作人員，裕民總公司工作人員約80人，船員約1,200名。總公司80人在台北市敦化南路遠企大樓450坪的圓形辦公室內工作，除了室內空間寬敞舒適，29層高的辦公室，可以遠眺文山區的山丘樹林，也可觀賞樓下敦化南路林蔭大道，7到10月林蔭大道的台灣欒樹從黃色的花海到酒紅色的果莢，可以讓員工在下午茶時間充分放鬆一下。
▲裕民總經理王書吉有時會升起辦公桌，改站著處理公文。(圖／張佩芬攝)
考慮公司高階主管長時間坐在辦公桌前的辛勞，經理級以上主管的採用的是升降桌，坐久了想站著辦公，可以將桌子升高，方便站著辦公。
▲開放式的茶水間也可供用餐。(圖／記者張佩芬攝)
集團的員工餐廳設在遠企大樓7樓，每個外賣約150元的餐盒、水果與湯，只收33元，其餘由公司補貼。疫情前可到員工餐廳，或是裕民茶水間用餐，現在一律回自己座位用餐，集團在板橋上班的員工，也由遠企的員工餐廳外送便當。
----------------------------

▲下周油價將連十漲。（圖／記者姜國輝攝）
記者林淑慧／台北報導
北半球夏季用油需求旺盛，牽動國際油價走升，專家今（1７）日透過浮動油價公式試算，在考量亞鄰競爭國最低價因素之下，預估國內汽柴油零售價下周將分別調漲0.1元；影響所及，九二汽油每公升零售價將，提醒用車族加油要快，才能替自己省點荷包。
依浮動油價調整機制作業原則，調整後的參考零售價格分別為92無鉛汽油每公升為28.6元、95無鉛汽油每公升30.1元、98無鉛汽油每公升32.1元、超級柴油每公升25.7元。
專家指出，受到近期產油國暫緩生產步調、北半球夏季用油需求旺盛影響，國際油價持續走升；累算至累算至7月15日之7D3B週均價為 74.49美元，較上週74.26上漲0.23美元。新台幣兌美元匯率27.978較上週27.989升值0.011 。
依浮動油價調整機制作業原則，以及考量亞鄰競爭國最低價及平穩措施的條件下，預估下週汽、柴油零售價格每公升各上漲0.5元及1.4元。不過，台灣中油必須考量亞鄰最低價規定，油價調整不得高於日本、韓國、香港、新加坡等亞鄰，預料中油將吸收部分漲幅。實際調整金額請於本周日中午12時詳見台灣中油全球資訊網暨經濟部網站。
----------------------------------------------------------------------

[10] Google緊急更新！Chrome有「零日漏洞」　已遭駭客利用

▲Google Chrome爆有零日漏洞。（圖／取自Google官網）
記者陳俐穎／綜合報導
Google更新Chrome桌面版本 91.0.4472.164，此次更新主要修復了7個安全漏洞，且其中一大漏洞為「零日漏洞」，且已經遭到利用。
零日漏洞或零時差漏洞（英語：zero-day vulnerability、0-day vulnerability）通常是指還沒有修補程式的安全漏洞，而零日攻擊或零時差攻擊（英語：zero-day exploit、zero-day attack）則是指利用這種漏洞進行的攻擊。
根據外媒統計，這已經是Google今年以來抓到的第8個漏洞。這次7項更新中，代號「CVE-2021-30563」的漏洞，據說已經遭到駭客利用，但具體情形並外對外透露。Google預計這幾天將會在用戶後台進行更新。
---------------

▲紡拓會組團7月登全球服裝重鎮巴黎，感受到歐洲逐漸解封的氣氛，不少法國時尚牌買主迫不及待來挑選機能布料。（圖／紡拓會提供）
記者吳佳穎／台北報導
紡拓會表示，歐洲已逐漸解封，紡織品採購需求回溫，7月初台灣紡織廠組團到巴黎參加Texworld Evolution Paris - Le Showroom展，歐洲買主已迫不急待一睹新一季的產品，吸引超過800位專業品牌買主參觀。參觀買主主要來自法國，約佔一半，其餘來自歐洲，到訪買主包括，agnès b.、AIGLE、Decathlon(迪卡儂)、Apostrophe Georges Rech、Armand Thiery、Bréal、Chloé、CARVEN及Galeries Lafayette等。
巴黎是全球重要服裝及紡織品的流行時尚中心，隨著歐洲漸解封，織品、成衣需求回溫。紡拓會說，這次是第二屆展出，主要呈現法式美學風格和新潮的流行元素，台灣有大宇、帛坊、明綸、達步施、纖宇及維聖等6家紡織業者參加，展出各式流行性及機能性紡織品與成衣。
▲因應疫情，會展還是有限制，買主大多線下、線上採購同步進行。（圖／紡拓會提供）
另外，為因應疫情造成的邊境及集會活動限制，主辦單位規劃線上線下整合的樣品展。紡拓會於展前統一寄交參展業者之展品，由大會整理並將展品資訊數位化，買主於現場透過行動裝置留下採購資訊，並在展後將買主諮詢訊息傳送給參展業者，以利後續商洽。
紡拓會自去年起規劃以樣品展示會的方式，於全球多點辦理拓銷，廣獲買主好評，成功攜手臺灣紡織業者突破疫情的限制，持續與國際買主接軌。本年上半年已成功辦理東京、胡志明市、河內及香港等地之樣品展示間活動，下半年將整合線上線下資源，於東京及大阪辦理結合實體樣品展示、線上型錄展示及視訊商洽方式的展示會，有興趣的業者可洽紡拓會。
▲各式機能布料是台灣的強項。（圖／紡拓會提供）
----------------------------------------------------------------------

[21] 台積電被動捐疫苗？　張忠謀：我已退休不能回答

記者陳家祥／台北報導
台積電創辦人張忠謀16日代表出席亞太經濟合作組織（APEC）首屆「非正式領袖閉門會議」，晚間在透過視訊與會後，於總統府召開記者會。針對近來BNT疫苗的採購捐贈風波，張忠謀表示，台積電怎麼樣，我老早退休了，

圖文／鏡週刊
台股高檔震盪，特別是散戶最鍾愛的航運股暈船中，操作難度大增。法人指出，隨上市櫃公司陸續宣布除權息日，再加上中長線資金布局高殖利率個股，擇優高殖利率股票是當下抗震護體的首選，但光是配息高還不夠，當前環境務必掌握波動低、填息穩、題材性等3大要素。
華南投顧董事長儲祥生表示，高殖利率股票在盤面無明顯主流、震盪加劇的時候，絕對可以注意，但在選股上，投資人須掌握一個要訣：股價穩定。單日平均波動度最好不要超過3%。
「試想一種情況，今年可能拿到5%利息，但股價一天就摔掉7%，領這個息就失去意義，買股價波動大的高息股，相當冒險。」儲祥生還說，最好也要避開景氣循環股，例如：鋼鐵、水泥塑化、航運、營建、汽車等。主要原因是這類股票中長線來說，價格波動大，投資人也許今年拿到高股利，但未來景氣開始衰退，股價恐怕大縮水。
「今年有幾家貨櫃輪公司，賺到20幾塊，明年可能配到10塊，殖利率很高，但能不能買？當然不能，因為沒人敢保證明、後年還能賺這麼多。」儲祥生強調，投資人盡量以股價營收穩定、殖利率約5%的個股為主，像是連續19年皆配息的兆豐金，他建議可持續買進，另外，其他營收穩定的產業，如保全業中保科、租賃業何潤，雖然冷門，但在股市風險攀升時便發揮出抗震效果。
長期研究高殖利率股、價值投資達人股人阿勳強調，好的高殖利率股票需符合4個條件，包括：殖利率大於5%；第1季營收年增率為正；連續10年都有發放現金股利；連續5年都在當年度完成填息。「當年度能否填息，是相當重要的訊號，填息代表大股東有信心，願意拿到現金股利再投入，抱起來相對安心。」
本刊進一步綜合專家的選股條件，篩選出7檔個股，包括：卜蜂、精誠、零壹、兆豐金、華票、達新、崇友。
精選7檔高殖利率個股
----------------------------------------------------------------------

[29] 防疫宅在家！電信業者推家電、手機0元帶回家

▲中華電信推手機家電0元帶回家。（圖／記者陳世昌攝）
記者陳俐穎／台北報導
防疫期間，待在家的時間變多，3C用品需求也增加，中華電信今日推出「1+1任你配，防疫輕鬆購」活動熱門5G手機與防疫必備家電、平板等優惠組合，最低0元起即可一起帶回家。
中華電信表示，到8月底前，申辦精采5G購機方案月繳999元，綁約36個月，5G手機，包括Sam