# 東森新聞雲爬蟲練習
## 練習從東森新聞雲網站中，爬取新聞摘要及詳細內容。
## 學習利用Selenium模擬人為操作，更新動態網頁後爬取新聞內容。

In [4]:
import requests
import time
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager


### 以財經新聞為例，先連結到財經新聞網頁，複製其URL。

In [5]:
ETtoday_url = "https://www.ettoday.net/news/focus/%E8%B2%A1%E7%B6%93/"  #財經新聞

### 用Selenium打開一個瀏覽器，連結到網站。然後模擬下拉網頁的動作，讓網頁完成更新，再處理後續動作。

In [7]:
browser = webdriver.Chrome(ChromeDriverManager().install())
browser.get(ETtoday_url)  # 打開瀏覽器並連到東森新聞雲網頁

SCROLL_PAUSE_TIME = 2

#
# 以下是用Selenium模擬下拉網頁動作，讓網頁更新
#
last_height = browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
while True:
        # Scroll down to the bottom.
        browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        print('網頁更新中...')

        # Wait to load the page.
        time.sleep(SCROLL_PAUSE_TIME)

        # Calculate new scroll height and compare with last scroll height.
        new_height = browser.execute_script("return document.body.scrollHeight")

        if new_height == last_height:
            print('到達頁面底端')
            break
        last_height = new_height


Looking for [chromedriver 80.0.3987.106 mac64] driver in cache 
File found in cache by path [/Users/tonylee/.wdm/drivers/chromedriver/80.0.3987.106/mac64/chromedriver]
網頁更新中...
網頁更新中...
到達頁面底端


### 到這裡網頁已經更新完畢，所有的新聞都已經出現在網頁上。接下來做爬取收集新聞的動作。

In [8]:
#
# 這裡先建立一個函數，其功能是連到外部連結，並爬取新聞內容。
#
def getNewsDetailContent(link_url):
    resp = requests.get(link_url)
    resp.encoding = 'utf-8'
    #print(resp.text)

    soup = BeautifulSoup(resp.text, 'lxml')
    news_content = soup.find("div", attrs={'class':'story'}).find_all("p")
    for p in news_content:
        """
        .string屬性說明：
        (1) 若當前tag節點底下沒有其他tag子節點，會直接抓取內容(返回"NavigableString")
        (2) 若當前tag節點底下只有唯一的一個tag子節點，也會直接抓取tag子節點的內容(返回"NavigableString")
        (3) 但若當前tag節點底下還有很多個tag子節點，.string就無法判斷，(返回"None")
        """
        if ((p.string) is not None):
            print(p.string)

### 解析HTML並萃取新聞摘要，若有外部的連結，再連到外部連結並把詳細新聞內容抓取下來。

In [9]:
# 爬取網頁內容，解析後萃取新聞摘要
html = browser.page_source
soup = BeautifulSoup(html, "lxml")
all_news = soup.find("div", attrs={'class':'block block_1 infinite_scroll'})

news_block = all_news.find_all('div', attrs={'class':'piece clearfix'})

for i, news_item in enumerate(news_block):
    print("----------------------------------------------------------------------")
    news_body = news_item.find('h3')
    print("\n[%d] %s\n" % (i, news_body.a.string))
    
    # 
    # 連到外部連結，擷取詳細新聞內容
    #
    externalLink = "https://www.ettoday.net" + news_body.a["href"]
    getNewsDetailContent(externalLink)


----------------------------------------------------------------------

[0] 國光生技系列二／冷治湘領軍疫苗開發團隊　複製SARS、H7N9研發經驗

▲國光生技研發處長冷治湘。（圖／記者徐斌慎攝）
記者姚惠茹／台中報導
面對新冠肺炎（COVID-19）疫情加劇，全球引頸期盼藥物、疫苗開發成功，而國光生技（4142）其實在春節前就成立專案小組，並與國衛院簽訂合作意向書，全力加速研發疫苗，這幕後領軍疫苗開發團隊正是曾經參與過SARS疫苗研發的國光生技研發處長冷治湘。
冷治湘曾是國家衛生研究院疫苗研發中心開發團隊的重要一員，參與過SARS、呼吸道融合病毒、腦膜炎雙球菌、登革熱、子宮頸癌、 肺炎鏈球菌等疫苗研發，並從學術單位跨進產業界，參與國光生技重組血球凝集素、H7N9禽流感、腸病毒等疫苗研發。
▲國光生技研發處長冷治湘。（圖／記者徐斌慎攝）
「研發疫苗是我的興趣！」冷治湘表示，自己在國衛院就開始研發疫苗，去年有機會跟產業做連結，而且國光生技在做的疫苗就是自己的興趣，因此想說可以結合而跨入產業界，雖然過去在學術研究單位和現在的公司著重的角度不同，但新冠肺炎疫情爆發，正好結合過往經驗來研發疫苗。
冷治湘指出，國光生技其實在春節前就因應疫情成立專案小組，並在日前與國衛院簽訂合作意向書，目前雙方正在洽談合作細節，希望可以共同投入疫苗研發，但疫苗是給健康的人使用，因此一定要有安全性的評估測試，所以過去疫苗研發一般至少需要5~10年的時間。
▲國光生技研發處長冷治湘。（圖／記者徐斌慎攝）
冷治湘進一步指出，比如說疫苗標的物出來，發現新冠肺炎的基因序列跟SARS很像，就可以借鏡過往冠狀病毒的資訊，但下一步還將進行標的物初步篩選，再經過中和抗體、保護效價、安全測試，挑選出比較好的候選疫苗，所以並沒有大家想像地那麼快，但是研發團隊會盡量趕。
談到美國研發的mRNA疫苗進到第一期人體臨床試驗，冷治湘說明，目前常用的人用疫苗製作分為4種，包括死毒病原菌、去活化病原菌、多醣體和次單位疫苗，前3項由於仍須接觸病原菌，因此以重組蛋白質及合成胜肽為成分的次單位疫苗，成為現代疫苗開發的主流趨勢。
▲國光生技新冠肺炎疫苗研發實驗室。（圖／記者徐斌慎攝）
冷治湘進一步說明，一般的生物體的遺傳訊息是在DNA上面，DNA要變成RNA，

綜合陸媒報導，這座產業園區將會坐落於昆山經濟技術開發區內，規劃占地面積約8萬平方米；其中星巴克全資投建的咖啡烘焙工廠，於今年下半年開工建設，預計2022年夏季建成投產。咖啡創新產業園是想要打造「全產業鏈的咖啡創新產業基地」，其中包括咖啡豆進出口、烘焙、包裝、儲存、物流配送、分銷以及咖啡烘焙相關培訓。
星巴克表示，建成後，咖啡豆的來源不會只有大陸產區的，而是來自各全球各地的咖啡豆會在這烘焙。除此之外，星巴克要將烘焙工廠打造成既通過最新國際LEED鉑金級認證，又符合大陸綠色建築三星認證標準的工廠，提供最為節能環保的咖啡烘焙。
星巴克咖啡公司總裁兼首席執行官凱文•詹森（Kevin Johnson）表示，「大陸是我們很重要的市場之一，那咖啡創新產業園是一項深遠的戰略投資。」星巴克大陸董事長兼首席執行官王靜瑛也表示，「目前雖然受疫情影響，但是卻比任何時候都要堅定，以實際的行動實踐。」
----------------------------------------------------------------------

[9] 疫情黑天鵝襲擊全球金融市場　中信銀：股市何時觸底可看2指標

▲中信銀行預估，疫情對今年第2季產生最大衝擊，甚至影響第3季。（示意圖／記者屠惠剛攝）
記者紀佳妘／台北報導
隨著新冠肺炎（COVID-19）蔓延到全球，市場恐慌持續升高，全球股市出現拋售行為，各國央行聯手採取寬鬆貨幣政策，減緩疫情對經濟成長的衝擊，中信銀行建議，在疫情出現可控制契機前，可先以防禦性類股為主，多觀察航空與飯店股表現，待成長預期開始回升後，再轉換至循環成長型類股操作。
根據嚴重特殊傳染性肺炎疫情發展、過去流行病對經濟及市場影響與全球股市的投資洞察，中信銀行指出，隨著疫情爆發，中國大陸景氣下滑與旅遊、貿易、供應鏈等途徑所產生的負面外溢效應，預期將對今（2020）年第2季產生最大衝擊，甚至影響第3季。
此外，肺炎疫情爆發初期，與人潮流動關聯度最高的亞洲航空與飯店類股即受到嚴重影響，美股尚在持續攀升時，股價早已率先下修10%至15%，可說是第一波疫情受害股。另一方面，從2003年SARS的經驗也發現，當時全球航空與飯店股，在中國大陸疫情出現高峰後沒多久就率先落底，與影響甚劇的香港股市相比，約提早一個月落底，因此「未來要判斷股市何時觸底，或許可進一步觀察航空與飯店股表現」。
從今

近期國際金融情勢受新冠肺炎影響，造成證券市場出現巨幅波動，上市公司109年2月累計營收也因中國各地停工影響而較去年同期衰退7.76％。證交所指出，我國上市公司基本面佳，獲利能力及流動性穩健，且目前中國大陸復工情況持續好轉，證交所鼓勵上市公司舉辦法人說明會，對投資人說明營運狀況，以增進資訊透明度及提升投資信心。
經統計，今年已公告上市公司擬發放現金股利者計328家，股利超過2元以上者計有154家，其中超過10元以上者包括旭隼、國巨、華碩、麗豐-KY、長華、祥碩、儒鴻及億豐等。
此外，108年起實施期中盈餘分派，迄109年3月19日止，已通過章程規定股利按季或半年度發放之公司計有台積電等54家上市公司，其中108年度營運佳且實施期中盈餘分派者，計有台積電、國巨等11家上市公司，發放股利總金額將近2,603億元。
----------------------------------------------------------------------

[20] 台積電淪外資提款機　謝金河：國安基金護盤先盯台積電

● 謝金河／《財訊》社長兼發行人、財信傳媒董事長
全球股市在疫情升溫中，就像山上石頭滾下來一般，除了中國股市外，幾乎沒有一個能倖免。
台股殺破10年缐，最低跌至8523.63，單是3月以來，台股已重挫2610.38，跌幅高達23.12%，這個跌幅跟全球大致同步，這恐怕是台股史上最慘烈的下跌。
在今年新春紅盤，台股跳空大跌近700點後，在後續的多空交戰中，稍有猶豫的投資人都難逃這一波殺戮。而且，在殺戮中，大家只求套現，根本不在乎公司有沒有價値。
這兩天，友達董事長彭雙浪跳出來喊話說，友達帳上現金逾800億，但股價跌到6.39元，市值只剩615億。
台積電穩　台股才會穩
不過，台股能不能穩得住，台積電角色非常重要。
這一波外資把台股當提款機，賣超台股114.5億美元，約3500億台幣，而外資更把台積電當超級提款機。今年迄今，外資賣超台積電705652張，大約是二千多億台幣，約是外資賣超台股的六成比重，這兩天美股狂殺，TSMC adr最低殺到43.23美元，後續TSMC在美股交易會不會再破底？也決定台積電的股價。
國安基金要護盤，最好先盯住台積電股價！ 
熱門點閱》
► 2020股災》單驥／股市、油市、疫情與貿易戰下的風暴
► 劉大年／防疫拼經濟　振興券如何發揮效

聯準會和其他五大央行的聯手行動並沒有讓美股和全球股市馬上翻轉，市場並以利空來解讀這樣的動作。市場擔心的是，新冠肺炎疫情在歐美各國仍在擴大階段還沒有像中國那樣疫情已從高點緩和。降息和擴大ＱＥ政策只能提振市場的信心，最重要的那顆解決新冠肺炎的有效藥還沒出現，這才是市場現階段最擔心的問題。即便如此，聯準會這時候還是得降息和ＱＥ，現階段政策暫時無效並不代表未來會沒用，聯準會該做的事還是得要做，外加提供市場貼現窗口與回購隔夜拆款資金，未來還可能有來自財政部的振興政策來扭轉市場的趨勢。
放眼聯準會從二○○四年以來的貨幣政策動作，已經出現兩輪的升息和降息循環，利率回到○～○．二五％。放眼聯準會在二○○八年九月間發生的信貸危機並引發後來的全球股市崩盤的金融海嘯，當年一輪降息首度把利率降到和現在一樣的零利率水準，這段期間聯準會共出現三次在非ＦＯＭＣ貨幣政策會議期間的降息，當年聯準會也曾經和全球大型央行聯手降息。當聯準會把利率降到零利率後經過約三個月的時間，美股才在二○○九年三月觸底反彈。
無獨有偶地，當年金融海嘯發生後聯準會的降息動作（包含在非例行性會議期間降息）都引來當時美股和全球股市的跌勢。當時金融市場一度擔心資本主義會不會崩潰，市場在擠金融泡沫期間股市跌幅都非常大。這個現象來和聯準會三月間無預警地兩次降息，以及降息後金融市場的反應非常相似。這回美股和國際股市何時觸底反彈，要看歐美各國的疫情何時出現高峰翻轉，以及治療新冠肺炎的有效藥物何時出現。（全文未完）
----------------------------------------------------------------------

[31] 劉大年／疫情使外銷受阻　須避免農產品價格崩盤

● 劉大年／中華經濟研究院區域發展研究中心主任
新冠肺炎目前已蔓延全球165國，確診人數突破20萬，死亡超過萬人，已經成為本世紀全球最大的挑戰。
事實上新冠肺炎在中國大陸爆發初期，中國大陸沒有預警，資訊不夠透明；世界衞生組織（WHO)過於輕忽，全世界也掉以輕心，沒有做預先的防範，導致疫情蔓延到美國及歐洲。
2020疫情衝擊　堪比1930年代經濟大恐慌
此次新冠肺炎疫情產生供給、需求和金融三方向衝擊，對經濟影響是多層面的；更嚴重的是，由於恐慌加上對疫情的不確定性，造成市場信心瓦解，對於全球經濟更是雪上加霜。
美國財政部長最近表示，

----------------------------------------------------------------------

[39] 富士達保經董事長廖學茂「實務教學獲師生肯定」　晉升朝陽科大講座教授

▲富士達保險經紀人董事長廖學茂。（圖／富士達保經提供）
記者楊絡懸／台北報導
富士達保險經紀人董事長廖學茂通過朝陽科技大學校方審核，肯定其專業能力與教學品質，晉級升等管理學院「學門講座教授」。廖學茂說，將繼續傳授財務金融、人力資源管理和行銷等結合實務的學術知識，幫助莘莘學子求學期間奠定專業基礎，逐步了解產業趨勢，也期盼學生們畢業後，其所學也能與業界現況接軌。
廖學茂踏入保險業30多年，從基層業務員做起，培養保險銷售技巧，爾後一路表現優異獲得讚賞，先後於數家大型保險公司擔任過執行副總經理、總經理等高階主管職，期間也不斷精進自身企業經營管理能力。
2007年，廖學茂看見保險業產銷分離的趨勢，毅然成立富士達保險經紀人公司，在其嚴謹領導下，富士達保經目前更擠身台灣前十大保經公司，旗下多達2500多名同仁。
擁有豐富且完整的行銷經驗和企業管理實務，廖學茂也投身教育，曾擔任東南科大和崇右科大助理教授，以及政大商學院企業導師，傳授自身經驗協助產學合作培育。
2010年起，朝陽科大希望借重專業及豐富的業界人脈和社會聲望，正式邀請廖學茂於「行銷與流通管理系」任教。十多年的教學經驗，孕育不少優秀學子，廖學茂也獲得許多寶貴回饋，且應用至公司經營上，讓專案制度更加友善新鮮人並提供完善教育訓練，充分展現理論與實務的完美融合。
▲廖學茂認為，無論何種身分，「用心傾聽」的心態最為重要。（圖／富士達保經提供）
從「廖董事長」的身分轉換到「廖教授」，廖學茂認為，「真心傾聽」的心態都不變，領導公司需要認真傾聽同仁的需求與反應，才能真正解決問題幫助公司茁壯成長；教書更是如此，除了傳授重要知識，也必須了解同學們真實想法，適時調整教學方式與內容，不照本宣科才能讓學生吸收和成長。
廖學茂每周往返富士達總公司與朝陽科大，北中兩地上課，舟車勞頓雖然辛苦，卻樂此不疲，他相信將自己淵博的實務經驗傳承下去，為人才培育盡一份心力，也是回饋社會的一種最好方式。
為不斷提升自身專業能力，廖學茂也秉持著「活到老，學到老」精神，先後完成政治大學和北京大學碩士學位，目前也在攻讀台灣大學財務金融研究所。
於「企業