# YAHOO電影爬蟲練習
## 這個作業主要是練習爬取YAHOO電影的資訊，主要會用到基本的GET method，以及解析伺服器回傳的html，從中擷取我們想要的資料。

### 這個範例示範如何爬取上映中的電影資訊。先訪問YAHOO電影首頁：https://movies.yahoo.com.tw ，點選「上映中」的分頁，先確認上映中的電影總共有幾筆，然後逐頁爬取。

In [2]:
import requests
import re
from bs4 import BeautifulSoup

In [5]:
# 先觀察一下目前上映中的電影數量
url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
resp = requests.get(url)
resp.encoding = 'utf-8'

soup = BeautifulSoup(resp.text, 'lxml')
html = soup.find("div", attrs={'class':'release_box'})  # 尋找正在上映中的全部電影筆數，其所在的tag
print("正在上映中總共: ", html.p.string)

正在上映中總共:  共73筆，目前顯示1~10筆


### 爬取所有上映中的電影資料：電影名稱、期待度、滿意度、簡介等等。

In [20]:
# 接下來要爬取每一頁的電影介紹
# 先點選網頁最底部的下一頁，觀察其網址變化。然後我們把頁數當作變數傳入，用迴圈爬取。
max_page = 5
for page_number in range(1, max_page+1, 1):
    url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
    payload = {'page':str(page_number)}
    resp = requests.get(url, params=payload)
    resp.encoding = 'utf-8'
    soup = BeautifulSoup(resp.text, 'lxml')

    # 把電影介紹擷取出來
    movie_list = soup.find("ul", attrs={"class":"release_list"}).find_all("li")
    for p in movie_list:
        print("----------------------------------------------------------------------")
        # 電影名稱
        movie_name = p.find("div", attrs={"class":"release_movie_name"})
        print("電影名稱：", movie_name.a.string)
        
        # 定位電影評價資訊欄位
        level_box = movie_name.find("dl", attrs={"class":"levelbox"})
        #print(level_box)
        # 期待度
        expectation = level_box.find("div", attrs={"class":"leveltext"})
        print("期待度：", expectation.span.string)
        
        # 滿意度
        satisfaction = level_box.find_all("div", attrs={"class":"leveltext"})
        print("滿意度：", satisfaction[1].span["data-num"])  # 滿意度可以從"data-num"這個屬性擷取
        
        # 簡介
        movie_info = p.find("div", attrs={"class":"release_text"})
        print(movie_info.span.string)


----------------------------------------------------------------------
電影名稱： 
                  鋼鐵勳章
期待度： 97%
滿意度： 4.3

                  ★ 真人真事震撼改編，見證史上最偉大的鋼鐵英雄！
★ 耗時20年籌備製作，一個關於生存、榮譽、英勇的感人故事！
★榮譽勳章背後不為人知的英勇祕辛，口碑感動全美，年度完美傑作！
★震撼還原空軍搜救部隊場面，獲得美國國防部、美國空軍及陸軍的大力支持！
★金獎卡司齊聚，山繆傑克森、賽巴斯汀史坦、威廉赫特等「漫威大將」同台飆戲！
★ 好評口碑爭相傳頌，爛番茄觀眾96%高度評價！
★《芝加哥太陽報》盛讚：「動人又難忘的故事，2020年第一部必看電影！」
 
威廉皮森伯格（傑瑞米爾文飾演）是空軍空降救援醫療兵，在越戰中解救超過六十位弟兄，最後甚至放棄搭直升機離開戰場的機會，選擇繼續救援被留下的士兵們，最後被敵軍子彈射殺，為同袍犧牲自己寶貴的生命。他的英雄事蹟，讓他被授與士兵所能得到的最高榮譽──國會榮譽勳章，以此獎勵他所做出超越義務外的英勇作為。不過在勳章頒授之前，卻因為某些政治因素，皮森伯格應得的獎勵慘遭撤回。五角大廈調查員史考特霍夫曼（賽巴斯汀史坦飾演）被分配調查這件不公事件的原因，並在調查當中，發現腐敗的政治人物，以及他們拒絕授予勳章的個人及政治原因。這也讓史考特親自拜訪當年戰役中的生還者們，大家團結一心，開始為皮森伯格爭取他應得的榮譽…。
 
【關於電影】
 
《鋼鐵勳章》由拍攝過《幻影計畫》（Phantom）、被稱作「演員的導演」的陶德羅賓森（Todd Robinson）擔任編導，並找來《復仇者聯盟》山繆傑克森（Samuel L. Jackson）、《美國隊長2：酷寒戰士》（Captain America: The Winter Soldier）賽巴斯汀史坦（Sebastian Stan）、《美國隊長3》（Captain America: Civil War）威廉赫特（William Hurt）等漫威電影大將領銜主演。全片根據真實事件改編，描述一名與華盛頓政治機構對抗的五角大廈調查員，試圖與一群曾參與1966年「阿比林行動」的越戰老兵們，說服國會頒發榮譽勳章給一位英勇的空軍醫療兵「威廉皮森伯格」，

----------------------------------------------------------------------
電影名稱： 
                  狂飆一夢
期待度： 86%
滿意度： 4.0

                  ★2019 南方影展·人權關懷獎
★2019 香港國際紀錄片節·華語紀錄片競賽入圍
 
七〇年代，民主的浪潮奮力湧起，海外黑名單陸續闖關回台，都是對基層黨工意義重大的事件。1989年鄭南榕為爭取言論自由而自焚，在他的喪禮上，黨外運動草根工作者詹益樺，也跟隨其腳步自焚身亡。
 
對許多狂熱投入反對運動的基層人士來說，這層層事件的堆疊，讓他們的反抗意志更趨強烈。他們犧牲了工作、家庭與生活，只為一股腦地追尋所謂的理想。如同電影中主要紀錄的兩位主角：外省第二代女作家曾心儀、人稱「康仔」的康惟壤。時至今日，步入中老年階段，以當下的日常瑣事與生活形貌，對照著台灣或他們，在八〇至九〇，那些政治碰撞、經濟榮景而風起雲湧的「狂飆年代」，都在影像和影像的隙縫之間，流瀉出蒼涼的情懷亦或釋然的情感。
 
台灣近四十年來民主化的歷程，不只有舞台上的菁英，更多時候是由基層運動者的熱血而撐起來的。在《狂飆一夢》中，希望透過影像的敘事重整，試圖理解反抗者們的初衷，以及他們宛如宿命般被束縛的自身狀態。「一夢」暗喻世事無常變化，所有的成敗枯榮、執著心念，到頭來都像夢一場。雖說勇敢追夢，但也不得不承認，夢在多數時候，既難實現，又無從把握。
 
                
----------------------------------------------------------------------
電影名稱： 
                  大地蜜語
期待度： 97%
滿意度： 4.3

                  ★ 入圍第92屆奧斯卡金像獎 最佳紀錄片、最佳國際電影 
★ 入圍 2020 女性電影記者聯盟獎 最佳國際電影
★ 入圍 2020 獨立精神獎 最佳紀錄片
★ 入圍 2020 美國導演公會獎(DGA)
★ 入圍 2020 美國製片公會獎(PGA)
★ 入圍 2019 歐洲電影獎 最佳紀錄片
★ 2020 國家影評人協會獎最佳紀錄片
★ 2019 評論家選擇獎最佳首部紀錄長片
★ 2019 

----------------------------------------------------------------------
電影名稱： 
                  雨天．紐約
期待度： 98%
滿意度： 4.3

                  蓋茲比（提摩西夏勒梅飾）的女友艾希莉（艾兒芬妮飾）因學校作業爭取到親赴曼哈頓訪談知名大導演羅蘭波拉德 （李佛薛伯飾）的機會，於是蓋茲比計畫了一場充滿紐約復古風情的浪漫約會，但艾希莉卻被導演約去看電影，接 著又遇見了金牌編劇泰德戴杜夫（裘德洛飾）與大明星法蘭西斯柯維嘉（狄亞哥盧納），導致蓋茲比的約會計畫泡 湯。當艾希莉在三個才華洋溢的男人之間打轉時，蓋茲比和前女友的妹妹千兒（賽琳娜戈梅茲飾）意外一「吻」也 打亂了他的心…
                
----------------------------------------------------------------------
電影名稱： 
                  逃出夢幻島
期待度： 93%
滿意度： 3.0

                  ★最美惡夢來襲！2019《逃出夢幻島》詭譎扭曲更勝《逃出絕命鎮》
★幻想成真卻是夢靨！？《逃出夢幻島》血腥變態登場
★《逃出絕命鎮》《我們》製作群挑戰人性極限 打造恐怖驚悚新作
 
由「恐怖界皮克斯」之稱的Blumhouse製作公司所全心傾力打造的《逃出夢幻島》；一位自稱是神祕管家的路克先生（麥可潘納 飾），在一座奢華卻偏遠的小島上，招待了五位素未謀面的幸運客人，並承諾他們：「在夢幻島，你所有的幻想都可能成真。」但當這些夢境開始一個個扭曲成令人害怕且致命的夢魘，這些賓客必須要靠著自己的力量，解開島嶼中的魔幻力量，試圖活著逃離這個無人知曉的神祕之地……
                
----------------------------------------------------------------------
電影名稱： 
                  我的寶貝男孩
期待度： 50%
滿意度： 2.8

                  以《變形金剛》走紅全球的好萊塢男星西亞李畢福，攜手以色列新銳女導艾瑪哈瑞爾，將自身童年經歷編寫成劇本搬上銀