# YAHOO電影爬蟲練習
## 這個作業主要是練習爬取YAHOO電影的資訊，主要會用到基本的GET method，以及解析伺服器回傳的html，從中擷取我們想要的資料。

### 這個範例示範如何爬取上映中的電影資訊。先訪問YAHOO電影首頁：https://movies.yahoo.com.tw ，點選「上映中」的分頁，先確認上映中的電影總共有幾筆，然後逐頁爬取。

In [1]:
import requests
import re
from bs4 import BeautifulSoup

In [2]:
# 先觀察一下目前上映中的電影數量
url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
resp = requests.get(url)
resp.encoding = 'utf-8'

soup = BeautifulSoup(resp.text, 'lxml')
html = soup.find("div", attrs={'class':'release_box'})  # 尋找正在上映中的全部電影筆數，其所在的tag
print("正在上映中總共: ", html.p.string)

正在上映中總共:  共91筆，目前顯示1~10筆


### 爬取所有上映中的電影資料：電影名稱、期待度、滿意度、簡介等等。

In [10]:
# 接下來要爬取每一頁的電影介紹
# 先點選網頁最底部的下一頁，觀察其網址變化。然後我們把頁數當作變數傳入，用迴圈爬取。
max_page = 10
for page_number in range(1, max_page+1, 1):
    print("Page:", page_number)
    url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
    payload = {'page':str(page_number)}
    resp = requests.get(url, params=payload)
    resp.encoding = 'utf-8'
    soup = BeautifulSoup(resp.text, 'lxml')

    # 把電影介紹擷取出來
    movie_list = soup.find("ul", attrs={"class":"release_list"}).find_all("li")
    for p in movie_list:
        print("----------------------------------------------------------------------")
        # 電影名稱
        movie_name = p.find("div", attrs={"class":"release_movie_name"})
        print("電影名稱：", movie_name.a.string)
        
        # 定位電影評價資訊欄位
        level_box = movie_name.find("dl", attrs={"class":"levelbox"})
        
        # 期待度
        expectation = level_box.find_all("div", attrs={"class":"leveltext"})[0]
        print("期待度：", expectation.span.string)
        
        # 滿意度
        satisfaction = level_box.find_all("div", attrs={"class":"leveltext"})[1]
        print("滿意度：", satisfaction.span["data-num"])  # 滿意度可以從"data-num"這個屬性擷取
        
        # 簡介
        movie_info = p.find("div", attrs={"class":"release_text"})
        print(movie_info.span.string)


Page: 1
----------------------------------------------------------------------
電影名稱： 
                  霹靂嬌娃
期待度： 69%
滿意度： 3.2

                  由天才女導伊莉莎白班克斯所帶領的全新霹靂嬌娃，包含克莉絲汀史都華、娜歐蜜史考特及艾拉巴林斯卡，替傳說中神龍見首不見尾的「查理」工作。這些天使們一直以來，都為高端私人客戶提供最隱密的頂級安全檢查和調查工作。而現在，這個神秘的「湯森組織」早已發展成一個勢力銳不可檔的跨國集團—在擁有全球最聰明、勇敢，且訓練最系統最堅強的性感女力之下，這些遍佈全球的「波斯利」依然帶著絕美嬌娃們穿梭於世界各個角落。而當一位年輕的系統工程師吹響這個看似普通卻藏有機關的危險哨子時，這些各具獨特魅力且能文善武的的性感嬌娃們便會即刻採取行動。為了保護我們所有的人，她們願意將自己的生命推上最前線……
                
----------------------------------------------------------------------
電影名稱： 
                  潛艦追緝
期待度： 91%
滿意度： 4.1

                  ★直擊潛艦核心 史詩級戰艦對戰法國陸、海、空全面啟動
★《逆轉人生》法國影帝 歐馬希 聯手
★《忐忑》弗朗索瓦西維爾 親赴潛艦阻止世界大戰
★《金牌特務：機密對決》《ID4星際重生》視效團隊 精心打造 年度最不容錯過的戰爭巨獻
 
當你聽見狼嚎，就表示撒旦離你不遠了…
被法國海軍封為「地表最強千里耳」的尚特雷，以超敏銳的聽覺讓海軍弟兄們免於無數次的潛艦危機。在敘利亞海域的任務中，出現他此生從未聽過也無法分辨的聲軌！隨著聲音漸漸逼近，竟讓潛艦暴露了行蹤，引爆了深海危機！尚特雷相信這次的意外絕非偶然，決定調查出這聲音來源。與此同時，法國與俄羅斯的國際情勢逐漸上漲，一觸即發！海軍上將任命德奧西（歐馬希 飾）接管泰坦號、格尚（赫達卡特伯 飾）擔任彈道導彈核潛艦艦長進行總理下令的武力恫嚇任務。就在此刻竟有一顆核彈朝向法國而來，即將成為引爆第三次世界大戰的導火線。究竟這枚核彈來自於哪裡？是俄羅斯還是另有其人？
 
      

----------------------------------------------------------------------
電影名稱： 
                  STAR WARS : 天行者的崛起
期待度： 90%
滿意度： 3.7

                  ★星戰傳奇系列磅礡終曲、絕地武士與最強西斯的終極對決
★導演J.J.亞伯拉罕證實，本次將會有粉絲從未見過得新型原力使用方式
★將是觀眾最後一次在大銀幕上看到飾演莉亞公主的凱莉費雪
★金獎作曲家約翰威廉斯聲明這將是星際大戰作曲的封筆之作
★打造過《復仇者聯盟 : 終局之戰》的頂尖特效團隊光影魔幻工業(ILM)巔峰之作，將帶給全球觀眾前所未見的特效視覺饗宴
 
絕地武士的最後希望--芮(身世未明) 與繼承了黑武士血脈、邪惡第一軍團的最高領袖--凱羅忍，雙方受到上個世代戰爭英雄影響所產生的成長與矛盾，將在《STAR WARS : 天行者的崛起》中，用原力劃下光明與黑暗交織的最完美句點。
 
過去的傳奇角色: 路克天行者、莉亞、藍多卡瑞辛皆全數回歸本作。此外，過去星際大戰電影系列的終極大反派 -- 西斯大帝(白卜庭)並未消失，將以最具威脅的大魔王之姿現身向抵抗勢力展開一場前所未見的終極復仇。
 
1977年開始陸續上映的八部星戰系列正傳電影，故事發生在充滿想像的銀河系，講述一個探討善與惡、光明與黑暗、並環繞在包含知名黑武士在內的天行者家族傳奇故事。
 
《STAR WARS : 天行者的崛起》是星際大戰正傳電影系列的第九部作品，同時也是精心策劃超過40年的傳奇完結篇。
                
----------------------------------------------------------------------
電影名稱： 
                  大說謊家
期待度： 91%
滿意度： 3.6

                  故事主角是一個不曾相信過任何人的職業騙徒：羅伊寇特尼(伊恩麥克連 飾)，他一生中無所不騙，心狠手辣毫不留情，而且不留下任何痕跡。某日他在網路上認識一名有錢的寡婦：貝蒂麥雷許(海倫米蘭 飾)。兩人見面後相談甚歡，毫無疑問地，貝蒂很快就被羅伊幽默風趣的談吐與溫柔貼心的態度所吸引，但出乎羅伊意料的是貝蒂竟是他這一

----------------------------------------------------------------------
電影名稱： 
                  冰雪奇緣2
期待度： 92%
滿意度： 4.2

                  席捲全球票房的《冰雪奇緣》又回來了！電影故事設定在前作的3年後，在艾莎聽到來自北方神秘的呼喚聲後，艾倫戴爾王國因為開始受到不明強風吹襲而變得不再安全。為了拯救王國、拯救家鄉，艾莎與妹妹安娜、阿克、雪寶和小斯，再度踏上全新的冒險之旅，而這次的旅程，也將揭露艾莎冰雪魔力的起源。在神秘強風的背後隱藏了甚麼秘密？艾莎與安娜又將會遇到甚麼樣的挑戰和困難？艾倫戴爾王國的未來掌握在他們手中！
                
----------------------------------------------------------------------
電影名稱： 
                  新聞記者
期待度： 67%
滿意度： 3.5

                  在政治亂象及假新聞充斥的時代
我們相信的，難道就是「真相」嗎？
 
日韓混血的吉岡（沈恩敬 飾）是一名東都報社的記者，從小在美國長大的她，直至母親逝世才隨父親搬回日本生活，她相信同是記者的父親是因為追查案件而「被自殺」了。一日，她收到了一封匿名傳真，內容是關於政府推動新設大學的機密資料，直覺告訴她事有蹊蹺。另一方面，任職於內閣情報調查室的年輕官員衫原（松坂桃李 飾），被上級要求針對政府官員的醜聞，夥同地下網軍進行抹黑及掩飾，心力交瘁之際，卻又不幸得知尊敬的前輩跳樓身亡，前輩經手的最後案件竟是吉岡日夜追查的新設大學。在兩個人的人生交會之時，將激盪出足以撼動社會的火花，然而他們究竟能否找尋到屬於自己「真相」呢？
 
本片改編自東京新聞望月衣塑子的同名暢銷小說，她也以社會部記者之姿，與「前文部科學省事務次官」前川喜平、「原紐約時報東京分局長」馬丁．法克勒、「新聞勞聯委員長」南彰，在片中的談論節目針對人民的媒體識讀、新聞界與政界的權力問題等面向，進行激辯，引領觀眾進入更深層的議題討論。
                
----------------------------------------------------

----------------------------------------------------------------------
電影名稱： 
                  108悍將
期待度： 91%
滿意度： 4.2

                  ★ 以寡敵眾 為生命而戰！
★ 澳紐聯軍歷史上最猛烈 最代表性的經典戰役躍上大銀幕
 
1966年8月18日下午，越南南部一處叫龍潭的橡膠園，在傾盆大雨中發生了一場為時三個半小時緊張萬分的戰役。哈利·史密斯少校和他的 108 名年輕澳大利亞和紐西蘭士兵組成的軍隊意外遭遇多達 2500 人的北越共軍，不得不以寡敵眾、倉促應戰。北越共軍則早做好了伏擊澳軍駐地的打算，因而準備充足。然而，紐澳軍隊由於彈藥耗盡,他們的傷亡越來越大，敵軍正聚集在一起準備最後的進攻……
                
----------------------------------------------------------------------
電影名稱： 
                  小丑
期待度： 98%
滿意度： 4.5

                  由《醉後大丈夫》導演陶德菲利浦斯擔任製片、編劇與導演；繼傑克尼克遜、希斯萊傑與傑瑞德勒托之後，瓦昆菲尼克斯成為在大銀幕上第四位接下「小丑」這個角色的演員，看他如何從一個失敗的喜劇演員，一步一步成為高譚市最邪惡、最頂尖的超級罪犯。
 
導演陶德菲利浦表示：「《小丑》是一部前所未見的獨立電影，有不一樣的原創故事，雖然故事背景一樣發生在高譚市，但是與大家過去所熟知的「小丑」不太一樣。」陶德菲利普斯與瓦昆菲尼克斯兩人聯手，深刻地探索了社會邊緣人亞瑟佛萊克的性格，瓦昆說：「這不只是一場寫實的角色研究，也將會是一部深入人性的警世預言。」
 
《小丑》的卡司除了瓦昆菲尼克斯外，還有勞勃狄尼洛、薩琪畢茲、法蘭西絲康諾、馬克馬龍、比爾坎普、格倫弗萊舍爾、希亞溫漢、不萊特考倫、道格拉哈吉與橋許派斯等。
                
----------------------------------------------------------------------
電影名稱： 
                  囧媽的極地任務
期待度

IndexError: list index out of range