# YAHOO電影爬蟲練習
## 這個作業主要是練習爬取YAHOO電影的資訊，主要會用到基本的GET method，以及解析伺服器回傳的html，從中擷取我們想要的資料。

### 這個範例示範如何爬取上映中的電影資訊。先訪問YAHOO電影首頁：https://movies.yahoo.com.tw ，點選「上映中」的分頁，先確認上映中的電影總共有幾筆，然後逐頁爬取。

In [22]:
import requests
import re
from bs4 import BeautifulSoup

In [23]:
# 先觀察一下目前上映中的電影數量
url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
resp = requests.get(url)
resp.encoding = 'utf-8'

soup = BeautifulSoup(resp.text, 'html5lib')
# html = soup.find("div", attrs={'class':'release_box'})  # 尋找正在上映中的全部電影筆數，其所在的tag
# print("正在上映中總共: ", html.p.string)
html = soup.find("div", class_='release_box')  # 尋找正在上映中的全部電影筆數，其所在的tag
print("正在上映中總共: ", html.find('p').text)

正在上映中總共:  共84筆，目前顯示1~10筆


### 爬取所有上映中的電影資料：電影名稱、期待度、滿意度、簡介等等。

In [27]:
# 接下來要爬取每一頁的電影介紹
# 先點選網頁最底部的下一頁，觀察其網址變化。然後我們把頁數當作變數傳入，用迴圈爬取。
max_page = 5
for page_number in range(1, max_page+1):
    url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
    payload = {'page': str(page_number)}
    resp = requests.get(url, params=payload)
    resp.encoding = 'utf-8'
    soup = BeautifulSoup(resp.text, 'html5lib')
    
#     print(soup.prettify())
    
    # 把電影介紹擷取出來
    movie_list = soup.find("ul", attrs={"class":"release_list"}).find_all("li")
    for p in movie_list:
        print("----------------------------------------------------------------------")
#         print(p)
        
        # 電影名稱
        movie_name = p.find("div", attrs={"class":"release_movie_name"})
        print("電影名稱：", movie_name.a.string.strip())
        
        # 定位電影評價資訊欄位
        level_box = movie_name.find("dl", attrs={"class":"levelbox"})
        
        # 期待度
        expectation = level_box.find("div", attrs={"class":"leveltext"})
        print("期待度：", expectation.span.string.strip())
        # 滿意度
        satisfaction = level_box.find("span", attrs={"class":"count"})
        print("滿意度：", satisfaction['data-num'].strip())  # 滿意度可以從"data-num"這個屬性擷取
        # 簡介
        movie_info = p.find("div", attrs={"class":"release_text"})
        print(movie_info.span.string.strip())


----------------------------------------------------------------------
電影名稱： 大說謊家
期待度： 91%
滿意度： 3.6
故事主角是一個不曾相信過任何人的職業騙徒：羅伊寇特尼(伊恩麥克連 飾)，他一生中無所不騙，心狠手辣毫不留情，而且不留下任何痕跡。某日他在網路上認識一名有錢的寡婦：貝蒂麥雷許(海倫米蘭 飾)。兩人見面後相談甚歡，毫無疑問地，貝蒂很快就被羅伊幽默風趣的談吐與溫柔貼心的態度所吸引，但出乎羅伊意料的是貝蒂竟是他這一生中見過最聰明、優雅、風趣而且有品味的女性；貝蒂對羅伊敞開心胸毫不隱瞞，大方地打開大門邀請他進入她家與她的人生中，此時的羅伊開始驚訝地發現自己竟然是真心喜歡貝蒂，他一生中未曾有過如此心動的感覺，讓原本按照計畫應該發生的騙局，竟在最後的轉瞬間峰迴路轉，面對這個一生一次能讓自己動心的女人，羅伊將會做出什麼樣的選擇？
----------------------------------------------------------------------
電影名稱： 熱氣球飛行家
期待度： 85%
滿意度： 4.1
★ 金獎影帝艾迪瑞德曼暫時脫下魔法袍回歸真實演技
★《愛的萬物論》霍金夫婦檔再次聯手演繹真實人物傳記
★ 取材自真人真事，體驗前所未有的高空熱氣球冒險
★ BBC熱門影集《戰爭與和平》導演 X《奇蹟男孩》編劇 帶來全新冒險故事
★ 2019 多倫多國際影展
★ 2019 倫敦影展
 
真人實事改編，19世紀科學家詹姆斯葛萊舍（艾迪瑞德曼 飾）與熱氣球駕駛員艾蜜莉雷恩（費莉絲蒂瓊斯 飾）挑戰「飛」出人類極限高度。為了實驗熱氣球可飛行高度，科學家詹姆斯帶著飛行員艾蜜莉一同實驗，而在飛行途中發生一連串的狀況與事件，隨著高度越高，空氣越來越稀薄，兩人該如何面對接下來的挑戰？
----------------------------------------------------------------------
電影名稱： 黑色聖誕節
期待度： 55%
滿意度： 1.9
改編自經典恐怖片的《黑色聖誕節》是一部符合佳節氣氛的全新恐怖片，故事描述一名校園連環殺手，即將面對一群姊姊妹妹站起來的絕命大反攻。
 
聖誕佳節即將到來，霍桑大學也開始放寒假，但是正當萊莉史東（《納

----------------------------------------------------------------------
電影名稱： 人間失格：太宰治與他的3個女人
期待度： 89%
滿意度： 4.0
★ 《惡女花魁》《惡女羅曼死》蜷川實花最新異色之作
★ 演技男神小栗旬演繹天才作家太宰治其瘋狂不羈的一生
★ 人氣男星 藤原龍也 × 高良健吾 × 成田凌 × 千葉雄大 × 瀨戶康史 華麗共演
★ 《幸福湯屋》宮澤理惠、《惡女羅曼死》澤尻英龍華、《飛翔吧！埼玉》二階堂富美 詮釋太宰治生命中最重要的三個女人
★ 揭開太宰治經典作品《人間失格》誕生的祕辛
 
一段禁忌之戀，最危險的真實故事。
 
太宰治（小栗旬 飾）與懷孕的妻子美知子（宮澤理惠 飾）育有兩名孩子，但仍和立志成為作家的靜子（澤尻英龍華 飾）、寡婦富榮（二階堂富美 飾）發展出不倫關係。太宰治的女性關係混亂、多次自殺未遂，過著十分放蕩墮落的生活，但他的妻子不顧遭丈夫背叛，仍不離不棄地陪在太宰治身邊，鼓勵他繼續創作。而這也驅使太宰治開始執筆他的代表作《人間失格》……
----------------------------------------------------------------------
電影名稱： 絕世情歌
期待度： 44%
滿意度： 2.7
電影《絕世情歌》描述懷抱歌手夢卻總是只寫出「半首歌」的文凱（王柏傑飾演），帶著因病過世姊姊（楊千霈飾演）的女兒（莊晴晴飾演）展開尋找父親（李李仁飾演）的旅途，路上遇到同樣正在旅行的菲（李毓芬飾演），三人在旅途中彼此相互激勵，但他們是否都能在旅途中找到各自的夢想呢？電影取景走訪台灣東部眾多著名景點，以及優美歌曲的串聯，讓眼睛及耳朵一同經歷的一場美妙的旅程。
----------------------------------------------------------------------
電影名稱： 我的靈魂是愛做的
期待度： 79%
滿意度： 2.8
Kevin，二十六歲，公民老師，同志。對學生及同事溫和有禮，下班之餘參與同志運動，在茫茫人海中尋找愛情。因緣際會下，Kevin 愛上一名有愛滋的已婚男子。母親不諒解這段感情，感染的恐懼與正妻的脅迫夾擊，校園更開始傳出流言蜚語。眾說紛紜、眾敵環伺，原來當全世界都反對時，愛一個人是這

----------------------------------------------------------------------
電影名稱： 山田孝之的痛苦與榮耀
期待度： 67%
滿意度： 3.4
「一輩子只做同樣的事太無聊了…」
 
山田孝之，35歲，是一名演員、電影製作人也是樂團主唱，開了一間公司，也當作家出書，而在這多采多姿生活的背後，是用很多的時間、很大的堅持及很多的努力所換來的。他出道不久，便以電視劇《水男孩》、《在世界中心呼喊愛》獲得人氣，首度主演的電影《電車男》也紅遍全亞洲。看似一切順遂的他，卻被媒體爆出私生子醜聞，讓他遭受許多抨擊，人氣不僅下滑，也因此得了憂鬱症。
 
而山田孝之蛻變的分水嶺，就在30歲生日那一天。
 
「如果你拼命努力之後還有人來找碴，那只是他們在嫉妒。」
 
叔叔的一句話，成為他人生的信念，不管做什麼總是全力以赴，也不斷挑戰自己的極限，站在三十而立的人生分水嶺上，他努力不懈地「享受人生」，影片從他30歲時開始，花費五年共2045天的時間跟拍山田孝之，前後歷經許多大家熟知的作品，包含電視劇《黑金丑島君》系列、《勇者義彥》系列及《AV帝王》等拍攝花絮、為了求好心切錄歌到半夜的拼勁揭秘，以及他從演員轉作製作人所面對的困境與低潮，透過影像紀錄，觀眾得以近距離感受山田孝之的獨特魅力，一窺看似難以捉摸的他，最真實而坦率的一面。
----------------------------------------------------------------------
電影名稱： 魔鬼終結者：黑暗宿命
期待度： 95%
滿意度： 4.1
★傳奇大導詹姆斯卡麥隆親任監製編劇 傾力打造影史科幻經典正宗續集
★重磅動作巨星阿諾史瓦辛格 攜手女戰神琳達漢彌頓 震撼重回大銀幕
★欽點票房冠軍強片《惡棍英雄：死侍》導演提姆米勒接班 再創不朽神作
★上天下海對決！直升機、飛車玩命追逐 擬真場景打造真槍實彈動作場面
 
影史科幻經典正宗續集，兩大重磅狠角色回來了！琳達漢彌頓（飾演 莎拉康納） 與阿諾史瓦辛格 （飾演 T-800）再度回歸演出兩人從影生涯最具代表性的角色，由《惡棍英雄：死侍》導演提姆米勒執導、影史票房冠軍大導詹姆斯卡麥隆及大衛艾里森監製。故事背景延續《魔鬼終結者2：審判日》之後，除了阿諾史瓦辛格、琳達漢彌頓兩大巨頭回歸，《魔鬼終結者