# YAHOO電影爬蟲練習
## 這個作業主要是練習爬取YAHOO電影的資訊，主要會用到基本的GET method，以及解析伺服器回傳的html，從中擷取我們想要的資料。

### 這個範例示範如何爬取上映中的電影資訊。先訪問YAHOO電影首頁：https://movies.yahoo.com.tw ，點選「上映中」的分頁，先確認上映中的電影總共有幾筆，然後逐頁爬取。

In [1]:
import requests
import re
from bs4 import BeautifulSoup

In [2]:
# 先觀察一下目前上映中的電影數量
url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
resp = requests.get(url)
resp.encoding = 'utf-8'

soup = BeautifulSoup(resp.text, 'lxml')
html = soup.find("div", attrs={'class':'release_box'})  # 尋找正在上映中的全部電影筆數，其所在的tag
print("正在上映中總共: ", html.p.string)

正在上映中總共:  共89筆，目前顯示1~10筆


### 爬取所有上映中的電影資料：電影名稱、期待度、滿意度、簡介等等。

In [14]:
# 接下來要爬取每一頁的電影介紹
# 先點選網頁最底部的下一頁，觀察其網址變化。然後我們把頁數當作變數傳入，用迴圈爬取。
max_page = 5
for page_number in range(1, max_page+1, 1):
    url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
    payload = {'page':str(page_number)}
    resp = requests.get(url, params=payload)
    resp.encoding = 'utf-8'
    soup = BeautifulSoup(resp.text, 'lxml')

    # 把電影介紹擷取出來
    movie_list = soup.find("ul", attrs={"class":"area_time _c jq_area_time"}).find_all("li")
    for p in movie_list:
        print("----------------------------------------------------------------------")
        # 電影名稱
        movie_name = p.find("ul", attrs={"class":"area_time _c jq_area_time"})
        print("電影名稱：", movie_name.a.string)
        
        # 定位電影評價資訊欄位
        level_box = movie_name.find("dl", attrs={"class":"levelbox"})
        
        # 期待度
        expectation = level_box.find("div", attrs={"class":"leveltext"})
        print("期待度：", expectation.span.string)
        
        # 滿意度
        satisfaction = level_box.dd.find("div", attrs={"class":"leveltext"})
        print("滿意度：", satisfaction.span["data-num"])  # 滿意度可以從"data-num"這個屬性擷取
        
        # 簡介
        movie_info = p.find("div", attrs={"class":"release_text"})
        print(movie_info.span.string)


術大師達利（Salvador Dalí），創作出前衛非凡的超現實短片《安達魯之犬》（Un Chien Andalou）。片中的「剃刀割眼」躍上影史經典畫面，一戰成名。
1930年，布紐爾再度和達利聯手，創作出《黃金年代》（L’Age d’Or）。狂野如夢的手法，一舉敲開文明社會的荒誕與虛假。布紐爾因此被米高梅發掘，遠赴好萊塢發展。然而堅持創作自由的他，很快就選擇毀約飛回巴黎，準備拍攝他人生中、也是影史上，最獨一無二的紀錄片：《無糧之地》（Las Hurdes）。
 
顛覆心靈意識的影像語言
1933年，《無糧之地》在西班牙試映後隨即被政府禁演，甚至指示各國的大使館不准讓這部片在國外上映。直到1937年西班牙內戰期間，這部紀錄片才在法國上映，但很快又被禁演。片中有不少爭議鏡頭，比如：活扯雞頭、開槍逼山羊墜崖、讓驢子遭蜂群叮咬。為了將死亡引導到鏡頭面前，布紐爾押上靈魂，冷血操控著現實。然而就是這複雜難解的面向，讓我們更有機會直面人性的盲點。
 
導演薩爾瓦多．西莫（Salvador Simó）表示：「我們想告訴觀眾的訊息是，這些事是真的發生過，並不是我們發明的。我希望人們可以思考，我們都很擔心動物，但或許我們也該更擔心正發生在其他人類身上的事情。」
 
                
----------------------------------------------------------------------
電影名稱： 
                  賽道狂人
期待度： 80%
滿意度： 4.3

                  ★集結影壇夢幻卡司！麥特戴蒙聯手克里斯汀貝爾 重現賽車史經典戰役
★年度熱血鉅作《賽道狂人》爛番茄滿分開盤 多倫多國際影展好評熱推
★《羅根》才華大導演詹姆士曼格擔崗 媒體盛譽將橫掃獎季
★改編自車壇最傳奇熱血的真實事蹟 福特汽車對抗賽車界霸主法拉利
 
曾獲奧斯卡殊榮的金獎得主麥特戴蒙和金球獎影帝克里斯汀貝爾即將共同出演《賽道狂人》，電影根據真實事件改編，劇情描述來自美國的汽車設計師卡洛謝爾比（麥特戴蒙 飾演）和無所畏懼的英國賽車手肯邁爾斯（克里斯汀貝爾 飾演），兩人聯手對抗企業干預、打破物理定律，同時面對他們各自的心魔，最後為福特汽車打造出一輛革命性新款賽車，更在1966年於法國舉辦的利曼24小時耐力賽中，一舉擊