# YAHOO電影爬蟲練習
## 這個作業主要是練習爬取YAHOO電影的資訊，主要會用到基本的GET method，以及解析伺服器回傳的html，從中擷取我們想要的資料。

### 這個範例示範如何爬取上映中的電影資訊。先訪問YAHOO電影首頁：https://movies.yahoo.com.tw ，點選「上映中」的分頁，先確認上映中的電影總共有幾筆，然後逐頁爬取。

In [1]:
import requests
import re
from bs4 import BeautifulSoup

In [2]:
# 先觀察一下目前上映中的電影數量
url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
resp = requests.get(url)
resp.encoding = 'utf-8'

soup = BeautifulSoup(resp.text, 'lxml')
html = soup.find("div", attrs={'class':'release_box'})  # 尋找正在上映中的全部電影筆數，其所在的tag
print("正在上映中總共: ", html.p.string)

正在上映中總共:  共85筆，目前顯示1~10筆


### 爬取所有上映中的電影資料：電影名稱、期待度、滿意度、簡介等等。

In [3]:
# 接下來要爬取每一頁的電影介紹
# 先點選網頁最底部的下一頁，觀察其網址變化。然後我們把頁數當作變數傳入，用迴圈爬取。
max_page = 5
for page_number in range(1, max_page+1, 1):
    url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
    payload = {'page':str(page_number)}
    resp = requests.get(url, params=payload)
    resp.encoding = 'utf-8'
    soup = BeautifulSoup(resp.text, 'lxml')

    # 把電影介紹擷取出來
    movie_list = soup.find("ul", attrs={"class":"release_list"}).find_all("li")
    for p in movie_list:
        print("----------------------------------------------------------------------")
        # 電影名稱
        movie_name = p.find("div", attrs={"class":"release_movie_name"})
        print("電影名稱：", movie_name.a.string)
        
        # 定位電影評價資訊欄位
        level_box = movie_name.find("dl", attrs={"class":"levelbox"})
        
        # 期待度
        expectation = level_box.find("div", attrs={"class":"leveltext"})
        print("期待度：", expectation.span.string)
        
        # 滿意度
        satisfaction = level_box.find_all("div", attrs={"class":"leveltext"})[-1]
        print("滿意度：", satisfaction.span["data-num"])  # 滿意度可以從"data-num"這個屬性擷取
        
        # 簡介
        movie_info = p.find("div", attrs={"class":"release_text"})
        print(movie_info.span.string)


----------------------------------------------------------------------
電影名稱： 
                  罪樂園
期待度： 59%
滿意度： 2.6

                  ★繼《怒》、《惡人》後，吉田修一生涯最高傑作〈犯罪作品集〉終於映像化
★《天氣之子》RADWIMPS成員野田洋次郎作詞作曲，《你的名字》上白石萌音演唱電影主題曲〈一縷〉
★口碑爆棚 強勢入選金馬國際影展「日本鏡像」單元
★入選2019釜山國際影展「亞洲之窗」單元
 
夏日午後，女童愛華在回家必經的Y字路上失蹤，從此下落不明，同行的玩伴小紡卻因為自己的倖存深感自責；十二年後，同一地點再次發生誘拐事件，當年的嫌疑犯豪士再次被視為兇手，憤怒村民失去理智地向他逼問；回鄉經營養蜂場的善次郎，熱心提出振興村落的方案，卻發現這些年來村民間的彼此猜忌，早已化為深不見底的惡意……。
 
我們與罪的距離有多遠？作品總帶有深層社會意識的瀨瀨敬久，繼《64：史上最兇惡綁架撕票事件》後，再度以懸疑罪案為引，向觀眾拋出尖銳叩問。改編自吉田修一暢銷名作〈犯罪小說集〉，集合綾野剛、杉咲花、佐藤浩市、柄本明、片岡禮子、村上虹郎等一流卡司，以冷靜凝練的影像，揭開潛藏在平凡社會秩序底下的壓抑與冷暴力，無以名狀的失落如何匯聚成毀滅的巨流，直刺核心的力道，深切入骨。
                
----------------------------------------------------------------------
電影名稱： 
                  艾瑪
期待度： 73%
滿意度： 3.9

                  改編自珍奧斯汀備受喜愛的喜劇，《艾瑪.》重新描繪出尋找真愛與幸福結局的故事。漂亮，聰穎，富有的艾瑪伍德豪斯（Emma Woodhouse）在這個無聊平庸的小鎮裡就像一隻靜不下來的女王蜂。 然而，在這充斥著反諷社會階層與青澀的成長故事裡，艾瑪在經歷過一連串亂點鴛鴦和誤判情勢後，發現真愛一直在身邊。
                
----------------------------------------------------------------------
電影名

----------------------------------------------------------------------
電影名稱： 
                  千日千夜
期待度： 78%
滿意度： 2.6

                  ★ 威尼斯影展 最佳導演銀獅獎
★ 歐洲電影獎 最佳視覺特效獎
★ 瑞典國寶級電影大師 最新極致鉅作
 
人間悲歡離合  就是道不盡的一千零一夜
幻夢女郎以神秘的口吻娓娓道來，替故事揭開序幕，因信仰而迷惑的牧師，扛著十字架被鞭打著；戰爭失去雙腳的士兵當起街頭藝人；孤單的返鄉女子無人迎接，落寞地佇立車站；一對夫婦漂浮空中，望著戰火綿延的城市。有人哭，有人笑，有人受傷，有人歡騰，人們總是不斷重複自己的問題，但沒人需要真正的回答。
 
瑞典國寶導演洛伊安德森（Roy Andersson）最新極致神作，依然以充滿詩意、神一般的眼光凝視著人間，電影當中面色蒼白的角色們就是凡塵縮影。只要人類存在，快樂傷感交織的浮世繪就會無限上演，永無止盡。所幸我們能透過這些殘酷的美麗，看清人性的可愛光輝。
 
【關於電影 】
 
在藝術表現上，深受20世紀初新即物主義畫派的影響，洛伊安德森的電影鏡頭總是像幅滿載訊息的畫，畫面中的每個元素都是焦點，都銳利地讓觀眾看得目不轉睛，期待在細節裡看到一點故事線索或人生哲理。「這就跟人生一樣，很多小事其實都舉足輕重，我想在我的電影作品展現這樣的感覺。」洛伊安德森這麼說著。
 
要達到這樣的細膩質感，製作上要從導演的腦袋開始下手。洛伊安德森在創作時習慣手繪電影氛圍圖，用來與製作團隊溝通腦中理想中的樣子，進而討論場景陳設、攝影鏡頭、打光等執行細節。在《千日千夜》裡，有很大部分的場景都是在攝影棚搭建縮小比例的模型，再將另外拍攝的主角畫面合成進場景中。像是電影主視覺的飛天情侶，就是劇組先花了一個月建造了一座1/200大小的戰後城市模型才進行拍攝，希望透過奇幻細膩的畫面令觀眾品味：當戰火無情轟炸美麗的小鎮，真善美依然會繼續存在於人世間。
 
在大師洛伊安德森的心中，《千日千夜》英文片名的「Endlessness」並不是要傳達時間無盡的概念，而是想提醒觀影的你：身而為人，即使生活充滿了各種苦與樂，都需要享受當下，因為「存在」將會是永恆的，人性將永遠如繁星閃耀。
 
                

----------------------------------------------------------------------
電影名稱： 
                  雨天．紐約
期待度： 98%
滿意度： 4.3

                  蓋茲比（提摩西夏勒梅飾）的女友艾希莉（艾兒芬妮飾）因學校作業爭取到親赴曼哈頓訪談知名大導演羅蘭波拉德 （李佛薛伯飾）的機會，於是蓋茲比計畫了一場充滿紐約復古風情的浪漫約會，但艾希莉卻被導演約去看電影，接 著又遇見了金牌編劇泰德戴杜夫（裘德洛飾）與大明星法蘭西斯柯維嘉（狄亞哥盧納），導致蓋茲比的約會計畫泡 湯。當艾希莉在三個才華洋溢的男人之間打轉時，蓋茲比和前女友的妹妹千兒（賽琳娜戈梅茲飾）意外一「吻」也 打亂了他的心…
                
----------------------------------------------------------------------
電影名稱： 
                  逃出夢幻島
期待度： 93%
滿意度： 3.0

                  ★最美惡夢來襲！2019《逃出夢幻島》詭譎扭曲更勝《逃出絕命鎮》
★幻想成真卻是夢靨！？《逃出夢幻島》血腥變態登場
★《逃出絕命鎮》《我們》製作群挑戰人性極限 打造恐怖驚悚新作
 
由「恐怖界皮克斯」之稱的Blumhouse製作公司所全心傾力打造的《逃出夢幻島》；一位自稱是神祕管家的路克先生（麥可潘納 飾），在一座奢華卻偏遠的小島上，招待了五位素未謀面的幸運客人，並承諾他們：「在夢幻島，你所有的幻想都可能成真。」但當這些夢境開始一個個扭曲成令人害怕且致命的夢魘，這些賓客必須要靠著自己的力量，解開島嶼中的魔幻力量，試圖活著逃離這個無人知曉的神祕之地……
                
----------------------------------------------------------------------
電影名稱： 
                  你好．愛．再見
期待度： 0
滿意度： 3.3

                  在擁擠的香港繁華之地，兩個菲律賓的移工注定要永遠改變彼此的生活。
喬伊(凱瑟琳‧貝爾納多Kathryn B