# YAHOO電影爬蟲練習
## 這個作業主要是練習爬取YAHOO電影的資訊，主要會用到基本的GET method，以及解析伺服器回傳的html，從中擷取我們想要的資料。

### 這個範例示範如何爬取上映中的電影資訊。先訪問YAHOO電影首頁：https://movies.yahoo.com.tw ，點選「上映中」的分頁，先確認上映中的電影總共有幾筆，然後逐頁爬取。

In [8]:
import requests
import re
from bs4 import BeautifulSoup

In [11]:
# 先觀察一下目前上映中的電影數量
url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
resp = requests.get(url)
resp.encoding = 'utf-8'

soup = BeautifulSoup(resp.text, 'lxml')
html = soup.find("div", attrs={'class':'release_box'})  # 尋找正在上映中的全部電影筆數，其所在的tag
print("正在上映中總共: ", html.p.string)

正在上映中總共:  共106筆，目前顯示1~10筆


### 爬取所有上映中的電影資料：電影名稱、期待度、滿意度、簡介等等。

In [17]:
# 接下來要爬取每一頁的電影介紹
# 先點選網頁最底部的下一頁，觀察其網址變化。然後我們把頁數當作變數傳入，用迴圈爬取。
max_page = 5
for page_number in range(1, max_page+1, 1):
    url = 'https://movies.yahoo.com.tw/movie_intheaters.html'
    payload = {'page':str(page_number)}
    resp = requests.get(url, params=payload)
    resp.encoding = 'utf-8'
    soup = BeautifulSoup(resp.text, 'lxml')

    # 把電影介紹擷取出來
    movie_list = soup.find("ul", attrs={"class":"release_list"}).find_all("li")
    for p in movie_list:
        print("----------------------------------------------------------------------")
        # 電影名稱
        movie_name = p.find("div", attrs={"class":"release_movie_name"})
        print("電影名稱：", movie_name.a.string)
        
        # 定位電影評價資訊欄位
        level_box = movie_name.find("dl", attrs={"class":"levelbox"})
        
        # 期待度
        expectation = level_box.find("div", attrs={"class":"leveltext"})
        print("期待度：", expectation.span.string)
        
        # 滿意度
        satisfaction = level_box.find_all("div", attrs={"class":"leveltext"})[-1]
        print("滿意度：", satisfaction.span["data-num"])  # 滿意度可以從"data-num"這個屬性擷取
        
        # 簡介
        movie_info = p.find("div", attrs={"class":"release_text"})
        print(movie_info.span.string)


----------------------------------------------------------------------
電影名稱： 
                  小路與我的秘密驛站
期待度： 44%
滿意度： 0.0

                  年僅8歲的小女孩沙耶香，無法接受自己的愛狗小路已過世，某天她前往他們曾一起玩耍的秘密基地尋找小路，沙耶香深信小路依然在某處好好活著，但她卻在那裡見到了另一隻狗。幾天後沙耶香又看到了那隻狗，但地點是在布瀨先生的咖啡廳門口。鄰居都說咖啡廳店長布瀨先生是個固執又古怪的人，但其實布瀨先生面臨和沙耶香一樣的情形，他無法接受自己的兒子已死去多年。沙耶香逐漸去拜訪布瀨先生的咖啡廳，而兩人也慢慢了解對方。生命、死亡，以及強烈希望再次見到所愛對象的信念，讓他們看到奇蹟般的「幻覺」。
                
----------------------------------------------------------------------
電影名稱： 
                  傻傻愛你，傻傻愛我
期待度： 92%
滿意度： 4.1

                  ※《傻傻愛你，傻傻愛我》於2019-11-01上映，2020-07-18於中山73影視藝文空間放映
★ 2019最受矚目台灣電影，國片少見溫馨奇幻之作
★ 金鐘視帝藍正龍演而優則導，金牌編劇徐譽庭聯手打造動人作品，人人都有愛的權利
★金獎演員恬妞、郭書瑤、藍正龍、張庭瑚金質演技共同演出
 
每一個人都有愛的權利～～～
康襄維，今年27歲，家人都叫他小維（蔡佳宏 飾），出生於富裕家庭，最愛看作家可夫（藍正龍 飾）所寫得繪本〈森林王子與美人魚〉，他不但想見最崇拜的可夫一面，更期待自己有如森林王子般可以遇到一條真心以待的美人魚！他的家庭生活看似非常幸福，媽媽（恬妞 飾）對他悉心教育，讓是喜憨兒的他能夠自己運行每一天，過著非常接近一般人的正常生活。
 
直到有一天，小維意外偏離平日上班到道路，走向了他最愛的海邊，他看見小爛（郭書瑤 飾）從海裡游到岸邊，驚呆的他立刻視小爛為繪本中那一條美人魚的化身，身為森林王子的自己當然要對她呵護備至，他感受到愛人的喜悅，小爛也從小維身上感受到久違的溫暖，而這次意外的邂逅，讓小維「接近正

----------------------------------------------------------------------
電影名稱： 
                  里斯本的故事 25周年4K修復版
期待度： 95%
滿意度： 4.4

                  ★德國當代電影大師獻給電影大師費里尼與電影百年的一封情書！
★榮獲坎城影展「一種注目」單元入選片！ 
★榮獲德國電影獎「最佳影片」提名！  
★IMDb7.2高分、爛番茄爆米花指數86%，全球影迷一致推薦！ 
★《紐約時報》：「一趟充滿詩意哲學的夢幻之旅！」  
★《Variety》：「動聽音樂與幽默交織成電影迷人的魅力！」
 
從聲音一窺城市樣貌　文．溫德斯獻給電影最美的情書
 
一張寫著求救字眼的風景明信片，讓電影錄音師菲利普(魯迪格福格勒飾)風塵僕僕趕往葡萄牙里斯本，途中他的車壞了，最後千辛萬苦抵達時卻只找到了沒有完成音效的電影膠卷，他的導演朋友菲德利希(派屈克波查飾)消失了， 於是菲利普留在里斯本，發掘被人們忽略的城市聲音，並結識了一群樂團好友，他甚至迷戀上歌聲如黃鶯出谷的女 歌手泰瑞莎… 
 
這是一部結合了城市、音樂與電影的美妙作品，文‧溫德斯帶領我們探索了電影最初始的魅力以及它的未來， 傳達了電影人無止無休的狂熱，電影充滿了幽默、熱情與狂想，文．溫德斯向世界展現了葡萄牙國寶級樂團聖母合唱團（Madredeus）天籟般的音樂，葡萄牙電影大師奧里維拉（Manoel de Oliveira）也在片中的現身，讓這部電影更顯致敬百年電影意涵，是親炙文‧溫德斯獨特風格的最佳入門電影。
 
                
----------------------------------------------------------------------
電影名稱： 
                  魔鬼剋星(1984)
期待度： 86%
滿意度： 0.0

                  劇情描述彼得（比爾莫瑞 飾）、雷伊、埃貢是研究超能現象的大學教授，因紐約市出現許多靈異現象，三人決定招募新成員成立用科技抓鬼服務的公司「魔鬼剋星」。
 
女提琴手丹娜（雪歌妮薇佛 飾）發現家裡冰箱出現靈異事件後，也決定請來「魔鬼剋星」幫忙解決。因為政府單位干涉「魔鬼剋星

----------------------------------------------------------------------
電影名稱： 
                  玩命Online：雙槍對決
期待度： 98%
滿意度： 3.7

                  ★ 2020年美國上映，韓國首周飆出票房冠軍
★ 網路瘋傳迷因「比魔杖好用」正宗原梗電影
★《哈利波特》丹尼爾雷德克里夫X《弒婚遊戲》薩瑪拉威明 玩命對決
★《瘋狂麥斯：憤怒道》《阿凡達》《捍衛任務》炸翻感官 製作團隊
★ 最危險真人直播遊戲，不是勝利，就是死亡！
 
邁爾斯（丹尼爾．雷德克里夫 飾）是個無聊的普通上班族，下班後的時間都躲在螢幕後面做鍵盤酸民。
 
一天，他的留言得罪了危險的「死陣」真人實境遊戲老闆，被揍昏後邁爾斯發現有兩把手槍釘在他的雙手上，不僅造成他吃飯和如廁時極大的困擾，他甚至被強迫加入了這個危險對戰遊戲，得殺掉目前第一名的玩家妮克絲（薩瑪拉．薇明 飾），否則就等著被她殺掉。
 
                
----------------------------------------------------------------------
電影名稱： 
                  驚夢49天
期待度： 95%
滿意度： 3.2

                  ★ 繼《粽邪》後又一台灣恐怖民間習俗「觀落陰」登上大銀幕！
★ 任容萱為戲暴瘦扮幹練女警步步追兇！
★ 華裔百老匯演員Lewis Liu加盟演出惡夢纏身男主角
★ 庹宗華、古斌、陳家逵、太保等實力派影星合力助陣
 
高富帥的美籍華人李家豪（Lewis Liu 飾），經歷一場與紅衣女子交纏的惡夢後，手臂上開始莫名出現的數字烙痕，從49開始一天天減少，像是倒數般的灼熱，身邊的人接二連三的離奇死亡，他成為了重大嫌疑犯，科學查證無法解釋所有的疑點，卻在民俗「觀落陰」中找到答案？
 
29歲、不愛打扮的劉奕臻（任容萱 飾）為何立志成為刑警？陷於痛苦回憶中的她如何幫助自己走出泥沼？她如何協助李家豪一步一步地找出背後真正的元兇？
 
                
--------------------------------------------