# Python 爬蟲實戰範例｜學會抓取 Yahoo奇摩最新電影
提供給想學習 Python 爬蟲的朋友們，分享 Python 爬蟲的步驟與方法，並提供完整的程式碼，只要常透過不同主題的實戰練習，就可以駕輕就熟爬蟲技術，往後要抓取網頁資料，就能夠輕易上手

網站文章：https://www.webscrapingpro.tw/yahoo-movie-web-scraping-using-python/

In [5]:
import requests
from bs4 import BeautifulSoup

url = 'https://movies.yahoo.com.tw/movie_thisweek.html'
response = requests.get(url=url)

soup = BeautifulSoup(response.text, 'lxml')

In [2]:
info_items = soup.find_all('div', 'release_info')

for item in info_items:
    name = item.find('div', 'release_movie_name').a.text.strip()
    english_name = item.find('div', 'en').a.text.strip()
    release_time = item.find('div', 'release_movie_time').text.split('：')[-1].strip()
    level = item.find('div', 'leveltext').span.text.strip()
    
    print('{}({}) 上映日：{} 期待度：{}'.format(name, english_name, release_time, level))

海邊走走(Hope Gap) 上映日：2020-05-15 期待度：69%
奪命隧道(The Tunnel) 上映日：2020-05-15 期待度：90%
奇蹟救援(The Cave) 上映日：2020-05-15 期待度：96%
誰殺了唐吉訶德(The Man Who Killed Don Quixote) 上映日：2020-05-15 期待度：88%
白髮魔女傳(The Bride With White Hair) 上映日：2020-05-15 期待度：95%
末代皇帝(The Last Emperor) 上映日：2020-05-15 期待度：98%
喪屍來鬥陣(Zombie Fighter) 上映日：2020-05-15 期待度：25%
天氣之子(Weathering with You) 上映日：2020-05-15 期待度：64%
來自深淵 深沉靈魂的黎明  4DX/MX4D(MADE IN ABYSS - Dawn of the Deep Soul 4DX/MX4D) 上映日：2020-05-15 期待度：97%
葉問4：完結篇(IP MAN 4) 上映日：2020-05-15 期待度：44%


In [3]:
import csv

info_items = soup.find_all('div', 'release_info')

with open('本週新片.csv', 'w', encoding='utf-8', newline='') as csv_file:
    
    csv_writer = csv.writer(csv_file)
    csv_writer.writerow(['電影片名', '電影英文片名', '上映時間', '網友期待度'])

    for item in info_items:

        name = item.find('div', 'release_movie_name').a.text.strip()
        english_name = item.find('div', 'en').a.text.strip()
        release_time = item.find('div', 'release_movie_time').text.split('：')[-1].strip()
        level = item.find('div', 'leveltext').span.text.strip()
        
        csv_writer.writerow([name, english_name, release_time, level])

## 完整的程式碼如下

In [4]:
import csv
import requests
from bs4 import BeautifulSoup

url = 'https://movies.yahoo.com.tw/movie_thisweek.html'
response = requests.get(url=url)

soup = BeautifulSoup(response.text, 'lxml')

info_items = soup.find_all('div', 'release_info')

with open('本週新片.csv', 'w', encoding='utf-8', newline='') as csv_file:
    
    csv_writer = csv.writer(csv_file)
    csv_writer.writerow(['電影片名', '電影英文片名', '上映時間', '網友期待度'])

    for item in info_items:

        name = item.find('div', 'release_movie_name').a.text.strip()
        english_name = item.find('div', 'en').a.text.strip()
        release_time = item.find('div', 'release_movie_time').text.split('：')[-1].strip()
        level = item.find('div', 'leveltext').span.text.strip()
        
        csv_writer.writerow([name, english_name, release_time, level])
        print('{}({}) 上映日：{} 期待度：{}'.format(name, english_name, release_time, level))

海邊走走(Hope Gap) 上映日：2020-05-15 期待度：69%
奪命隧道(The Tunnel) 上映日：2020-05-15 期待度：90%
奇蹟救援(The Cave) 上映日：2020-05-15 期待度：96%
誰殺了唐吉訶德(The Man Who Killed Don Quixote) 上映日：2020-05-15 期待度：88%
白髮魔女傳(The Bride With White Hair) 上映日：2020-05-15 期待度：95%
末代皇帝(The Last Emperor) 上映日：2020-05-15 期待度：98%
喪屍來鬥陣(Zombie Fighter) 上映日：2020-05-15 期待度：25%
天氣之子(Weathering with You) 上映日：2020-05-15 期待度：64%
來自深淵 深沉靈魂的黎明  4DX/MX4D(MADE IN ABYSS - Dawn of the Deep Soul 4DX/MX4D) 上映日：2020-05-15 期待度：97%
葉問4：完結篇(IP MAN 4) 上映日：2020-05-15 期待度：44%
