# Wikipedia爬蟲練習
## 範例：練習是從Wikipedia中爬取文章。先定義一個搜尋的關鍵字，擷取該關鍵字詞的文章。

In [27]:
import requests
import re
from bs4 import BeautifulSoup

### 先定義一個我們想搜尋的字詞，並將它轉換成UTF-8編碼後的URL

In [28]:
input_keyword = "網路爬蟲"  # 這裡可以自己定義有興趣的關鍵字
input_keyword = "全球資訊網"  # 這裡可以自己定義有興趣的關鍵字


utf8_url = repr(input_keyword.encode('UTF-8')).upper()  # 編碼成UTF-8並轉成大寫字元
utf8_url = utf8_url.replace("\\X", "%")                 # 用 '%' 取代 '\X' 
print("%s: %s" % (input_keyword, utf8_url[2:-1:1]))     # 擷取中間的編碼結果

# 組成Wiki關鍵字搜尋的網址格式
root_keyword_link = '/wiki/' + utf8_url[2:-1:1]
print(root_keyword_link)

全球資訊網: %E5%85%A8%E7%90%83%E8%B3%87%E8%A8%8A%E7%B6%B2
/wiki/%E5%85%A8%E7%90%83%E8%B3%87%E8%A8%8A%E7%B6%B2


### 範例1：送出關鍵字請求後，爬取該關鍵字的文章內容

In [29]:
# 模擬封包的標頭
headers = {
    'authority': 'zh.wikipedia.org',
    'method': 'GET',
    'path': '/wiki/' + root_keyword_link,
    'scheme': 'https',
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
    'accept-encoding': 'gzip, deflate, br',
    'accept-language': 'zh-TW,zh;q=0.9,en-US;q=0.8,en;q=0.7,zh-CN;q=0.6',
    'cookie': 'GeoIP=TW:TPE:Taipei:25.05:121.53:v4; TBLkisOn=0; mwPhp7Seed=8b8; WMF-Last-Access-Global=04-Jun-2019; WMF-Last-Access=04-Jun-2019',
    'dnt': '1',
    #'if-modified-since': 'Tue, 04 Jun 2019 12:03:22 GMT',
    'referer': 'https://zh.wikipedia.org/wiki/Wikipedia:%E9%A6%96%E9%A1%B5',
    'upgrade-insecure-requests': '1',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
}    

url = 'https://zh.wikipedia.org' + root_keyword_link  # 組合關鍵字查詢URL
resp = requests.get(url, headers=headers)
resp.encoding = 'utf-8'

html = BeautifulSoup(resp.text, "lxml")
content = html.find(name='div', attrs={'id':'mw-content-text'}).find_all(name='p')

#
# 解析回傳資料，並萃取文章內容
#
for paragraph in content:
    print(paragraph.get_text())


全球資訊網（英語：World Wide Web）亦作WWW、Web，是一個透過網際網路存取的，由許多互相連結的超文字組成的系統[1]。英國科學家提姆·柏內茲-李於1989年發明了全球資訊網。1990年他在瑞士CERN的工作期間編寫了第一個網頁瀏覽器[2][3]。網頁瀏覽器於1991年在CERN以外發行，1991年1月最先向其他研究機構發行，並於1991年8月在網際網路上向公眾開放。

全球資訊網是資訊時代發展的核心，也是數十億人在網際網路上進行互動的主要工具[4][5][6]。網頁主要是文字檔案格式化和超文件標示語言（HTML）。除了格式化文字之外，網頁還可能包含圖片、影片、聲音和軟體元件，這些元件會在使用者的網頁瀏覽器中呈現為多媒體內容的連貫頁面。

全球資訊網並不等同網際網路，全球資訊網只是網際網路所能提供的服務其中之一，是靠著網際網路運行的一項服務。

最早的構想可以追溯到遙遠的1980年提姆·柏內茲-李構建的ENQUIRE專案。這是一個類似維基百科的超文字線上編輯資料庫。儘管這與我們現在使用的全球資訊網大不相同，但是它們有許多相同的核心思想，甚至還包括一些柏內茲-李的全球資訊網之後的下一個專案語意網中的構想。

1989年3月，柏內茲.李撰寫了《關於資訊化管理的建議》一文，文中提及ENQUIRE並且描述了一個更加精巧的管理模型[7]。1990年11月12日他和羅伯特·卡里奧合作提出了一個更加正式的關於全球資訊網的建議[8]。在1990年11月13日他在一台NeXT工作站上寫了第一個網頁以實現他文中的想法[9]。

在那年的聖誕節，柏內茲-李製作了要讓網路工作的所有必要工具[10]：第一個網頁瀏覽器WorldWideWeb（同時也是網頁編輯器）和第一個網頁伺服器。

1991年8月6日，他在alt.hypertext新聞群組上貼了全球資訊網專案簡介的文章[11]。這一天也標誌著網際網路上全球資訊網公共服務的首次亮相。

全球資訊網中至關重要的概念─超文字，起源於1960年代的幾個從前的專案。譬如泰德·尼爾森的仙那度計劃（英語：Project Xanadu）和道格拉斯·英格巴特的NLS（英語：NLS (computer system)）。而這兩個專案的靈感都是來源於萬尼瓦爾·布希在其1945年的論文《和我們想得一樣》中為微縮膠片設計的Memex（英語：Memex

### 範例2：從爬取的文章內容中，擷取出有外部連結的關鍵字。這些關鍵字在文章中是以藍色字體顯示，會連到外部的網頁，並解釋其內容。

In [30]:
for ext_link in content:
    a_tag = ext_link.find_all('a', href=re.compile("^(/wiki/)((?!;)\S)*$"))
    if len(a_tag) > 0:
        for link_string in a_tag:
            a_link = link_string["href"]       # 外部連結的網址
            a_keyword = link_string.get_text()  # 外部連結的中文名稱
            print("外部連結: [%s] %s" % (a_keyword, a_link))

外部連結: [網際網路] /wiki/%E4%BA%92%E8%81%94%E7%BD%91
外部連結: [超文字] /wiki/%E8%B6%85%E6%96%87%E6%9C%AC
外部連結: [提姆·柏內茲-李] /wiki/%E8%92%82%E5%A7%86%C2%B7%E4%BC%AF%E7%BA%B3%E6%96%AF-%E6%9D%8E
外部連結: [CERN] /wiki/CERN
外部連結: [網頁瀏覽器] /wiki/%E7%B6%B2%E9%A0%81%E7%80%8F%E8%A6%BD%E5%99%A8
外部連結: [資訊時代] /wiki/%E8%B3%87%E8%A8%8A%E6%99%82%E4%BB%A3
外部連結: [網頁] /wiki/%E7%B6%B2%E9%A0%81
外部連結: [格式化] /wiki/%E6%A0%BC%E5%BC%8F%E5%8C%96%E6%96%87%E6%9C%AC
外部連結: [超文件標示語言] /wiki/%E8%B6%85%E6%96%87%E4%BB%B6%E6%A8%99%E7%A4%BA%E8%AA%9E%E8%A8%80
外部連結: [圖片] /wiki/%E5%9C%96%E7%89%87
外部連結: [影片] /wiki/%E5%BD%B1%E7%89%87
外部連結: [聲音] /wiki/%E8%81%B2%E9%9F%B3
外部連結: [多媒體] /wiki/%E5%A4%9A%E5%AA%92%E9%AB%94
外部連結: [網際網路] /wiki/%E7%B6%B2%E9%9A%9B%E7%B6%B2%E8%B7%AF
外部連結: [提姆·柏內茲-李] /wiki/%E8%92%82%E5%A7%86%C2%B7%E4%BC%AF%E7%BA%B3%E6%96%AF-%E6%9D%8E
外部連結: [ENQUIRE] /wiki/ENQUIRE
外部連結: [資料庫] /wiki/%E6%95%B0%E6%8D%AE%E5%BA%93
外部連結: [語意網] /wiki/%E8%AF%AD%E4%B9%89%E7%BD%91
外部連結: [羅伯特·卡里奧] /wiki/%E7%BD%97%E4%BC%AF%E7%89%B9%C2%B7%E5%8D%A1%E9%87%8C

## 作業：接下來定義一個爬蟲函數，這個函數的主要工作為：
### (1) 爬取當前關鍵字的解釋，並存入檔案(因為文章內容太多會佔滿整個頁面，所以存程檔案，方便後續檢視)
### (2) 萃取出當前關鍵字所引用的外部連結，當作新的查詢關鍵字
### (3) 把第(2)擷取到的關鍵字當作新的關鍵字，回到第(1)步，爬取新的關鍵字解釋。

In [49]:
import os

def WikiArticle(key_word_link, key_word, recursive):
    
    if (recursive <= max_recursive_depth):
        print("遞迴層[%d] - %s (%s)" % (recursive, key_word_link, key_word))
        
        # 模擬封包的標頭
        headers = {
            'authority': 'zh.wikipedia.org',
            'method': 'GET',
            'path': '/wiki/' + key_word_link,
            'scheme': 'https',
            'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
            'accept-encoding': 'gzip, deflate, br',
            'accept-language': 'zh-TW,zh;q=0.9,en-US;q=0.8,en;q=0.7,zh-CN;q=0.6',
            'cookie': 'GeoIP=TW:TPE:Taipei:25.05:121.53:v4; TBLkisOn=0; mwPhp7Seed=8b8; WMF-Last-Access-Global=04-Jun-2019; WMF-Last-Access=04-Jun-2019',
            'dnt': '1',
            #'if-modified-since': 'Tue, 04 Jun 2019 12:03:22 GMT',
            'referer': 'https://zh.wikipedia.org/wiki/Wikipedia:%E9%A6%96%E9%A1%B5',
            'upgrade-insecure-requests': '1',
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
        }    

        url = 'https://zh.wikipedia.org' + key_word_link  # 組合關鍵字查詢URL
        resp = requests.get(url, headers=headers)
        resp.encoding = 'utf-8'

        html = BeautifulSoup(resp.text, "lxml")
        content = html.find(name='div', attrs={'id':'mw-content-text'}).find_all(name='p')
        
        #
        # Part 1: 請參考範例1，爬取當前關鍵字的文章內容。
        #         因為內容太多，我們把它寫入檔案，並以關鍵字作為檔案名稱，以便稍後查閱內容。
        #         請先建立一個名為"WikiArticle"的資料夾，爬取到的文章內容會放在這個資料夾底下。
        #
        '''
        
        Your code here
        
        '''
        try:
          os.mkdir("WikiArticl")
        except:
          pass  

        #
        # 解析回傳資料，並萃取文章內容
        #
        
        out_filename=os.path.join("WikiArticl",key_word+".html")
        out_filename=out_filename.replace("/","_")
        with open(out_filename,"w", encoding="utf-8") as out_file:
             for paragraph in content:
                 out_file.write(paragraph.get_text())
                 #print(paragraph.get_text())
    
        

        
        #
        # Part 2: 請參考範例2，萃取出本篇文章中所延伸引用的外部連結，並儲存在external_link_dict
        #
        external_link_dict = dict({})
        '''
        
        Your code here
        
        '''
        for ext_link in content:
            a_tag = ext_link.find_all('a', href=re.compile("^(/wiki/)((?!;)\S)*$"))
            if len(a_tag) > 0:
               for link_string in a_tag:
                   a_link = link_string["href"]       # 外部連結的網址
                   a_keyword = link_string.get_text()  # 外部連結的中文名稱
                   external_link_dict[a_link]=a_keyword
                   #print("外部連結: [%s] %s" % (a_keyword, a_link))

                    
        #
        # Part 3: 將Part 2所收集的外部連結，當作新的關鍵字，繼續迭代深入爬蟲
        #
        if (len(external_link_dict) > 0):
            
            recursive = recursive + 1  # 遞迴深度加1
            
            for k, v in external_link_dict.items():
                WikiArticle(k, v, recursive)  # 再次呼叫同樣的函數，執行同樣的流程
                

### 執行前個步驟定義好的爬蟲主程式

In [50]:
# 定義爬取的遞迴深度。深度不要訂太深，否則會爬很久。
max_recursive_depth = 2

WikiArticle(root_keyword_link, input_keyword, 0)

遞迴層[0] - /wiki/%E5%85%A8%E7%90%83%E8%B3%87%E8%A8%8A%E7%B6%B2 (全球資訊網)
遞迴層[1] - /wiki/%E4%BA%92%E8%81%94%E7%BD%91 (網際網路)
遞迴層[2] - /wiki/20%E4%B8%96%E7%B4%80 (20世紀)
遞迴層[2] - /wiki/%E7%94%B5%E8%84%91%E7%BD%91%E7%BB%9C (電腦網路)
遞迴層[2] - /wiki/%E7%B6%B2%E8%B7%AF (網路)
遞迴層[2] - /wiki/%E7%BD%91%E7%BB%9C%E5%8D%8F%E8%AE%AE (網路協定)
遞迴層[2] - /wiki/%E5%AD%B8%E8%A1%93%E7%95%8C (學術界)
遞迴層[2] - /wiki/%E7%94%B5%E5%AD%90%E6%8A%80%E6%9C%AF (電子)
遞迴層[2] - /wiki/%E7%84%A1%E7%B7%9A (無線)
遞迴層[2] - /wiki/%E5%85%89%E7%BA%96%E7%B6%B2%E8%B7%AF (光纖網路技術)
遞迴層[2] - /wiki/%E8%B6%85%E6%96%87%E6%9C%AC (超文字)
遞迴層[2] - /wiki/%E8%90%AC%E7%B6%AD%E7%B6%B2 (全球資訊網)
遞迴層[2] - /wiki/%E9%9B%BB%E5%AD%90%E9%83%B5%E4%BB%B6 (電子郵件)
遞迴層[2] - /wiki/%E7%B6%B2%E9%9A%9B%E5%8D%94%E8%AD%B0%E9%80%9A%E8%A9%B1%E6%8A%80%E8%A1%93 (通話)
遞迴層[2] - /wiki/%E6%AA%94%E6%A1%88%E5%88%86%E4%BA%AB (檔案分享)
遞迴層[2] - /wiki/TCP/IP (TCP/IP)
遞迴層[2] - /wiki/%E5%88%86%E6%95%A3%E7%BD%91%E7%BB%9C (分散網路)
遞迴層[2] - /wiki/%E6%8E%92%E9%98%9F%E8%AE%BA (排隊論)
遞迴層[2] - /wiki/%E5%B0%81%

遞迴層[2] - /wiki/CERN_httpd (CERN httpd)
遞迴層[2] - /wiki/%E5%AE%88%E6%8A%A4%E8%BF%9B%E7%A8%8B (守護行程)
遞迴層[2] - /wiki/%E7%BD%91%E7%AB%99 (網站)
遞迴層[2] - /wiki/%E5%8D%97%E5%AE%89%E6%99%AE%E6%95%A6%E5%A4%A7%E5%AD%A6 (南安普敦大學)
遞迴層[2] - /wiki/%E8%AF%AD%E4%B9%89%E7%BD%91 (語意網)
遞迴層[2] - /wiki/%E6%B3%B0%E6%99%A4%E5%A3%AB%E6%8A%A5 (泰晤士報)
遞迴層[2] - /wiki/%E6%88%88%E7%99%BB%C2%B7%E5%B8%83%E6%9C%97 (戈登·布朗)
遞迴層[2] - /wiki/%E8%8B%B1%E5%9C%8B%E5%9C%B0%E5%BD%A2%E6%B8%AC%E9%87%8F%E5%B1%80 (英國地形測量局)
遞迴層[2] - /wiki/%E7%BD%91%E7%BB%9C%E4%B8%AD%E7%AB%8B%E6%80%A7 (網路中立性)
遞迴層[2] - /wiki/%E4%BA%92%E8%81%94%E7%BD%91%E6%9C%8D%E5%8A%A1%E4%BE%9B%E5%BA%94%E5%95%86 (網際網路服務供應商)
遞迴層[1] - /wiki/CERN (CERN)
遞迴層[2] - /wiki/%E6%B3%95%E8%AF%AD (法語)
遞迴層[2] - /wiki/%E8%8B%B1%E6%96%87 (英文)
遞迴層[2] - /wiki/%E7%B2%92%E5%AD%90%E7%89%A9%E7%90%86%E5%AD%B8 (粒子物理學)
遞迴層[2] - /wiki/%E5%85%A8%E7%90%83%E8%B3%87%E8%A8%8A%E7%B6%B2 (全球資訊網)
遞迴層[2] - /wiki/%E7%91%9E%E5%A3%AB (瑞士)
遞迴層[2] - /wiki/%E6%97%A5%E5%85%A7%E7%93%A6 (日內瓦)
遞迴層[2] - /wiki/%E6%B2

遞迴層[2] - /wiki/%E6%8F%9B%E8%A1%8C (換行)
遞迴層[2] - /wiki/%E9%98%BF%E6%8B%89%E4%BC%AF%E8%AF%AD (阿拉伯語)
遞迴層[2] - /wiki/%E6%B3%A2%E6%96%AF%E8%AF%AD (波斯語)
遞迴層[2] - /wiki/%E5%B8%8C%E4%BC%AF%E6%9D%A5%E8%AF%AD (希伯來語)
遞迴層[2] - /wiki/%E5%AD%97%E5%85%83%E5%80%BC%E5%8F%83%E8%80%83 (字元值參考)
遞迴層[2] - /wiki/%E7%94%A8%E6%88%B7%E4%BB%A3%E7%90%86 (用戶代理)
遞迴層[2] - /wiki/%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB (搜尋和索引)
遞迴層[2] - /wiki/%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81 (字元編碼)
遞迴層[2] - /wiki/UTF-8 (UTF-8)
遞迴層[2] - /wiki/Unicode (Unicode)
遞迴層[2] - /wiki/%E6%95%B8%E6%93%9A%E9%A1%9E%E5%9E%8B (資料類型)
遞迴層[2] - /wiki/%E6%96%87%E6%A1%A3%E7%B1%BB%E5%9E%8B%E5%AE%9A%E4%B9%89 (文件類型定義)
遞迴層[2] - /wiki/HTML5 (HTML5)
遞迴層[2] - /wiki/Span_and_div (span與div)
遞迴層[2] - /wiki/%E5%91%88%E7%8E%B0%E4%B8%8E%E5%86%85%E5%AE%B9%E5%88%86%E7%A6%BB (呈現與內容分離)
遞迴層[2] - /wiki/%E8%AF%AD%E4%B9%89%E7%BD%91 (語意)
遞迴層[2] - /wiki/Web_2.0 (Web 2.0)
遞迴層[2] - /wiki/%E6%B7%B7%E6%90%AD_(%E4%BA%92%E8%81%AF%E7%B6%B2) (混搭)
遞迴層[2] - /wiki/%E6%A0%BC%E5%83%B9 (價格比較網

遞迴層[2] - /wiki/%E7%84%A1%E7%B7%9A (無線)
遞迴層[2] - /wiki/%E5%85%89%E7%BA%96%E7%B6%B2%E8%B7%AF (光纖網路技術)
遞迴層[2] - /wiki/%E8%B6%85%E6%96%87%E6%9C%AC (超文字)
遞迴層[2] - /wiki/%E8%90%AC%E7%B6%AD%E7%B6%B2 (全球資訊網)
遞迴層[2] - /wiki/%E9%9B%BB%E5%AD%90%E9%83%B5%E4%BB%B6 (電子郵件)
遞迴層[2] - /wiki/%E7%B6%B2%E9%9A%9B%E5%8D%94%E8%AD%B0%E9%80%9A%E8%A9%B1%E6%8A%80%E8%A1%93 (通話)
遞迴層[2] - /wiki/%E6%AA%94%E6%A1%88%E5%88%86%E4%BA%AB (檔案分享)
遞迴層[2] - /wiki/TCP/IP (TCP/IP)
遞迴層[2] - /wiki/%E5%88%86%E6%95%A3%E7%BD%91%E7%BB%9C (分散網路)
遞迴層[2] - /wiki/%E6%8E%92%E9%98%9F%E8%AE%BA (排隊論)
遞迴層[2] - /wiki/%E5%B0%81%E5%8C%85%E4%BA%A4%E6%8F%9B (封包交換)
遞迴層[2] - /wiki/%E7%BE%8E%E5%9B%BD%E5%9B%BD%E9%98%B2%E9%83%A8 (美國國防部)
遞迴層[2] - /wiki/%E5%9C%8B%E9%98%B2%E9%AB%98%E7%AD%89%E7%A0%94%E7%A9%B6%E8%A8%88%E5%8A%83%E7%BD%B2 (高等研究計劃署)
遞迴層[2] - /wiki/%E5%86%B7%E6%88%98 (冷戰)
遞迴層[2] - /wiki/ARPA%E7%BD%91 (ARPA網)
遞迴層[2] - /wiki/%E8%8B%B1%E5%9B%BD (英國)
遞迴層[2] - /wiki/%E6%8C%AA%E5%A8%81 (挪威)
遞迴層[2] - /wiki/%E8%AE%A1%E7%AE%97%E6%9C%BA (電腦)
遞迴層[2] - /wik

遞迴層[2] - /wiki/%E5%B7%A5%E4%BD%9C%E7%AB%99 (工作站)
遞迴層[2] - /wiki/%E8%98%8B%E6%9E%9C%E5%85%AC%E5%8F%B8 (蘋果公司)
遞迴層[2] - /wiki/%E8%98%8B%E6%9E%9C%E9%9B%BB%E8%85%A6 (蘋果電腦)
遞迴層[2] - /wiki/%E5%8F%B2%E8%92%82%E5%A4%AB%C2%B7%E8%B3%88%E4%BC%AF%E6%96%AF (史蒂夫·賈伯斯)
遞迴層[2] - /wiki/NeXT_Computer (NeXT Computer)
遞迴層[2] - /wiki/%E7%89%A9%E4%BB%B6%E5%B0%8E%E5%90%91 (物件導向)
遞迴層[2] - /wiki/%E4%BD%9C%E6%A5%AD%E7%B3%BB%E7%B5%B1 (作業系統)
遞迴層[2] - /wiki/NEXTSTEP (NEXTSTEP)
遞迴層[2] - /wiki/API (API)
遞迴層[2] - /wiki/OPENSTEP (OPENSTEP)
遞迴層[2] - /wiki/%E5%8B%95%E6%85%8B%E7%B6%B2%E9%A0%81 (動態網頁)
遞迴層[2] - /wiki/%E7%BD%91%E7%AB%99 (網站)
遞迴層[2] - /wiki/%E7%BA%A6%E7%BF%B0%C2%B7%E6%96%AF%E5%8D%A1%E5%88%A9 (史考利)
遞迴層[2] - /wiki/%E4%BF%9D%E7%BD%97%C2%B7%E5%85%B0%E5%BE%B7 (保羅·蘭德)
遞迴層[2] - /wiki/%E8%AE%A9-%E8%B7%AF%E6%98%93%C2%B7%E5%8A%A0%E8%A5%BF (讓-路易·加西)
遞迴層[2] - /wiki/Unix (Unix)
遞迴層[2] - /wiki/%E9%A3%8E%E6%8A%95 (風投)
遞迴層[2] - /wiki/%E7%BD%97%E6%96%AF%C2%B7%E4%BD%A9%E7%BD%97 (羅斯·佩羅)
遞迴層[2] - /wiki/%E5%8A%A0%E5%B7%9E (加州)
遞迴層

遞迴層[2] - /wiki/%E5%8D%8E%E7%89%B9%E8%BF%AA%E5%A3%AB%E5%B0%BC%E5%85%AC%E5%8F%B8 (迪士尼)
遞迴層[2] - /wiki/%E6%8C%AA%E5%A8%81 (挪威)
遞迴層[2] - /wiki/%E8%8A%82%E7%A4%BC%E6%97%A5 (節禮日)
遞迴層[2] - /wiki/%E8%8A%AC%E5%85%B0 (芬蘭)
遞迴層[2] - /wiki/%E6%84%8F%E5%A4%A7%E5%88%A9 (義大利)
遞迴層[2] - /wiki/%E5%8F%A4%E7%BD%97%E9%A9%AC (古羅馬)
遞迴層[2] - /wiki/%E4%BB%AA%E5%BC%8F (宗教儀式)
遞迴層[2] - /wiki/%E8%88%B9%E8%88%B6 (船)
遞迴層[2] - /wiki/%E6%9D%B1%E6%AD%90 (東歐)
遞迴層[2] - /wiki/%E6%96%AF%E6%8B%89%E5%A4%AB%E4%BA%BA (斯拉夫)
遞迴層[2] - /wiki/%E9%9B%AA%E5%A7%91%E5%A8%98 (雪姑娘)
遞迴層[2] - /wiki/%E4%B8%89%E5%A5%97%E8%BB%8A (三套車)
遞迴層[2] - /wiki/%E6%8D%B7%E5%85%8B (捷克)
遞迴層[2] - /wiki/%E9%9B%B2%E6%9D%89 (雲杉)
遞迴層[2] - /wiki/%E6%9D%BE%E7%A7%91 (松樹)
遞迴層[2] - /wiki/%E8%8B%B9%E6%9E%9C (蘋果)
遞迴層[2] - /wiki/%E9%9E%8B (鞋)
遞迴層[2] - /wiki/%E5%87%BA%E5%AB%81 (出嫁)
遞迴層[2] - /wiki/%E9%93%85 (鉛)
遞迴層[2] - /wiki/%E6%B3%A2%E5%85%B0 (波蘭)
遞迴層[2] - /wiki/%E6%96%AF%E6%B4%9B%E4%BC%90%E5%85%8B (斯洛伐克)
遞迴層[2] - /wiki/%E5%B8%83%E6%8B%89%E8%BF%AA%E6%96%AF%E6%8B%89%E5%8

遞迴層[2] - /wiki/%E6%94%BF%E6%95%99%E5%88%86%E9%9B%A2 (政教分離)
遞迴層[2] - /wiki/%E6%97%A5%E6%9C%AC%E6%B3%95%E5%BE%8B (日本法律)
遞迴層[2] - /wiki/%E8%82%AF%E5%BE%B7%E5%9F%BA (肯德基)
遞迴層[2] - /wiki/%E7%82%B8%E9%9B%9E (炸雞)
遞迴層[2] - /wiki/%E6%84%9B%E6%83%85 (愛情)
遞迴層[2] - /wiki/%E6%97%85%E9%A4%A8 (旅館)
遞迴層[2] - /wiki/%E6%95%99%E5%A0%82 (教堂)
遞迴層[2] - /wiki/%E5%8D%B0%E5%BA%A6 (印度)
遞迴層[2] - /wiki/%E5%8D%B0%E5%9C%B0%E8%AA%9E (印地語)
遞迴層[2] - /wiki/%E8%8F%B2%E5%BE%8B%E8%B3%93 (菲律賓)
遞迴層[2] - /wiki/%E4%BC%8A%E4%B8%B9%E5%A5%B6%E9%85%AA (伊丹奶酪)
遞迴層[2] - /wiki/%E9%9F%A9%E5%9B%BD (韓國)
遞迴層[2] - /wiki/%E9%A9%AC%E6%9D%A5%E8%A5%BF%E4%BA%9A (馬來西亞)
遞迴層[2] - /wiki/%E6%96%B0%E5%8A%A0%E5%9D%A1 (新加坡)
遞迴層[2] - /wiki/%E4%B8%9C%E5%B8%9D%E6%B1%B6 (東帝汶)
遞迴層[2] - /wiki/%E6%BE%B3%E5%A4%A7%E5%88%A9%E4%BA%9A (澳大利亞)
遞迴層[2] - /wiki/%E6%96%B0%E8%A5%BF%E5%85%B0 (紐西蘭)
遞迴層[2] - /wiki/%E5%86%AC%E5%AD%A3 (冬季)
遞迴層[2] - /wiki/%E8%8D%B7%E9%87%8C%E6%B4%BB (好萊塢)
遞迴層[2] - /wiki/%E6%B9%AF%C2%B7%E6%BC%A2%E6%96%AF (湯·漢斯)
遞迴層[2] - /wiki/%E6%AF%94%E5%B0%94

UnicodeEncodeError: 'latin-1' codec can't encode characters in position 25-33: ordinal not in range(256)