In [4]:
import json
import gzip
import re

def extract_media_files_uk(filename):
    """
    Wikipediaの記事ファイルから「イギリス」に関する記事本文中のメディアファイルをすべて抽出する

    Args:
        filename (str): 圧縮されたJSON形式のWikipedia記事ファイル

    Returns:
        list: 抽出されたメディアファイルのリスト
    """
    media_files = []

    with gzip.open(filename, 'rb') as f:
        for line in f:
            # JSON形式のデータをパースする
            data = json.loads(line.decode('utf-8'))

            # 記事名が「イギリス」に一致するかどうかを確認する
            if data['title'] != "イギリス":
                continue

            # 本文中のメディアファイルのURLを抽出する
            for match in re.finditer(r"\[\[(.*?)\]\]", data['text']):
                media_file = match.group(1)

                # ファイル名のみを抽出する
                if "|" in media_file:
                    media_file = media_file.split("|")[0]

                media_files.append(media_file.strip())

    return media_files

if __name__ == "__main__":
    # ファイルパスを指定する
    filename = "jawiki-country.json.gz"

    # 「イギリス」に関する記事本文中のメディアファイルを抽出する
    media_files = extract_media_files_uk(filename)

    # 抽出結果を表示する
    print(media_files)

['スコットランド・ゲール語', 'ウェールズ語', 'アイルランド語', 'コーンウォール語', 'スコットランド語', 'ファイル:Royal Coat of Arms of the United Kingdom.svg', 'イギリスの国章', 'Dieu et mon droit', 'フランス語', 'Dieu et mon droit', '女王陛下万歳', 'ファイル:United States Navy Band - God Save the Queen.ogg', '英語', 'ロンドン', 'イギリスの君主', 'エリザベス2世', 'イギリスの首相', 'ボリス・ジョンソン', '貴族院 (イギリス)', ':en:Norman Fowler, Baron Fowler', '庶民院 (イギリス)', '連合王国最高裁判所', ':en:Brenda Hale, Baroness Hale of Richmond', 'イングランド王国', 'スコットランド王国', '合同法 (1707年)', 'グレートブリテン王国', 'グレートブリテン及びアイルランド連合王国', '合同法 (1800年)', 'スターリング・ポンド', '.uk', '.gb', 'ヨーロッパ大陸', 'グレートブリテン島', 'アイルランド島', '立憲君主制', '国家', 'ロンドン', '日本語', '通称', '#国名', 'イングランド', 'ウェールズ', 'スコットランド', '北アイルランド', 'イギリスのカントリー', '同君連合', '主権国家体制', '連邦', '国際連合安全保障理事会常任理事国', 'G7', 'G20', 'ビッグ4 (ヨーロッパ)', 'ウィーン体制', '1815年', '列強', '民主主義', '立憲君主制', '擬人化', 'ジョン・ブル', 'ブリタニア (女神)', '日本語', '直訳と意訳', '連合王国', '日本放送協会', 'イギリス英語', '経済産業省', 'ポルトガル語', 'イングランド', '江戸時代', 'オランダ語', '幕末', '明治', '大正', '国名の漢字表記一覧', 'アメリカ合衆国', '二字熟語による往来表現の一覧', '合同法 (1707年)', 'イングランド王国