In [None]:
import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Map

# 读取数据
data = pd.read_csv('imdb_top_250_纯中文.csv', encoding='gbk')

# 国家名称映射（将中文国家名称映射为英文）
country_map = {
    '中国': 'China',
    '美国': 'United States',
    '日本': 'Japan',
    '英国': 'United Kingdom',
    '韩国': 'South Korea',
    '法国': 'France',
    '意大利': 'Italy',
    '德国': 'Germany',
    '澳大利亚': 'Australia',
    '印度': 'India',
    '瑞典': 'Sweden',
    '泰国': 'Thailand',
    '阿根廷': 'Argentina',
    '巴西': 'Brazil',
    '新西兰': 'New Zealand',
    '丹麦': 'Denmark',
    '伊朗': 'Iran',
    '西班牙': 'Spain',
    '黎巴嫩': 'Lebanon',
    '爱尔兰': 'Ireland',
    '俄罗斯': 'Russia',
    '加拿大': 'Canada',
    '马耳他': 'Malta',
    '摩洛哥': 'Morocco',
    '荷兰': 'Netherlands',
    '墨西哥': 'Mexico',
    '越南': 'Vietnam',
    '土耳其': 'Turkey',
    '波兰': 'Poland',
    '比利时': 'Belgium',
    '瑞士': 'Switzerland',
    '冰岛': 'Iceland',
    '挪威': 'Norway',
    '芬兰': 'Finland',
    '希腊': 'Greece',
    '匈牙利': 'Hungary',
    '奥地利': 'Austria',
    '葡萄牙': 'Portugal',
    '捷克': 'Czech Republic',
    '罗马尼亚': 'Romania',
    '保加利亚': 'Bulgaria',
    '塞尔维亚': 'Serbia',
    '斯洛伐克': 'Slovakia',
    '斯洛文尼亚': 'Slovenia',
    '克罗地亚': 'Croatia',
    '波黑': 'Bosnia and Herzegovina',
    '黑山': 'Montenegro',
    '阿尔巴尼亚': 'Albania',
    '北马其顿': 'North Macedonia',
    '爱沙尼亚': 'Estonia',
    '拉脱维亚': 'Latvia',
    '立陶宛': 'Lithuania',
    '白俄罗斯': 'Belarus',
    '乌克兰': 'Ukraine',
    '摩尔多瓦': 'Moldova',
    '格鲁吉亚': 'Georgia',
    '亚美尼亚': 'Armenia',
    '阿塞拜疆': 'Azerbaijan',
    '哈萨克斯坦': 'Kazakhstan',
    '乌兹别克斯坦': 'Uzbekistan',
    '土库曼斯坦': 'Turkmenistan',
    '吉尔吉斯斯坦': 'Kyrgyzstan',
    '塔吉克斯坦': 'Tajikistan',
    '阿富汗': 'Afghanistan',
    '巴基斯坦': 'Pakistan',
    '孟加拉国': 'Bangladesh',
    '尼泊尔': 'Nepal',
    '不丹': 'Bhutan',
    '斯里兰卡': 'Sri Lanka',
    '马尔代夫': 'Maldives',
    '以色列': 'Israel',
    '约旦': 'Jordan',
    '黎巴嫩': 'Lebanon',
    '叙利亚': 'Syria',
    '伊拉克': 'Iraq',
    '伊朗': 'Iran',
    '沙特阿拉伯': 'Saudi Arabia',
    '也门': 'Yemen',
    '阿曼': 'Oman',
    '阿联酋': 'United Arab Emirates',
    '卡塔尔': 'Qatar',
    '巴林': 'Bahrain',
    '科威特': 'Kuwait',
    '巴勒斯坦': 'Palestine',
    '埃及': 'Egypt',
    '苏丹': 'Sudan',
    '南苏丹': 'South Sudan',
    '利比亚': 'Libya',
    '突尼斯': 'Tunisia',
    '阿尔及利亚': 'Algeria',
    '摩洛哥': 'Morocco'
}

# 处理国家信息，确保每个国家都被正确统计
def process_countries(countries_str):
    # 分割国家字符串，去除空格，并过滤掉空字符串
    countries = [country.strip() for country in countries_str.split('/') if country.strip()]
    return countries

# 应用处理函数，将国家列转换为国家列表
data['国家列表'] = data['国家'].apply(process_countries)

# 初始化一个空字典来统计每个国家的电影数量
country_counts = {}

# 遍历每一行数据，统计每个国家的电影数量
for countries in data['国家列表']:
    for country in countries:
        if country in country_map:  # 只统计映射表中的国家
            mapped_country = country_map[country]
            if mapped_country in country_counts:
                country_counts[mapped_country] += 1
            else:
                country_counts[mapped_country] = 1

# 将国家和数量配对
data_pair = list(country_counts.items())

# 创建世界地图
map_chart = (
    Map(init_opts=opts.InitOpts(chart_id=2, bg_color='#ADD8E6'))
    .add("", data_pair, "world", is_map_symbol_show=False)
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
    .set_global_opts(
        title_opts=opts.TitleOpts(title="IMDbTop250各国电影分布图"),
        visualmap_opts=opts.VisualMapOpts(max_=120)
    )
)

map_chart.render_notebook()
output_path = 'IMDbTop250各国电影分布图.html'
map_chart.render(output_path)