In [2]:
pip install geopandas matplotlib pandas


Note: you may need to restart the kernel to use updated packages.


In [1]:
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt

# 省份名称映射字典
province_mapping = {
    '北京市': 'Beijing',
    '天津市': 'Tianjin',
    '河北省': 'Hebei',
    '山西省': 'Shanxi',
    '内蒙古自治区': 'Nei Mongol',
    '辽宁省': 'Liaoning',
    '吉林省': 'Jilin',
    '黑龙江省': 'Heilongjiang',
    '上海市': 'Shanghai',
    '江苏省': 'Jiangsu',
    '浙江省': 'Zhejiang',
    '安徽省': 'Anhui',
    '福建省': 'Fujian',
    '江西省': 'Jiangxi',
    '山东省': 'Shandong',
    '河南省': 'Henan',
    '湖北省': 'Hubei',
    '湖南省': 'Hunan',
    '广东省': 'Guangdong',
    '广西壮族自治区': 'Guangxi',
    '海南省': 'Hainan',
    '重庆市': 'Chongqing',
    '四川省': 'Sichuan',
    '贵州省': 'Guizhou',
    '云南省': 'Yunnan',
    '西藏自治区': 'Xizang',
    '陕西省': 'Shaanxi',
    '甘肃省': 'Gansu',
    '青海省': 'Qinghai',
    '宁夏回族自治区': 'Ningxia',
    '新疆维吾尔自治区': 'Xinjiang',
    '台湾省': 'Taiwan',
    '香港特别行政区': 'Hong Kong',
    '澳门特别行政区': 'Macau'
}

# 加载 shapefile 文件
shapefile_path = 'gadm41_CHN_shp/gadm41_CHN_1.shp'
china_map = gpd.read_file(shapefile_path)

# 假设 province_group 是你已经准备好的包含省份、评论数和评分的 DataFrame
province_group = pd.DataFrame({
    'IP': ['上海', '北京', '广东', '江苏', '浙江', '山东', '四川', '辽宁', '湖北', '陕西'],
    'comment_count': [142, 98, 147, 123, 110, 87, 65, 58, 43, 37],
    'avg_rating': [4.5, 4.3, 4.6, 4.4, 4.5, 4.2, 4.4, 4.3, 4.1, 4.2]
})

# 映射数据中省份的中文名到英文名
province_group['Province_CN'] = province_group['IP'].map(province_mapping)

# 合并地理数据和评论数据
merged_data = china_map.set_index('NAME_1').join(province_group.set_index('Province_CN'))

# 绘制地图
fig, ax = plt.subplots(1, 1, figsize=(15, 12))

# 绘制并显示完整中国地图
merged_data.plot(column='avg_rating', ax=ax, legend=True, cmap='OrRd', edgecolor='black')

# 调整标注显示效果
for idx, row in merged_data.iterrows():
    if pd.notna(row['comment_count']):
        plt.annotate(text=f"{int(row['comment_count'])} comments\n{row['avg_rating']:.1f} rating",
                     xy=(row['geometry'].centroid.x, row['geometry'].centroid.y),
                     horizontalalignment='center', fontsize=8, color='black')

ax.set_title("Food-related Comments and Average Rating by Province")
ax.axis('off')

plt.show()


DriverError: gadm41_CHN_shp/gadm41_CHN_1.shp: No such file or directory