In [1]:
# 导入包
import numpy as np
import pandas as pd
import os, json
from pyecharts.charts import Line, Pie, Bar, Grid, Geo, Map
import pyecharts.options as opts
from pyecharts.globals import ChartType, SymbolType, ThemeType # SymbolType标点的样式


# 解决pyecharts显示空白
from pyecharts.globals import CurrentConfig, NotebookType
CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_NOTEBOOK

In [2]:
pd.set_option('display.max_rows', None) # 显示所有行
pd.set_option('display.max_columns', None) # 显示所有列
# 文件根路径
filepath_cn = "./疫情数据/国内数据/"
filepath_fg = "./疫情数据/外国数据/"
filepath_visual = './部分可视化页面/'
if not os.path.exists(filepath_visual): # 先判断这个文件夹是否已存在\
        os.mkdir(filepath_visual)

In [3]:
# 格式化时间 传入pandas 的一列
def format_time(time_series):
    # 格式化时间
    time_series.drop_duplicates('日期', inplace=True, ignore_index=True) # 先去除重复的列
    start_time = str(time_series['日期'][0])
    if start_time[-2] == '.':
        start_time += '0' # 因为float型转为字符串1,2就少个0，应该是1.20，因此先把0加上
    start_time = start_time.replace('.', '/') + '/2020'
    # print(start_time)
    end_time = str(time_series['日期'][len(time_series['日期'])-1])
    if end_time[-2] == '.':
        end_time += '0'
    end_time = end_time.replace('.', '/') + '/2020'
    # print(end_time)
    time_series['日期'] = pd.date_range(start=start_time, end=end_time)
    time_series['日期'] = time_series['日期'].astype(str)
    # cn_prov_day_data['日期']

# 国内每日疫情数据变化可视化

## 全国每日累计数据可视化

In [4]:
#读取数据
china_day_data = pd.read_csv(filepath_cn+"国内历史每日数据.csv") # 这其实是每日累计数据
# 为了更直观看，将列名全部改为中文
china_day_data.columns = ['累计确诊', '累计疑似', '累计死亡', '累计治愈', '现有确诊', '现有重症患者', '境外输入', '死亡率', '治愈率', '日期', '无症状感染者']
format_time(china_day_data) # 格式化日期
china_day_data

Unnamed: 0,累计确诊,累计疑似,累计死亡,累计治愈,现有确诊,现有重症患者,境外输入,死亡率,治愈率,日期,无症状感染者
0,45,0,2,8,0,0,0,4.4,17.8,2020-01-16,0
1,62,0,2,12,0,0,0,3.2,19.4,2020-01-17,0
2,198,0,3,17,0,0,0,1.5,8.6,2020-01-18,0
3,275,0,4,18,0,0,0,1.5,6.5,2020-01-19,0
4,291,54,6,25,291,0,0,2.1,8.6,2020-01-20,0
5,440,37,9,25,431,0,0,2.0,5.7,2020-01-21,0
6,574,393,17,25,557,0,0,3.0,4.4,2020-01-22,0
7,835,1072,25,34,776,0,0,3.0,4.1,2020-01-23,0
8,1297,1965,41,38,1218,0,0,3.2,2.9,2020-01-24,0
9,1985,2684,56,49,1880,324,0,2.8,2.5,2020-01-25,0


In [5]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data['日期']])
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in china_day_data['累计确诊']], is_smooth=True)
    .add_yaxis(series_name='累计疑似', y_axis=[int(i) for i in china_day_data['累计疑似']], is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in china_day_data['累计死亡']], is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in china_day_data['累计治愈']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="全国每日累计数据可视化"), # 设置全局变量，比如标题、副标题和交互方法等
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )  # axis_pointer_type改变指示器类型，这样鼠标放图上就有辅助观察的线
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook() # 还是在当前直接显示比较方便查看

  super().__init__(init_opts=init_opts)


由图表可以得到全国疫情爆发主要集中在2月份，在3月份逐渐趋于平稳疫情得到大体控制。在2月8号全国累计疑似达到顶峰，紧接着累计确诊人数也在随后14天内增多，这说明累计疑似病例中大多数都成了确诊病例。不过进入三月份情况就好转了，趋势皆趋于平稳。

In [6]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data['日期']])
    .add_yaxis(series_name='境外输入', y_axis=[int(i) for i in china_day_data['境外输入']], areastyle_opts=opts.AreaStyleOpts(opacity=0.3), color="#4169E1")
    .set_global_opts(
        title_opts=opts.TitleOpts(title="全国每日累计境外输入可视化"), # 设置全局变量，比如标题、副标题和交互方法等
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


从图表上可以看到，在3月4日前没有境外输入的数据，但是那时候正是我国疫情最严重的时期，可以通过查阅新闻得知，在那之前是未记录统计境外输入病例，所有后边才有数据。
并且从图表来看，境外输入病例正趋于平稳上升阶段，可以知道只要外国疫情还没有稳定下来，国内还是会有境外输入病例的。

In [7]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data['日期']])
    .add_yaxis(series_name='死亡率', y_axis=[int(i) for i in china_day_data['死亡率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.5), color="green", is_smooth=True)
    .add_yaxis(series_name='治愈率', y_axis=[int(j) for j in china_day_data['治愈率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.3), color="grey", is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="全国每日死亡率和治愈率可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


这是累计数据，可以看到我国在二月中旬开始，治愈率开始大幅提高，同时还保证了极低的死亡率。可见我国处理紧急医疗卫生事件的能力是多么的强大。

## 历史每日新增确诊（湖北、全国、非湖北）

In [8]:
#读取数据
china_day_data2 = pd.read_csv(filepath_cn+"历史每日新增确诊数据（湖北、全国、和非湖北）.csv") 
# 为了更直观看，将列名全部改为中文
china_day_data2.columns = ['日期', '湖北', '全国', '非湖北']
format_time(china_day_data2) # 格式化日期
china_day_data2

Unnamed: 0,日期,湖北,全国,非湖北
0,2020-01-20,72,77,5
1,2020-01-21,105,149,44
2,2020-01-22,69,131,62
3,2020-01-23,105,259,154
4,2020-01-24,180,444,264
5,2020-01-25,323,688,365
6,2020-01-26,371,769,398
7,2020-01-27,1291,1771,480
8,2020-01-28,840,1459,619
9,2020-01-29,1032,1737,705


In [9]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data2['日期']])
    .add_yaxis(series_name='全国', y_axis=[int(i) for i in china_day_data2['全国']], is_smooth=True)
    .add_yaxis(series_name='湖北', y_axis=[int(i) for i in china_day_data2['湖北']], is_smooth=True)
    .add_yaxis(series_name='非湖北', y_axis=[int(i) for i in china_day_data2['非湖北']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="历史每日新增确诊（湖北、国家、非湖北）"), # 设置全局变量，比如标题、副标题和交互方法等
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )  # axis_pointer_type改变指示器类型，这样鼠标放图上就有辅助观察的线
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook() # 还是在当前直接显示比较方便查看

  super().__init__(init_opts=init_opts)


从图表看出武汉在新增确诊从一月底开始呈上升趋势，2月12号达到高峰（14840人），之后呈下降趋势到2月15日降到正常趋势，原因就是武汉雷神山医院收治了第一批转运过来的新冠肺炎患者，把临床诊断病例也确定为确诊病例

## 国内输入病例前十省

In [10]:
#读取数据
china_tenprov_inputdata = pd.read_csv(filepath_cn+"国内输入病例前十省.csv", encoding='GBK') # 这其实是每日累计数据
# 为了更直观看，将列名全部改为中文
china_tenprov_inputdata.columns = ['省份', '输入病例']
china_tenprov_inputdata

Unnamed: 0,省份,输入病例
0,上海,395
1,黑龙江,386
2,广东,266
3,北京,174
4,内蒙古,173
5,陕西,77
6,甘肃,75
7,福建,68
8,山西,67
9,天津,66


In [11]:
(
    Bar(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i for i in china_tenprov_inputdata['省份']])
    .add_yaxis(series_name='输入病例', y_axis=[int(i) for i in china_tenprov_inputdata['输入病例']])
    .set_global_opts(
        title_opts=opts.TitleOpts(title="国内输入病例前十省"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='省份'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True)) # 显示y轴刻度线
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


由图表可以看出，上海是境外输入病例最多的，这个都是外国坐飞机来国内的，而黑龙江排第二大多是由俄罗斯输入进来的。

## 国内各省每日数据

In [64]:
#读取数据
province = input("请输入要显示的省份：")
cn_prov_day_data = pd.read_csv(filepath_cn+"各省每日数据/"+province+".csv", encoding='GBK')
# 删除不需要的列
del cn_prov_day_data['country']
del cn_prov_day_data['province']
del cn_prov_day_data['confirm_cuts']
del cn_prov_day_data['dead_cuts']
del cn_prov_day_data['now_confirm_cuts']
del cn_prov_day_data['newConfirm'] # 与confirm_add列相同
del cn_prov_day_data['heal_cuts']
del cn_prov_day_data['description']
# 为了更直观看，将列名全部改为中文
cn_prov_day_data.columns = ['日期', '累计确诊', '累计死亡', '累计治愈', '新增确诊', '新增治愈', '新增死亡']
format_time(cn_prov_day_data) # 格式化日期
cn_prov_day_data

请输入要显示的省份：北京


Unnamed: 0,日期,累计确诊,累计死亡,累计治愈,新增确诊,新增治愈,新增死亡
0,2020-01-28,102,1,4,11,0,0
1,2020-01-29,111,1,4,9,0,0
2,2020-01-30,132,1,5,21,1,0
3,2020-01-31,156,1,5,24,0,0
4,2020-02-01,183,1,9,27,4,0
5,2020-02-02,212,1,12,29,3,0
6,2020-02-03,228,1,23,16,11,0
7,2020-02-04,253,1,24,25,1,0
8,2020-02-05,274,1,31,21,7,0
9,2020-02-06,297,1,33,23,2,0


In [65]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in cn_prov_day_data['日期']])
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in cn_prov_day_data['累计确诊']], is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in cn_prov_day_data['累计死亡']], is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in cn_prov_day_data['累计治愈']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{province} 每日累计数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")], # 添加最大值最小值
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8) # 最大值最小值的气泡
        ),
        label_opts=opts.LabelOpts(is_show=False), # 不显示每个点的标签
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


输入查看北京的每日累计数据，由图表可以看出，在三月中旬北京的累计数据趋于平稳，但是在6月1日开始突然累计确诊又开始增加，这是因为那段时间突然北京出现进口海鲜产品携带新冠病毒，导致又有人确诊新冠病毒，不过好在国家迅速做出反应，及时控制住了疫情的传播。

In [66]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in cn_prov_day_data['日期']])
    .add_yaxis(series_name='新增确诊', y_axis=[int(i) for i in cn_prov_day_data['新增确诊']], is_smooth=True)
    .add_yaxis(series_name='新增死亡', y_axis=[int(i) for i in cn_prov_day_data['新增死亡']], is_smooth=True)
    .add_yaxis(series_name='新增治愈', y_axis=[int(i) for i in cn_prov_day_data['新增治愈']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{province} 每日新增数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


输入查看北京的每日新增数据，由图表可以看出，北京的每日新增确诊在三月底已经为0，并维持了一段时间，但是到五月底又开始了，原因上面有讲，从新增治愈可以看出，很快这些确诊的病例都被成功治愈了，也没有一例新增死亡病例。

# 外国每日数据可视化

## 具体外国国家每日数据可视化

In [61]:
#读取数据
country = input("请输入想要查看的国家（除中国）：")
fg_country_day_data = pd.read_csv(filepath_fg+"部分国家历史每日数据/"+country+".csv", encoding='GBK')
# 为了更直观看，将列名全部改为中文
fg_country_day_data.columns = ['日期', '新增确诊', '累计确诊', '累计治愈', '累计死亡']
format_time(fg_country_day_data) # 格式化日期
fg_country_day_data

请输入想要查看的国家（除中国）：美国


Unnamed: 0,日期,新增确诊,累计确诊,累计治愈,累计死亡
0,2020-01-28,0,5,0,0
1,2020-01-29,0,5,0,0
2,2020-01-30,1,6,0,0
3,2020-01-31,0,6,0,0
4,2020-02-01,1,7,0,0
5,2020-02-02,1,8,0,0
6,2020-02-03,3,11,1,0
7,2020-02-04,0,11,1,0
8,2020-02-05,0,11,1,0
9,2020-02-06,1,12,1,0


In [63]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in fg_country_day_data['日期']])
    .add_yaxis(series_name='新增确诊', y_axis=[int(i) for i in fg_country_day_data['新增确诊']], is_smooth=True)
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in fg_country_day_data['累计确诊']], is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in fg_country_day_data['累计治愈']], is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in fg_country_day_data['累计死亡']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{country} 每日数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


这里我们输入查看美国的每日数据，从图表直观清晰的看出，美国的每日新增病例已经快接近每天7万了，都快赶上我国全部的累计确诊病例了（不到9万），而且从图表中可以看到，美国每日累计病例没有平稳下降的趋势，这说明美国这种状态还要持续一段时间，估计还要很久才能克服新冠疫情。

## 外国整体每日数据可视化

In [17]:
fg_day_data = pd.read_csv(filepath_fg+"全球历史每日数据.csv", encoding='GBK')
# 为了更直观看，将列名全部改为中文
fg_day_data.columns = ['日期', '累计确诊', '累计死亡', '累计治愈', '新增确诊', '死亡率', '治愈率']
format_time(fg_day_data) # 格式化日期
fg_day_data

Unnamed: 0,日期,累计确诊,累计死亡,累计治愈,新增确诊,死亡率,治愈率
0,2020-01-28,57,0,3,0,0.0,5.26
1,2020-01-29,74,0,3,13,0.0,4.05
2,2020-01-30,98,0,6,22,0.0,6.12
3,2020-01-31,124,0,11,20,0.0,8.87
4,2020-02-01,139,0,11,13,0.0,7.91
5,2020-02-02,149,1,11,10,0.67,7.38
6,2020-02-03,154,1,12,5,0.65,7.79
7,2020-02-04,177,1,19,22,0.56,10.73
8,2020-02-05,201,1,21,14,0.5,10.45
9,2020-02-06,225,1,25,24,0.44,11.11


In [67]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in fg_day_data['日期']])
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in fg_day_data['累计确诊']], areastyle_opts=opts.AreaStyleOpts(opacity=0.2), is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in fg_day_data['累计治愈']], areastyle_opts=opts.AreaStyleOpts(opacity=0.4), is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in fg_day_data['累计死亡']], areastyle_opts=opts.AreaStyleOpts(opacity=0.6), is_smooth=True)
    .add_yaxis(series_name='新增确诊', y_axis=[int(i) for i in fg_day_data['新增确诊']], areastyle_opts=opts.AreaStyleOpts(opacity=0.8), is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="外国整体 每日数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


可以看出外国整体在1月2月时都没有多少病例，这时候是我国疫情的爆发期，但是进入三月后外国的确诊人数逐渐增多，到现在仍没有缓和的趋势

In [68]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in fg_day_data['日期']])
    .add_yaxis(series_name='死亡率', y_axis=[int(i) for i in fg_day_data['死亡率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.8), color="green", is_smooth=True)
    .add_yaxis(series_name='治愈率', y_axis=[int(j) for j in fg_day_data['治愈率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.3), color="grey", is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="外国整体每日死亡率和治愈率可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


通过图表看出，新冠病毒的死亡率还是挺高的，而且这里死亡率4%，治愈率才60%，这说明还有一大部分人是在治疗还没治好的，这种趋势还会持续一段时间。

## 外国死亡率和治愈率排名前后10名可视化

In [20]:
fg_heal_ten_first = pd.read_csv(filepath_fg+"外国治愈前10名.csv", encoding='GBK') # 治愈前十名国家
fg_heal_ten_last = pd.read_csv(filepath_fg+"外国治愈后10名.csv", encoding='GBK') # 治愈后十名国家
fg_dead_ten_first = pd.read_csv(filepath_fg+"外国死亡率前10名.csv", encoding='GBK') # 死亡前十名国家
fg_deal_ten_last = pd.read_csv(filepath_fg+"外国死亡率后10名.csv", encoding='GBK') # 死亡后十名国家
# 为了更直观看，将列名全部改为中文
fg_heal_ten_first.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_heal_ten_last.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_dead_ten_first.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_deal_ten_last.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_heal_ten_last

Unnamed: 0,国家,累计确诊,累计治愈,累计死亡,治愈率,死亡率
0,瑞典,78504,0,5667,0.0,7.22
1,塞尔维亚,21605,0,491,0.0,2.27
2,荷兰,52475,194,6158,0.37,11.74
3,英国,297389,1414,45507,0.48,15.3
4,纳米比亚,1366,57,7,4.17,0.51
5,洪都拉斯,35345,4144,988,11.72,2.8
6,黑山,2381,426,35,17.89,1.47
7,巴勒斯坦,9398,1932,64,20.56,0.68
8,利比亚,2088,479,50,22.94,2.39
9,刚果（布）,2851,666,50,23.36,1.75


In [21]:
bar1 = (
    Bar()
    .add_xaxis([i for i in fg_heal_ten_first['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_heal_ten_first['治愈率']], color='green')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="治愈前十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)
bar2 = (
    Bar()
    .add_xaxis([i for i in fg_heal_ten_last['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_heal_ten_last['治愈率']], color='green')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="治愈后十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)
bar3 = (
    Bar()
    .add_xaxis([i for i in fg_dead_ten_first['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_dead_ten_first['死亡率']], color='grey')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="死亡前十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)
bar4 = (
    Bar()
    .add_xaxis([i for i in fg_deal_ten_last['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_deal_ten_last['死亡率']], color='gray')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="死亡后十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}), # interval:0让x轴刻度全部正常显示
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)

  super().__init__(init_opts=init_opts)
  super().__init__(init_opts=init_opts)
  super().__init__(init_opts=init_opts)
  super().__init__(init_opts=init_opts)


In [22]:
bar1.render_notebook()

In [23]:
bar2.render_notebook()

In [24]:
bar3.render_notebook()

In [25]:
bar4.render_notebook()

从治愈后十名国家数据可以看到前两名国家的治愈率为0，这不是数据错误，而是这两个国家没有公布治愈数据，因此只能放0，也可以看到英国的治愈率也不高，英国的抗疫也不太行，跟美国一个样。相反看死亡后十名国家，新加坡的死亡率就非常的低，他们这些国家对待抗疫就很积极认真，所以在会有这么低的死亡率。

## 外国24小时新增确诊前十名国家

In [26]:
fg_24hour_ten_newadd = pd.read_csv(filepath_fg+"外国24小时新增确诊前10名.csv", encoding='GBK') # 死亡后十名国家
# 为了更直观看，将列名全部改为中文
fg_24hour_ten_newadd.columns = ['国家', '新增确诊']
fg_24hour_ten_newadd

Unnamed: 0,国家,新增确诊
0,美国,62788
1,印度,37148
2,巴西,23529
3,南非,9300
4,哥伦比亚,6578
5,俄罗斯,5842
6,墨西哥,5311
7,西班牙,4581
8,阿根廷,4231
9,秘鲁,4090


In [27]:
(
    Bar()
    .add_xaxis([i for i in fg_24hour_ten_newadd['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_24hour_ten_newadd['新增确诊']], color='skyblue')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="24时新增确诊前十名国家"),
        tooltip_opts=opts.TooltipOpts(axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}), # x轴刻度显示完全
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


# 中国疫情地图可视化

## 国内整体疫情地图可视化

In [28]:
cn_all_data = pd.read_csv(filepath_cn+"中国疫情数据.csv", encoding='GBK')
# 为了更直观看，将列名全部改为中文
cn_all_data.columns = ['地区', '现有确诊', '累计确诊', '现有疑似', '累计死亡', '死亡率', '累计治愈', '治愈率']
cn_all_data.drop(labels=[0], axis=0, inplace=True) # 删除第一行，第一行是全国合计数据不需要显示
cn_all_data

Unnamed: 0,地区,现有确诊,累计确诊,现有疑似,累计死亡,死亡率,累计治愈,治愈率
1,香港,773,2131,0,14,0.66,1344,63.07
2,北京,87,929,0,9,0.97,833,89.67
3,新疆,64,140,0,3,2.14,73,52.14
4,上海,19,737,0,7,0.95,711,96.47
5,广东,16,1661,0,8,0.48,1637,98.56
6,内蒙古,9,250,0,1,0.4,240,96.0
7,台湾,8,455,0,7,1.54,440,96.7
8,四川,7,603,0,3,0.5,593,98.34
9,辽宁,6,165,0,2,1.21,157,95.15
10,山东,6,798,0,7,0.88,785,98.37


In [29]:
(
    Geo()
    .add_schema(maptype="china") # 使用中国地图 
    .add(
        series_name='现有确诊', 
        data_pair=[(i, j) for i, j in zip(cn_all_data['地区'], cn_all_data['现有确诊'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title="中国现有确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


可以看出北京、新疆、上海和香港是现有确诊最多的地方

In [71]:
pieces=[
    {"max": 4000000, "min": 1000000, "label": ">1000000", "color": "#C71585"},
    {"max": 999999, "min": 100000, "label": "100000-999999", "color": "#B40404"},
    {"max": 99999, "min": 10000, "label": "10000-99999", "color": "#DF0101"},
    {"max": 9999, "min": 1000, "label": "1000-9999", "color": "#F78181"},
    {"max": 999, "min": 500, "label": "500-999", "color": "#F5A9A9"},
    {"max": 499, "min": 0, "label": "0-499", "color": "#AAAAAA"},
]
# 颜色块
(
    Geo()
    .add_schema(maptype="china") # 使用中国地图 
    .add(
        series_name='累计确诊', 
        data_pair=[(i, j) for i, j in zip(cn_all_data['地区'], cn_all_data['累计确诊'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title="中国累计确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义的颜色块
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


主要还是集中在湖北及周边地区，西部和西北部和西南部确诊病例很少。

In [31]:
(
    Geo()
    .add_schema(maptype="china") # 使用中国地图 
    .add(
        series_name='累计死亡', 
        data_pair=[(i, j) for i, j in zip(cn_all_data['地区'], cn_all_data['累计死亡'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title="中国累计死亡"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


由图表可知截止到7/21号西藏、青岛、宁夏、山西、江苏、澳门没有一人死亡，大部分城市死亡人数不到10人，死亡人数主要集中在湖北地区。

In [72]:
(
    Geo()
    .add_schema(maptype="china") # 使用中国地图 
    .add(
        series_name='累计治愈', 
        data_pair=[(i, j) for i, j in zip(cn_all_data['地区'], cn_all_data['累计治愈'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title="中国累计治愈"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义的颜色块
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


通过观察中国累积确诊散点图和中国累积治愈散点图，发现两个图之间相差不大，可以观察到疫情爆发大多集中在湖北周围省以及沿海国际交流发达大城市。

In [33]:
# 各省治愈率死亡率可视化
(
    Bar(init_opts=opts.InitOpts(width='1200px'))
    .add_xaxis([i for i in cn_all_data['地区']])
    .add_yaxis(series_name='死亡率', y_axis=[i for i in cn_all_data['死亡率']], color='green', stack='stack1')
    .add_yaxis(series_name='治愈率', y_axis=[i for i in cn_all_data['治愈率']], color='grey', stack='stack1')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="国内各省治愈率和死亡率"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='地区', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
).render_notebook()

  super().__init__(init_opts=init_opts)


## 各省具体疫情地图可视化

In [34]:
prov = input("请输入要查看的省：")
cn_prov_data = pd.read_csv(filepath_cn+f"各省具体数据/{prov}.csv", encoding='GBK')
# 删除不需要的列
if '境外输入' in cn_prov_data['name'].values.tolist():
    cn_prov_data = cn_prov_data[~cn_prov_data.isin(['境外输入'])].dropna(axis=0)
if '地区待确认' in cn_prov_data['name'].values.tolist():
    cn_prov_data = cn_prov_data[~cn_prov_data.isin(['地区待确认'])].dropna(axis=0)
if '外地来京' in cn_prov_data['name'].values.tolist():
    cn_prov_data = cn_prov_data[~cn_prov_data.isin(['外地来京'])].dropna(axis=0)

# 为了更直观看，将列名全部改为中文
cn_prov_data.columns = ['地区', '现有确诊', '累计确诊', '现有疑似', '累计死亡', '死亡率', '累计治愈', '治愈率']
cn_prov_data.drop(labels=[0], axis=0, inplace=True) # 删除第一行，第一行是具体省合计数据不需要显示
cn_prov_data

请输入要查看的省：北京


Unnamed: 0,地区,现有确诊,累计确诊,现有疑似,累计死亡,死亡率,累计治愈,治愈率
1,丰台,230,273,0,0,0.0,43,15.75
2,大兴,65,104,0,0,0.0,39,37.5
3,海淀,18,82,0,0,0.0,64,78.05
4,西城,6,59,0,0,0.0,53,89.83
5,东城,5,19,0,0,0.0,14,73.68
6,房山,4,20,0,0,0.0,16,80.0
7,门头沟,2,5,0,0,0.0,3,60.0
8,朝阳,2,77,0,0,0.0,75,97.4
9,通州,1,20,0,9,45.0,10,50.0
10,石景山,1,15,0,0,0.0,14,93.33


In [74]:
(
    Geo()
    .add_schema(maptype=f'{prov}') # 使用中国地图 
    .add(
        series_name='现有确诊', 
        data_pair=[(i, j) for i, j in zip(cn_prov_data['地区'], cn_prov_data['现有确诊'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f'{prov}现有确诊'),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


In [36]:
(
    Geo()
    .add_schema(maptype=f'{prov}') # 使用中国地图 
    .add(
        series_name='累计确诊', 
        data_pair=[(i, j) for i, j in zip(cn_prov_data['地区'], cn_prov_data['累计确诊'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f'{prov}累计确诊'),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


In [38]:
(
    Geo()
    .add_schema(maptype=f'{prov}') # 使用中国地图 
    .add(
        series_name='累计治愈', 
        data_pair=[(i, j) for i, j in zip(cn_prov_data['地区'], cn_prov_data['累计治愈'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f'{prov}累计治愈'),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


In [39]:
# 各省治愈率死亡率可视化
(
    Bar(init_opts=opts.InitOpts())
    .add_xaxis([i for i in cn_prov_data['地区']])
    .add_yaxis(series_name='死亡率', y_axis=[i for i in cn_prov_data['死亡率']], color='green', stack='stack1')
    .add_yaxis(series_name='治愈率', y_axis=[i for i in cn_prov_data['治愈率']], color='grey', stack='stack1')
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{prov}治愈率和死亡率"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='地区', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
).reversal_axis().render_notebook()

  super().__init__(init_opts=init_opts)


## 各省境外输入可视化

In [40]:
provinces_input_list = []
provinces = ['安徽', '澳门', '香港', '北京', '福建', '甘肃', '广东', '广西', '贵州', '海南', '河北', '河南', '黑龙江', '湖北', '湖南', '吉林', '江苏', '江西', '辽宁', '内蒙古', '宁夏', '青海', '山东', '山西', '陕西', '上海', '四川', '台湾', '天津', '西藏', '香港', '新疆', '云南', '浙江', '重庆']
for p in provinces:
    prov_data = pd.read_csv(filepath_cn+f"各省具体数据/{p}.csv", encoding='GBK')
    prov_data.columns = ['地区', '现有确诊', '累计确诊', '现有疑似', '累计死亡', '死亡率', '累计治愈', '治愈率']

    if '境外输入' in prov_data['地区'].values.tolist(): # 不一定所有的省都有境外输入
        input_data = prov_data.loc[prov_data['地区']=='境外输入', :].values.tolist()[0]
        input_data[0] = p # 将第一个字段原本的 境外输入 改成 具体的省份名称
        provinces_input_list.append(input_data)

# 生成DataFrame数据
provinces_input_data = pd.DataFrame(provinces_input_list, columns=['地区', '现有确诊', '累计确诊', '现有疑似', '累计死亡', '死亡率', '累计治愈', '治愈率'])
provinces_input_data

Unnamed: 0,地区,现有确诊,累计确诊,现有疑似,累计死亡,死亡率,累计治愈,治愈率
0,安徽,0,1,0,0,0.0,1,100.0
1,北京,0,174,0,0,0.0,174,100.0
2,福建,2,68,0,0,0.0,66,97.06
3,甘肃,0,75,0,0,0.0,75,100.0
4,广东,16,266,0,0,0.0,250,93.98
5,广西,1,3,0,0,0.0,2,66.67
6,贵州,0,1,0,0,0.0,1,100.0
7,海南,0,2,0,0,0.0,2,100.0
8,河北,0,10,0,0,0.0,10,100.0
9,河南,0,3,0,0,0.0,3,100.0


In [41]:
(
    Geo()
    .add_schema(maptype="china") # 使用中国地图 
    .add(
        series_name='现有确诊', 
        data_pair=[(i, j) for i, j in zip(provinces_input_data['地区'], provinces_input_data['现有确诊'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title="中国境外输入 现有确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


In [42]:
(
    Geo()
    .add_schema(maptype="china") # 使用中国地图 
    .add(
        series_name='累计确诊', 
        data_pair=[(i, j) for i, j in zip(provinces_input_data['地区'], provinces_input_data['累计确诊'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title="中国境外输入 累计确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


In [43]:
(
    Geo()
    .add_schema(maptype="china") # 使用中国地图 
    .add(
        series_name='累计治愈', 
        data_pair=[(i, j) for i, j in zip(provinces_input_data['地区'], provinces_input_data['累计治愈'])], # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        type_=ChartType.EFFECT_SCATTER # 图的类型为特效散点图
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title="中国境外输入 累计治愈"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=False) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


# 外国疫情地图可视化

## 外国整体数据可视化

In [46]:
pieces=[
    {"max": 4000000, "min": 1000000, "label": ">1000000", "color": "#C71585"},
    {"max": 999999, "min": 100000, "label": "100000-999999", "color": "#B40404"},
    {"max": 99999, "min": 10000, "label": "10000-99999", "color": "#DF0101"},
    {"max": 9999, "min": 1000, "label": "1000-9999", "color": "#F78181"},
    {"max": 999, "min": 500, "label": "500-999", "color": "#F5A9A9"},
    {"max": 499, "min": 0, "label": "0-499", "color": "#AAAAAA"},
]
# 颜色块

In [47]:
nameMap = {
        'Afghanistan':'阿富汗','Albania':'阿尔巴尼亚','Algeria':'阿尔及利亚', 'Andorra':'安道尔','Angola':'安哥拉', 'Antarctica':'南极洲',
        'Antigua and Barbuda':'安提瓜和巴布达','Argentina':'阿根廷','Armenia':'亚美尼亚','Australia':'澳大利亚','Austria':'奥地利',
        'Azerbaijan':'阿塞拜疆','The Bahamas':'巴哈马','Bahrain':'巴林','Bangladesh':'孟加拉','Barbados':'巴巴多斯','Belarus':'白俄罗斯',
        'Belgium':'比利时','Belize':'伯利兹','Benin':'贝宁','Bermuda':'百慕大','Bhutan':'不丹','Bolivia':'玻利维亚','Bosnia and Herzegovina':'波黑',
        'Botswana':'博茨瓦纳','Brazil':'巴西','Brunei':'文莱','Bulgaria':'保加利亚','Burkina Faso':'布基纳法索','Burundi':'布隆迪','Cambodia':'柬埔寨',
        'Cameroon':'喀麦隆','Canada':'加拿大','Cape Verde':'佛得角','Central African Rep.':'中非共和国','Chad':'乍得','Chile':'智利','China':'中国',
        'Colombia':'哥伦比亚','Comoros':'科摩罗','Republic of the Congo':'刚果（布）','Costa Rica':'哥斯达黎加','Croatia':'克罗地亚','Cuba':'古巴',
        'Cyprus':'塞浦路斯','Czech Republic':'捷克','Djibouti':'吉布提','The Commonwealth of Dominica':'多米尼克','Dominican Republic':'多米尼加',
        'Ecuador':'厄瓜多尔','Egypt':'埃及','El Salvador':'萨尔瓦多','Equatorial Guinea':'赤道几内亚','Eritrea':'厄立特里亚','Estonia':'爱沙尼亚',
        'Ethiopia':'埃塞俄比亚','Falkland Islands':'福克兰群岛','Faroe Islands':'法罗群岛','Fiji':'斐济','Finland':'芬兰','France':'法国','French Guiana':'法属圭亚那',
        'French Southern and Antarctic Lands':'法属南半球和南极领地','Gabon':'加蓬','Gambia':'冈比亚','Gaza Strip':'巴勒斯坦','Georgia':'格鲁吉亚',
        'Germany':'德国','Ghana':'加纳','Greece':'希腊','Greenland':'丹麦','Grenada':'格林纳达','Guadeloupe':'瓜德罗普','Guatemala':'危地马拉',
        'Guinea':'几内亚','Guinea Bissau':'几内亚比绍','Guyana':'圭亚那','Haiti':'海地','Honduras':'洪都拉斯','Hong Kong':'香港','Hungary':'匈牙利',
        'Iceland':'冰岛','India':'印度','Indonesia':'印度尼西亚','Iran':'伊朗','Iraq':'伊拉克','Iraq-Saudi Arabia Neutral Zone':'伊拉克阿拉伯中立区',
        'Ireland':'爱尔兰','Isle of Man':'马恩岛','Israel':'以色列','Italy':'意大利',"Côte d'Ivoire":"科特迪瓦",'Jamaica':'牙买加','Jan Mayen':'扬马延岛',
        'Japan':'日本本土','Jordan':'约旦','Kazakhstan':'哈萨克斯坦','Kenya':'肯尼亚','Kerguelen':'凯尔盖朗群岛','Kiribati':'基里巴斯','North Korea':'北朝鲜',
        'South Korea':'韩国','Kuwait':'科威特','Kyrgyzstan':'吉尔吉斯斯坦','Laos':'老挝','Latvia':'拉脱维亚','Lebanon':'黎巴嫩','Lesotho':'莱索托',
        'Liberia':'利比里亚','Libya':'利比亚','Liechtenstein':'列支敦士登公国','Lithuania':'立陶宛','Luxembourg':'卢森堡','Macau':'澳门','Macedonia':'北马其顿',
        'Madagascar':'马达加斯加','Malawi':'马拉维','Malaysia':'马来西亚','Maldives':'马尔代夫','Mali':'马里','Malta':'马耳他','Martinique':'马提尼克',
        'Mauritania':'毛里塔尼亚','Mauritius':'毛里求斯','Mexico':'墨西哥','Moldova':'摩尔多瓦','Monaco':'摩纳哥','Mongolia':'蒙古','Morocco':'摩洛哥',
        'Mozambique':'莫桑比克','Myanmar':'缅甸','Namibia':'纳米比亚','Nepal':'尼泊尔','Netherlands':'荷兰','New Caledonia':'新喀里多尼亚','New Zealand':'新西兰',
        'Nicaragua':'尼加拉瓜','Niger':'尼日尔','Nigeria':'尼日利亚','Northern Mariana Islands':'北马里亚纳群岛','Norway':'挪威','Oman':'阿曼',
        'Pakistan':'巴基斯坦','Panama':'巴拿马','Papua New Guinea':'巴布亚新几内亚','Paraguay':'巴拉圭','Peru':'秘鲁','Philippines':'菲律宾',
        'Poland':'波兰','Portugal':'葡萄牙','Puerto Rico':'波多黎各','Qatar':'卡塔尔','Reunion':'留尼旺岛','Romania':'罗马尼亚','Russia':'俄罗斯',
        'Rwanda':'卢旺达','San Marino':'圣马力诺','Sao Tome and Principe':'圣多美和普林西比','Saudi Arabia':'沙特阿拉伯', 'Senegal':'塞内加尔',
        'Seychelles':'塞舌尔','Sierra Leone':'塞拉利昂','Singapore':'新加坡','Slovakia':'斯洛伐克','Slovenia':'斯洛文尼亚','Solomon Islands':'所罗门群岛',
        'Somalia':'索马里','South Africa':'南非','Spain':'西班牙','Sri Lanka':'斯里兰卡','St. Christopher-Nevis':'圣','St. Lucia':'圣卢西亚',
        'St. Vincent and the Grenadines':'圣文森特和格林纳丁斯','Sudan':'苏丹','Suriname':'苏里南','Svalbard':'斯瓦尔巴特群岛','Swaziland':'斯威士兰',
        'Sweden':'瑞典','Switzerland':'瑞士','Syria':'叙利亚','Taiwan':'台湾','Tajikistan':'塔吉克斯坦','Tanzania':'坦桑尼亚',
        'Thailand':'泰国','Togo':'多哥','Tonga':'汤加','Trinidad and Tobago':'特里尼达和多巴哥','Tunisia':'突尼斯','Turkey':'土耳其','Turkmenistan':'土库曼斯坦',
        'Turks and Caicos Islands':'特克斯和凯科斯群岛','Uganda':'乌干达','Ukraine':'乌克兰','United Arab Emirates':'阿联酋','United Kingdom':'英国',
        'United States':'美国','Uruguay':'乌拉圭','Uzbekistan':'乌兹别克斯坦','Vanuatu':'瓦努阿图','Venezuela':'委内瑞拉','Vietnam':'越南',
        'Western Sahara':'西撒哈拉','Western Samoa':'西萨摩亚','Yemen':'也门','Yugoslavia':'南斯拉夫','Dem. Rep. Congo':'刚果（金）',
        'Zambia':'赞比亚','Zimbabwe':'津巴布韦','S. Sudan':'南苏丹','Somaliland':'索马里兰','Montenegro':'黑山','Kosovo':'科索沃','Republic of Serbia':'塞尔维亚',
        'The Federation of Saint Kitts and Nevis':'圣基茨和尼维斯'
        }

country_names = {v:k for k, v in nameMap.items()} # 键值对互换
country_names

{'阿富汗': 'Afghanistan',
 '阿尔巴尼亚': 'Albania',
 '阿尔及利亚': 'Algeria',
 '安道尔': 'Andorra',
 '安哥拉': 'Angola',
 '南极洲': 'Antarctica',
 '安提瓜和巴布达': 'Antigua and Barbuda',
 '阿根廷': 'Argentina',
 '亚美尼亚': 'Armenia',
 '澳大利亚': 'Australia',
 '奥地利': 'Austria',
 '阿塞拜疆': 'Azerbaijan',
 '巴哈马': 'The Bahamas',
 '巴林': 'Bahrain',
 '孟加拉': 'Bangladesh',
 '巴巴多斯': 'Barbados',
 '白俄罗斯': 'Belarus',
 '比利时': 'Belgium',
 '伯利兹': 'Belize',
 '贝宁': 'Benin',
 '百慕大': 'Bermuda',
 '不丹': 'Bhutan',
 '玻利维亚': 'Bolivia',
 '波黑': 'Bosnia and Herzegovina',
 '博茨瓦纳': 'Botswana',
 '巴西': 'Brazil',
 '文莱': 'Brunei',
 '保加利亚': 'Bulgaria',
 '布基纳法索': 'Burkina Faso',
 '布隆迪': 'Burundi',
 '柬埔寨': 'Cambodia',
 '喀麦隆': 'Cameroon',
 '加拿大': 'Canada',
 '佛得角': 'Cape Verde',
 '中非共和国': 'Central African Rep.',
 '乍得': 'Chad',
 '智利': 'Chile',
 '中国': 'China',
 '哥伦比亚': 'Colombia',
 '科摩罗': 'Comoros',
 '刚果（布）': 'Republic of the Congo',
 '哥斯达黎加': 'Costa Rica',
 '克罗地亚': 'Croatia',
 '古巴': 'Cuba',
 '塞浦路斯': 'Cyprus',
 '捷克': 'Czech Republic',
 '吉布提': 'Djibouti',
 '多米尼克': '

In [48]:
world_all_data = pd.read_csv(filepath_fg+"外国疫情数据（按国家或大洲查看）.csv", encoding='GBK')
day = world_all_data['date'][0]
world_all_data

Unnamed: 0,name,continent,date,isUpdated,confirmAdd,confirmAddCut,confirm,suspect,dead,heal,nowConfirm,confirmCompare,nowConfirmCompare,healCompare,deadCompare
0,美国,北美洲,7.22,True,67140,0,4028569,0,144953,1886583,1997033,67140,29427,36594,1119
1,巴西,南美洲,7.22,False,41008,0,2159654,0,81487,1563382,514785,41008,-2298,41939,1367
2,印度,亚洲,7.22,False,37724,0,1193078,0,28732,753050,411296,37724,8604,28472,648
3,俄罗斯,欧洲,7.22,False,5806,0,787846,0,12722,570984,204140,5806,-3942,9587,161
4,南非,非洲,7.22,False,8170,0,381798,0,5368,208144,168286,8170,-5304,13279,195
5,秘鲁,南美洲,7.22,False,8497,0,362087,0,13579,248746,99762,8497,4440,3665,392
6,墨西哥,北美洲,7.22,False,6859,0,356255,0,40400,267407,48448,6859,1628,4316,915
7,智利,南美洲,7.22,False,3753,0,334683,0,8677,306816,19190,3753,-1443,5022,174
8,西班牙,欧洲,7.22,True,1358,0,313274,0,28424,196958,87892,1358,1356,0,2
9,英国,欧洲,7.22,False,0,0,297389,0,45507,1414,250468,0,-1,1,0


In [49]:
# 读取中国数据
china_data = pd.read_csv(filepath_cn+"中国疫情数据.csv", encoding='GBK').loc[0, :]
china_data

name             中国
nowConfirm     1014
confirm       86340
suspect           1
dead           4655
deadRate       5.39
heal          80671
healRate      93.43
Name: 0, dtype: object

In [50]:
# 读取中国数据
china_data2 = pd.read_csv(filepath_cn+"国内历史每日新增数据.csv", encoding='GBK').iloc[-1, :]
china_data2

confirm         74.00
suspect          0.00
dead             2.00
heal            45.00
importedCase     5.00
infect          22.00
deadRate         2.70
healRate        60.80
date             7.21
Name: 180, dtype: float64

In [75]:
data_pair_list = [(country_names[i], int(j)) for i, j in zip(world_all_data['name'], world_all_data['confirm']) if i in country_names]
data_pair_list.append(('China', int(china_data['confirm'])))
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC, width='1600px', height='800px'))
    .add(
        maptype="world", # 使用世界地图
        series_name='累计确诊', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    ) # 也可以隐藏地图上的文字显示，不过悬浮点上的时候还是可以显示的 
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"世界 {day} 累计确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 视觉印象配置项 is_piecewise=True就不是连续的颜色了，而是拆分成块了
    )
).render(f"{filepath_visual}世界 {day} 累计确诊.html")

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\世界 7.22 累计确诊.html'

In [76]:
data_pair_list = [(country_names[i], int(j)) for i, j in zip(world_all_data['name'], world_all_data['confirmAdd']) if i in country_names]
data_pair_list.append(('China', int(china_data2['confirm'])))
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC, width='1600px', height='800px'))
    .add(
        maptype="world", # 使用世界地图
        series_name='新增确诊', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"世界 {day} 新增确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义颜色范围
    )
).render(f"{filepath_visual}世界 {day} 新增确诊.html")

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\世界 7.22 新增确诊.html'

In [77]:
data_pair_list = [(country_names[i], int(j)) for i, j in zip(world_all_data['name'], world_all_data['dead']) if i in country_names]
data_pair_list.append(('China', int(china_data['dead'])))
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC, width='1600px', height='800px'))
    .add(
        maptype="world", # 使用世界地图
        series_name='累计死亡', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"世界 {day} 累计死亡"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义颜色范围
    )
).render(f"{filepath_visual}世界 {day} 累计死亡.html")

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\世界 7.22 累计死亡.html'

In [78]:
data_pair_list = [(country_names[i], int(j)) for i, j in zip(world_all_data['name'], world_all_data['heal']) if i in country_names]
data_pair_list.append(('China', int(china_data['heal'])))
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC, width='1600px', height='800px'))
    .add(
        maptype="world", # 使用世界地图
        series_name='累计治愈', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"世界 {day} 累计治愈"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义颜色范围
    )
).render(f"{filepath_visual}世界 {day} 累计治愈.html")

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\世界 7.22 累计治愈.html'

In [79]:
data_pair_list = [(country_names[i], int(j)) for i, j in zip(world_all_data['name'], world_all_data['nowConfirm']) if i in country_names]
data_pair_list.append(('China', int(china_data['nowConfirm'])))
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC, width='1600px', height='800px'))
    .add(
        maptype="world", # 使用世界地图
        series_name='现有确诊', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"世界 {day} 现有确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义颜色范围
    )
).render(f"{filepath_visual}世界 {day} 现有确诊.html")

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\世界 7.22 现有确诊.html'

## 部分国家具体行政区可视化

In [56]:
from pyecharts.datasets import register_url
register_url("https://echarts-maps.github.io/echarts-countries-js/")

In [57]:
# 可选国家有：韩国、美国、日本（用输入日本本土）、伊朗、意大利、英国
country = input('请输入想查看具体行政区的国家：')
country_region_data = pd.read_csv(filepath_fg+f"部分国家具体行政区数据/{country}-具体行政区数据.csv", encoding='GBK')
day = country_region_data['date'][0]
if country == '日本本土':
    country = '日本'
country_region_data

请输入想查看具体行政区的国家：美国


Unnamed: 0,name,date,nameMap,isUpdated,confirmAdd,confirmAddCut,confirm,suspect,dead,heal
0,纽约,7.22,New York,True,0,0,413315,0,32520,58366
1,加利福尼亚,7.22,California,True,0,0,409305,0,7890,108711
2,佛罗里达,7.22,Florida,True,0,0,369834,0,5206,381
3,德克萨斯,7.22,Texas,True,0,0,351113,0,4213,186529
4,新泽西,7.22,New Jersey,True,0,0,177256,0,15826,3973
5,伊利诺伊,7.22,Illinois,True,0,0,163689,0,7324,75880
6,乔治亚,7.22,Georgia,True,0,0,148988,0,3254,340
7,亚利桑那,7.22,Arizona,True,0,0,148683,0,2918,174
8,马萨诸塞,7.22,Massachusetts,True,0,0,114033,0,8450,94347
9,宾夕法尼亚,7.22,Pennsylvania,True,0,0,107414,0,7046,1369


In [58]:
data_pair_list = [(i, int(j)) for i, j in zip(country_region_data['nameMap'], country_region_data['confirm'])]
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC))
    .add(
        maptype=country, # 使用具体国家地图
        series_name='累计确诊', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{country}{day} 累计确诊"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义颜色范围
    )
).render(f'{filepath_visual}{country}{day} 累计确诊.html')

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\美国7.22 累计确诊.html'

In [59]:
data_pair_list = [(i, int(j)) for i, j in zip(country_region_data['nameMap'], country_region_data['dead'])]
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC))
    .add(
        maptype=country, # 使用具体国家地图
        series_name='累计死亡', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{country}{day} 累计死亡"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义颜色范围
    )
).render(f'{filepath_visual}{country}{day} 累计死亡.html')

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\美国7.22 累计死亡.html'

In [60]:
data_pair_list = [(i, int(j)) for i, j in zip(country_region_data['nameMap'], country_region_data['heal'])]
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.ROMANTIC))
    .add(
        maptype=country, # 使用具体国家地图
        series_name='累计治愈', 
        data_pair=data_pair_list, # data_pair是放数据的地方，类别和属性值
        label_opts=opts.LabelOpts(is_show=False),
        is_map_symbol_show=False,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{country}{day} 累计治愈"),
        visualmap_opts=opts.VisualMapOpts(is_piecewise=True, pieces=pieces) # 使用自定义颜色范围
    )
).render(f'{filepath_visual}{country}{day} 累计治愈.html')

  super().__init__(init_opts=init_opts)


'C:\\Users\\Jarvis\\Desktop\\Python实习\\PythonInternship\\Python爬虫学习\\部分可视化页面\\美国7.22 累计治愈.html'