In [1]:
# 导入包
import numpy as np
import pandas as pd
import os, json
from pyecharts.charts import Line, Pie, Bar, Grid, Geo, Map
import pyecharts.options as opts
from pyecharts.globals import ChartType, SymbolType, ThemeType # SymbolType标点的样式


# 解决pyecharts显示空白
from pyecharts.globals import CurrentConfig, NotebookType
CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_NOTEBOOK

In [2]:
pd.set_option('display.max_rows', None) # 显示所有行
pd.set_option('display.max_columns', None) # 显示所有列
# 文件根路径
filepath_cn = "./疫情数据/国内数据/"
filepath_fg = "./疫情数据/外国数据/"
filepath_visual = './部分可视化页面/'
if not os.path.exists(filepath_visual): # 先判断这个文件夹是否已存在\
        os.mkdir(filepath_visual)

In [3]:
# 格式化时间 传入pandas 的一列
def format_time(time_series):
    # 格式化时间
    time_series.drop_duplicates('日期', inplace=True, ignore_index=True) # 先去除重复的列
    start_time = str(time_series['日期'][0])
    if start_time[-2] == '.':
        start_time += '0' # 因为float型转为字符串1,2就少个0，应该是1.20，因此先把0加上
    start_time = start_time.replace('.', '/') + '/2020'
    # print(start_time)
    end_time = str(time_series['日期'][len(time_series['日期'])-1])
    if end_time[-2] == '.':
        end_time += '0'
    end_time = end_time.replace('.', '/') + '/2020'
    # print(end_time)
    time_series['日期'] = pd.date_range(start=start_time, end=end_time)
    time_series['日期'] = time_series['日期'].astype(str)
    # cn_prov_day_data['日期']

# 国内每日疫情数据变化可视化

## 全国每日累计数据可视化

In [4]:
#读取数据
china_day_data = pd.read_csv(filepath_cn+"国内历史每日数据.csv") # 这其实是每日累计数据
# 为了更直观看，将列名全部改为中文
china_day_data.columns = ['累计确诊', '累计疑似', '累计死亡', '累计治愈', '现有确诊', '现有重症患者', '境外输入', '死亡率', '治愈率', '日期', '无症状感染者']
format_time(china_day_data) # 格式化日期
china_day_data

Unnamed: 0,累计确诊,累计疑似,累计死亡,累计治愈,现有确诊,现有重症患者,境外输入,死亡率,治愈率,日期,无症状感染者
0,45,0,2,8,0,0,0,4.4,17.8,2020-01-16,0
1,62,0,2,12,0,0,0,3.2,19.4,2020-01-17,0
2,198,0,3,17,0,0,0,1.5,8.6,2020-01-18,0
3,275,0,4,18,0,0,0,1.5,6.5,2020-01-19,0
4,291,54,6,25,291,0,0,2.1,8.6,2020-01-20,0
5,440,37,9,25,431,0,0,2.0,5.7,2020-01-21,0
6,574,393,17,25,557,0,0,3.0,4.4,2020-01-22,0
7,835,1072,25,34,776,0,0,3.0,4.1,2020-01-23,0
8,1297,1965,41,38,1218,0,0,3.2,2.9,2020-01-24,0
9,1985,2684,56,49,1880,324,0,2.8,2.5,2020-01-25,0


In [5]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data['日期']])
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in china_day_data['累计确诊']], is_smooth=True)
    .add_yaxis(series_name='累计疑似', y_axis=[int(i) for i in china_day_data['累计疑似']], is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in china_day_data['累计死亡']], is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in china_day_data['累计治愈']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="全国每日累计数据可视化"), # 设置全局变量，比如标题、副标题和交互方法等
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )  # axis_pointer_type改变指示器类型，这样鼠标放图上就有辅助观察的线
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook() # 还是在当前直接显示比较方便查看

  super().__init__(init_opts=init_opts)


由图表可以得到全国疫情爆发主要集中在2月份，在3月份逐渐趋于平稳疫情得到大体控制。在2月8号全国累计疑似达到顶峰，紧接着累计确诊人数也在随后14天内增多，这说明累计疑似病例中大多数都成了确诊病例。不过进入三月份情况就好转了，趋势皆趋于平稳。

In [6]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data['日期']])
    .add_yaxis(series_name='境外输入', y_axis=[int(i) for i in china_day_data['境外输入']], areastyle_opts=opts.AreaStyleOpts(opacity=0.3), color="#4169E1")
    .set_global_opts(
        title_opts=opts.TitleOpts(title="全国每日累计境外输入可视化"), # 设置全局变量，比如标题、副标题和交互方法等
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


从图表上可以看到，在3月4日前没有境外输入的数据，但是那时候正是我国疫情最严重的时期，可以通过查阅新闻得知，在那之前是未记录统计境外输入病例，所有后边才有数据。
并且从图表来看，境外输入病例正趋于平稳上升阶段，可以知道只要外国疫情还没有稳定下来，国内还是会有境外输入病例的。

In [7]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data['日期']])
    .add_yaxis(series_name='死亡率', y_axis=[int(i) for i in china_day_data['死亡率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.5), color="green", is_smooth=True)
    .add_yaxis(series_name='治愈率', y_axis=[int(j) for j in china_day_data['治愈率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.3), color="grey", is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="全国每日死亡率和治愈率可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


这是累计数据，可以看到我国在二月中旬开始，治愈率开始大幅提高，同时还保证了极低的死亡率。可见我国处理紧急医疗卫生事件的能力是多么的强大。

## 历史每日新增确诊（湖北、全国、非湖北）

In [8]:
#读取数据
china_day_data2 = pd.read_csv(filepath_cn+"历史每日新增确诊数据（湖北、全国、和非湖北）.csv") 
# 为了更直观看，将列名全部改为中文
china_day_data2.columns = ['日期', '湖北', '全国', '非湖北']
format_time(china_day_data2) # 格式化日期
china_day_data2

Unnamed: 0,日期,湖北,全国,非湖北
0,2020-01-20,72,77,5
1,2020-01-21,105,149,44
2,2020-01-22,69,131,62
3,2020-01-23,105,259,154
4,2020-01-24,180,444,264
5,2020-01-25,323,688,365
6,2020-01-26,371,769,398
7,2020-01-27,1291,1771,480
8,2020-01-28,840,1459,619
9,2020-01-29,1032,1737,705


In [9]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in china_day_data2['日期']])
    .add_yaxis(series_name='全国', y_axis=[int(i) for i in china_day_data2['全国']], is_smooth=True)
    .add_yaxis(series_name='湖北', y_axis=[int(i) for i in china_day_data2['湖北']], is_smooth=True)
    .add_yaxis(series_name='非湖北', y_axis=[int(i) for i in china_day_data2['非湖北']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="历史每日新增确诊（湖北、国家、非湖北）"), # 设置全局变量，比如标题、副标题和交互方法等
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )  # axis_pointer_type改变指示器类型，这样鼠标放图上就有辅助观察的线
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook() # 还是在当前直接显示比较方便查看

  super().__init__(init_opts=init_opts)


从图表看出武汉在新增确诊从一月底开始呈上升趋势，2月12号达到高峰（14840人），之后呈下降趋势到2月15日降到正常趋势，原因就是武汉雷神山医院收治了第一批转运过来的新冠肺炎患者，把临床诊断病例也确定为确诊病例

## 国内输入病例前十省

In [10]:
#读取数据
china_tenprov_inputdata = pd.read_csv(filepath_cn+"国内输入病例前十省.csv", encoding='GBK') # 这其实是每日累计数据
# 为了更直观看，将列名全部改为中文
china_tenprov_inputdata.columns = ['省份', '输入病例']
china_tenprov_inputdata

Unnamed: 0,省份,输入病例
0,上海,395
1,黑龙江,386
2,广东,266
3,北京,174
4,内蒙古,173
5,陕西,77
6,甘肃,75
7,福建,68
8,山西,67
9,天津,66


In [11]:
(
    Bar(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i for i in china_tenprov_inputdata['省份']])
    .add_yaxis(series_name='输入病例', y_axis=[int(i) for i in china_tenprov_inputdata['输入病例']])
    .set_global_opts(
        title_opts=opts.TitleOpts(title="国内输入病例前十省"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='省份'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True)) # 显示y轴刻度线
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


由图表可以看出，上海是境外输入病例最多的，这个都是外国坐飞机来国内的，而黑龙江排第二大多是由俄罗斯输入进来的。

## 国内各省每日数据

In [12]:
#读取数据
province = input("请输入要显示的省份：")
cn_prov_day_data = pd.read_csv(filepath_cn+"各省每日数据/"+province+".csv", encoding='GBK')
# 删除不需要的列
del cn_prov_day_data['country']
del cn_prov_day_data['province']
del cn_prov_day_data['confirm_cuts']
del cn_prov_day_data['dead_cuts']
del cn_prov_day_data['now_confirm_cuts']
del cn_prov_day_data['newConfirm'] # 与confirm_add列相同
del cn_prov_day_data['heal_cuts']
del cn_prov_day_data['description']
# 为了更直观看，将列名全部改为中文
cn_prov_day_data.columns = ['日期', '累计确诊', '累计死亡', '累计治愈', '新增确诊', '新增治愈', '新增死亡']
format_time(cn_prov_day_data) # 格式化日期
cn_prov_day_data

请输入要显示的省份：北京


Unnamed: 0,日期,累计确诊,累计死亡,累计治愈,新增确诊,新增治愈,新增死亡
0,2020-01-28,102,1,4,11,0,0
1,2020-01-29,111,1,4,9,0,0
2,2020-01-30,132,1,5,21,1,0
3,2020-01-31,156,1,5,24,0,0
4,2020-02-01,183,1,9,27,4,0
5,2020-02-02,212,1,12,29,3,0
6,2020-02-03,228,1,23,16,11,0
7,2020-02-04,253,1,24,25,1,0
8,2020-02-05,274,1,31,21,7,0
9,2020-02-06,297,1,33,23,2,0


In [13]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in cn_prov_day_data['日期']])
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in cn_prov_day_data['累计确诊']], is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in cn_prov_day_data['累计死亡']], is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in cn_prov_day_data['累计治愈']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{province} 每日累计数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")], # 添加最大值最小值
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8) # 最大值最小值的气泡
        ),
        label_opts=opts.LabelOpts(is_show=False), # 不显示每个点的标签
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


输入查看北京的每日累计数据，由图表可以看出，在三月中旬北京的累计数据趋于平稳，但是在6月1日开始突然累计确诊又开始增加，这是因为那段时间突然北京出现进口海鲜产品携带新冠病毒，导致又有人确诊新冠病毒，不过好在国家迅速做出反应，及时控制住了疫情的传播。

In [15]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in cn_prov_day_data['日期']])
    .add_yaxis(series_name='新增确诊', y_axis=[int(i) for i in cn_prov_day_data['新增确诊']], is_smooth=True)
    .add_yaxis(series_name='新增死亡', y_axis=[int(i) for i in cn_prov_day_data['新增死亡']], is_smooth=True)
    .add_yaxis(series_name='新增治愈', y_axis=[int(i) for i in cn_prov_day_data['新增治愈']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{province} 每日新增数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


输入查看北京的每日新增数据，由图表可以看出，北京的每日新增确诊在三月底已经为0，并维持了一段时间，但是到五月底又开始了，原因上面有讲，从新增治愈可以看出，很快这些确诊的病例都被成功治愈了，也没有一例新增死亡病例。

# 外国每日数据可视化

## 具体外国国家每日数据可视化

In [16]:
#读取数据
country = input("请输入想要查看的国家（除中国）：")
fg_country_day_data = pd.read_csv(filepath_fg+"部分国家历史每日数据/"+country+".csv", encoding='GBK')
# 为了更直观看，将列名全部改为中文
fg_country_day_data.columns = ['日期', '新增确诊', '累计确诊', '累计治愈', '累计死亡']
format_time(fg_country_day_data) # 格式化日期
fg_country_day_data

请输入想要查看的国家（除中国）：美国


Unnamed: 0,日期,新增确诊,累计确诊,累计治愈,累计死亡
0,2020-01-28,0,5,0,0
1,2020-01-29,0,5,0,0
2,2020-01-30,1,6,0,0
3,2020-01-31,0,6,0,0
4,2020-02-01,1,7,0,0
5,2020-02-02,1,8,0,0
6,2020-02-03,3,11,1,0
7,2020-02-04,0,11,1,0
8,2020-02-05,0,11,1,0
9,2020-02-06,1,12,1,0


In [17]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in fg_country_day_data['日期']])
    .add_yaxis(series_name='新增确诊', y_axis=[int(i) for i in fg_country_day_data['新增确诊']], is_smooth=True)
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in fg_country_day_data['累计确诊']], is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in fg_country_day_data['累计治愈']], is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in fg_country_day_data['累计死亡']], is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{country} 每日数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


这里我们输入查看美国的每日数据，从图表直观清晰的看出，美国的每日新增病例已经快接近每天7万了，都快赶上我国全部的累计确诊病例了（不到9万），而且从图表中可以看到，美国每日累计病例没有平稳下降的趋势，这说明美国这种状态还要持续一段时间，估计还要很久才能克服新冠疫情。

## 外国整体每日数据可视化

In [18]:
fg_day_data = pd.read_csv(filepath_fg+"全球历史每日数据.csv", encoding='GBK')
# 为了更直观看，将列名全部改为中文
fg_day_data.columns = ['日期', '累计确诊', '累计死亡', '累计治愈', '新增确诊', '死亡率', '治愈率']
format_time(fg_day_data) # 格式化日期
fg_day_data

Unnamed: 0,日期,累计确诊,累计死亡,累计治愈,新增确诊,死亡率,治愈率
0,2020-01-28,57,0,3,0,0.0,5.26
1,2020-01-29,74,0,3,13,0.0,4.05
2,2020-01-30,98,0,6,22,0.0,6.12
3,2020-01-31,124,0,11,20,0.0,8.87
4,2020-02-01,139,0,11,13,0.0,7.91
5,2020-02-02,149,1,11,10,0.67,7.38
6,2020-02-03,154,1,12,5,0.65,7.79
7,2020-02-04,177,1,19,22,0.56,10.73
8,2020-02-05,201,1,21,14,0.5,10.45
9,2020-02-06,225,1,25,24,0.44,11.11


In [19]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in fg_day_data['日期']])
    .add_yaxis(series_name='累计确诊', y_axis=[int(i) for i in fg_day_data['累计确诊']], areastyle_opts=opts.AreaStyleOpts(opacity=0.2), is_smooth=True)
    .add_yaxis(series_name='累计治愈', y_axis=[int(i) for i in fg_day_data['累计治愈']], areastyle_opts=opts.AreaStyleOpts(opacity=0.4), is_smooth=True)
    .add_yaxis(series_name='累计死亡', y_axis=[int(i) for i in fg_day_data['累计死亡']], areastyle_opts=opts.AreaStyleOpts(opacity=0.6), is_smooth=True)
    .add_yaxis(series_name='新增确诊', y_axis=[int(i) for i in fg_day_data['新增确诊']], areastyle_opts=opts.AreaStyleOpts(opacity=0.8), is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="外国整体 每日数据可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


可以看出外国整体在1月2月时都没有多少病例，这时候是我国疫情的爆发期，但是进入三月后外国的确诊人数逐渐增多，到现在仍没有缓和的趋势

In [20]:
(
    Line(init_opts=opts.InitOpts())
    .add_xaxis(xaxis_data=[i[5:] for i in fg_day_data['日期']])
    .add_yaxis(series_name='死亡率', y_axis=[int(i) for i in fg_day_data['死亡率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.8), color="green", is_smooth=True)
    .add_yaxis(series_name='治愈率', y_axis=[int(j) for j in fg_day_data['治愈率']], areastyle_opts=opts.AreaStyleOpts(opacity=0.3), color="grey", is_smooth=True)
    .set_global_opts(
        title_opts=opts.TitleOpts(title="外国整体每日死亡率和治愈率可视化"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='日期'),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
    .set_series_opts(
        markpoint_opts=opts.MarkPointOpts(
            data=[opts.MarkPointItem(type_="max"), opts.MarkPointItem(type_="min")],
            symbol_size=[50, 40],
            label_opts=opts.LabelOpts(position="inside", color="#fff", font_size=8)
        ),
        label_opts=opts.LabelOpts(is_show=False),
    )
).render_notebook()

  super().__init__(init_opts=init_opts)


通过图表看出，新冠病毒的死亡率还是挺高的，而且这里死亡率4%，治愈率才60%，这说明还有一大部分人是在治疗还没治好的，这种趋势还会持续一段时间。

## 外国死亡率和治愈率排名前后10名可视化

In [21]:
fg_heal_ten_first = pd.read_csv(filepath_fg+"外国治愈前10名.csv", encoding='GBK') # 治愈前十名国家
fg_heal_ten_last = pd.read_csv(filepath_fg+"外国治愈后10名.csv", encoding='GBK') # 治愈后十名国家
fg_dead_ten_first = pd.read_csv(filepath_fg+"外国死亡率前10名.csv", encoding='GBK') # 死亡前十名国家
fg_deal_ten_last = pd.read_csv(filepath_fg+"外国死亡率后10名.csv", encoding='GBK') # 死亡后十名国家
# 为了更直观看，将列名全部改为中文
fg_heal_ten_first.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_heal_ten_last.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_dead_ten_first.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_deal_ten_last.columns = ['国家', '累计确诊', '累计治愈', '累计死亡', '治愈率', '死亡率']
fg_heal_ten_last

Unnamed: 0,国家,累计确诊,累计治愈,累计死亡,治愈率,死亡率
0,瑞典,78504,0,5667,0.0,7.22
1,塞尔维亚,21605,0,491,0.0,2.27
2,荷兰,52475,194,6158,0.37,11.74
3,英国,297389,1414,45507,0.48,15.3
4,纳米比亚,1366,57,7,4.17,0.51
5,洪都拉斯,35345,4144,988,11.72,2.8
6,黑山,2381,426,35,17.89,1.47
7,巴勒斯坦,9398,1932,64,20.56,0.68
8,利比亚,2088,479,50,22.94,2.39
9,刚果（布）,2851,666,50,23.36,1.75


In [22]:
bar1 = (
    Bar()
    .add_xaxis([i for i in fg_heal_ten_first['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_heal_ten_first['治愈率']], color='green')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="治愈前十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)
bar2 = (
    Bar()
    .add_xaxis([i for i in fg_heal_ten_last['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_heal_ten_last['治愈率']], color='green')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="治愈后十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)
bar3 = (
    Bar()
    .add_xaxis([i for i in fg_dead_ten_first['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_dead_ten_first['死亡率']], color='grey')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="死亡前十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}),
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)
bar4 = (
    Bar()
    .add_xaxis([i for i in fg_deal_ten_last['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_deal_ten_last['死亡率']], color='gray')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="死亡后十名国家"),
        tooltip_opts=opts.TooltipOpts(trigger='axis', axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}), # interval:0让x轴刻度全部正常显示
        yaxis_opts=opts.AxisOpts(name='%', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
)

  super().__init__(init_opts=init_opts)
  super().__init__(init_opts=init_opts)
  super().__init__(init_opts=init_opts)
  super().__init__(init_opts=init_opts)


In [23]:
bar1.render_notebook()

In [24]:
bar2.render_notebook()

In [25]:
bar3.render_notebook()

In [26]:
bar4.render_notebook()

从治愈后十名国家数据可以看到前两名国家的治愈率为0，这不是数据错误，而是这两个国家没有公布治愈数据，因此只能放0，也可以看到英国的治愈率也不高，英国的抗疫也不太行，跟美国一个样。相反看死亡后十名国家，新加坡的死亡率就非常的低，他们这些国家对待抗疫就很积极认真，所以在会有这么低的死亡率。

## 外国24小时新增确诊前十名国家

In [27]:
fg_24hour_ten_newadd = pd.read_csv(filepath_fg+"外国24小时新增确诊前10名.csv", encoding='GBK') # 死亡后十名国家
# 为了更直观看，将列名全部改为中文
fg_24hour_ten_newadd.columns = ['国家', '新增确诊']
fg_24hour_ten_newadd

Unnamed: 0,国家,新增确诊
0,美国,62788
1,印度,37148
2,巴西,23529
3,南非,9300
4,哥伦比亚,6578
5,俄罗斯,5842
6,墨西哥,5311
7,西班牙,4581
8,阿根廷,4231
9,秘鲁,4090


In [28]:
(
    Bar()
    .add_xaxis([i for i in fg_24hour_ten_newadd['国家']])
    .add_yaxis(series_name='', y_axis=[i for i in fg_24hour_ten_newadd['新增确诊']], color='skyblue')
    .set_global_opts(
        title_opts=opts.TitleOpts(title="24时新增确诊前十名国家"),
        tooltip_opts=opts.TooltipOpts(axis_pointer_type='cross'),
        xaxis_opts=opts.AxisOpts(name='国家', axislabel_opts={"interval":"0"}), # x轴刻度显示完全
        yaxis_opts=opts.AxisOpts(name='人数', splitline_opts=opts.SplitLineOpts(is_show=True))
    )
).render_notebook()

  super().__init__(init_opts=init_opts)
