# 地图数据来源

#### 数据来源

https://news.qq.com/zt2020/page/feiyan.htm

数据源：https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5

In [42]:
import requests
import json#获取数据是json格式
import pandas as pd#数据整理使用

#爬虫函数
def getData():
    url = 'https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5'
    headers = {
        'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'
    }
    #定义
    r = requests.get(url,headers)
    #res获取最终结果；从requests中获取值，有text、json两种方式，此页面在传输时以html格式传输，不用r.json转码，用r.text
    res = json.loads(r.text)
    #再进行第二层转换，数据中我们取得data后面的，前面的对我们没用；
    data_res=json.loads(res['data'])
    return data_res
#调用
data_dict = getData()

In [43]:
#查看有哪些健
data_dict.keys()

dict_keys(['lastUpdateTime', 'chinaTotal', 'chinaAdd', 'isShowAdd', 'showAddSwitch', 'areaTree', 'chinaDayList', 'chinaDayAddList', 'dailyNewAddHistory', 'dailyHistory', 'wuhanDayList', 'articleList'])

#### 参数解析：

lastUpdateTime：最后的更新时间

chinaTotal：累计
- confirm:累计确诊
- heal：累计治疗
- dead: 累计死亡
- nowCofirm: 现有确诊
- suspect: 现有疑似
- nowsevere: 现有重症

chinaAdd： 每日新增数据
- confirm:较上日累计确诊
- heal：较上日累计治疗
- dead: 较上日累计死亡
- nowCofirm: 较上日现有确诊
- suspect: 较上日现有疑似
- nowsevere: 较上日现有重症

areaTree： 树桩形状的全球的精准数据(国家、省份、城市都有所记录，数据很大)


#### 使用库

pip install pyecharts

pip install echarts-china-provinces-pypkg

pyecharts官网文档: https://pyecharts.org

In [44]:
#拿到数据，进行整理,选择我们想要拿到的数据，建立列表
province_list = data_dict['areaTree'][0]['children']
proList = list()
#每一省份遍历
for province in province_list:
    #再次筛选自己想要的数据
    pro_dict = dict()
    pro_dict['name'] = province['name']
    pro_dict['confirm'] = province['total']['confirm']
    pro_dict['heal'] = province['total']['heal']
    pro_dict['dead'] = province['total']['dead']  
    proList.append(pro_dict)
proList

[{'name': '湖北', 'confirm': 67790, 'heal': 52943, 'dead': 3075},
 {'name': '广东', 'confirm': 1356, 'heal': 1299, 'dead': 8},
 {'name': '河南', 'confirm': 1273, 'heal': 1250, 'dead': 22},
 {'name': '浙江', 'confirm': 1227, 'heal': 1211, 'dead': 1},
 {'name': '湖南', 'confirm': 1018, 'heal': 1014, 'dead': 4},
 {'name': '安徽', 'confirm': 990, 'heal': 984, 'dead': 6},
 {'name': '江西', 'confirm': 935, 'heal': 934, 'dead': 1},
 {'name': '山东', 'confirm': 760, 'heal': 741, 'dead': 7},
 {'name': '江苏', 'confirm': 631, 'heal': 630, 'dead': 0},
 {'name': '重庆', 'confirm': 576, 'heal': 566, 'dead': 6},
 {'name': '四川', 'confirm': 539, 'heal': 510, 'dead': 3},
 {'name': '黑龙江', 'confirm': 482, 'heal': 447, 'dead': 13},
 {'name': '北京', 'confirm': 437, 'heal': 349, 'dead': 8},
 {'name': '上海', 'confirm': 352, 'heal': 324, 'dead': 3},
 {'name': '河北', 'confirm': 318, 'heal': 310, 'dead': 6},
 {'name': '福建', 'confirm': 296, 'heal': 295, 'dead': 1},
 {'name': '广西', 'confirm': 252, 'heal': 243, 'dead': 2},
 {'name': '陕西

In [45]:
#转变成dataframe，一个列表包含字典，一个字典表示每一列的列名称 
province_df = pd.DataFrame(proList)
province_df

Unnamed: 0,name,confirm,heal,dead
0,湖北,67790,52943,3075
1,广东,1356,1299,8
2,河南,1273,1250,22
3,浙江,1227,1211,1
4,湖南,1018,1014,4
5,安徽,990,984,6
6,江西,935,934,1
7,山东,760,741,7
8,江苏,631,630,0
9,重庆,576,566,6


In [46]:
#现确诊人数： = 累计人数-累计治愈人数-累计死亡人数   #添加到dataframe中
province_df['nowConfirm'] = province_df.confirm - province_df.heal - province_df.dead

In [47]:
province_df

Unnamed: 0,name,confirm,heal,dead,nowConfirm
0,湖北,67790,52943,3075,11772
1,广东,1356,1299,8,49
2,河南,1273,1250,22,1
3,浙江,1227,1211,1,15
4,湖南,1018,1014,4,0
5,安徽,990,984,6,0
6,江西,935,934,1,0
7,山东,760,741,7,12
8,江苏,631,630,0,1
9,重庆,576,566,6,4


# 绘制地图

In [48]:
from pyecharts.charts import Map
#共用插件，控制图片大小、标题颜色
from pyecharts import options as opts

In [77]:

#添加参数series_name: str,字符串类型；data_pair: Sequence,序列，需要生成器zip合成的类型，两个列表组合在一起的zip([key],[value])
#取值前做for循环,变成列表类型
province_name = [str(x) for x in province_df.name]
province_confirm = [int(x) for x in province_df.confirm]
province_nowConfirm = [int(x) for x in province_df.nowConfirm]
province_heal = [int(x) for x in province_df.heal]
province_dead = [int(x) for x in province_df.dead]


#生成器，二维列表类型#使用dataframe取出来的series列转换的list，每一个值的数据类型依然是int64，不是python中的int；莫把引擎对series不支持，你取得值必须int()强制转换
gen1 = [list(z) for z in zip(province_name,province_df.confirm)]
gen2 = [list(z) for z in zip(province_name,province_df.confirm)]
gen3 = [list(z) for z in zip(province_name,province_df.confirm)]
#第三个参数：maptype: str = 'china',默认中国地图；

#颜色指定
pieces = [
    {'max':1,'color':'#F0F0F0'},
    {'min':1,'max':9,'color':'#FFE0E0'},
    {'min':10,'max':99,'color':'#FEC0C0'},
    {'min':100,'max':499,'color':'#FD9090'},
    {'min':500,'max':999,'color':'#FC6060'},
    {'min':1000,'max':9999,'color':'#FB3030'},
    {'min':10000,'color':'#DD0000)'},
]
'''
#对地图实例化设置，地图颜色设置
c = Map(opts.InitOpts(width='900px',height='500px'))
c.add('全国累计确诊',gen1,'china')
c.add('全国累计治愈',gen2,'china',is_selected=False)#is_selected=False默认是不被选中状态
c.add('全国累计死亡',gen3,'china',is_selected=False)
#对地图的参数全局配置做调节
c.set_global_opts(title_opts=opts.TitleOpts(title='中国加油！武汉加油'),visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))
'''
c=(
    Map(opts.InitOpts(width='900px',height='500px'))
    .add('全国累计确诊',gen1,'china')
    .add('全国累计治愈',gen2,'china',is_selected=False)
    .add('全国累计死亡',gen3,'china',is_selected=False)
    .set_global_opts(title_opts=opts.TitleOpts(title='中国加油！武汉加油'),visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))
)

'''
#当存数据保存下来
c.render_embed()
from IPython.display import HTML
#把html做渲染；jupyter可能不认为，HTML帮你做渲染；这里可能不太友好，出来的是空白
#HTML(c.render_embed())
'''

c.render_notebook()

In [82]:
c=(
    Map(opts.InitOpts(width='900px',height='500px'))
    .add('全国累计确诊',[],'河北')
)
c.render_notebook()

In [34]:
#例子：  生成器只允许拿1次；
z = zip(list('abcde'),range(5))
list(z)
dict(z)

{}

In [65]:
#例子
HTML('<h1>1234<h1/>')