## JSON

JSON是一种数据格式，由美国程序设计师Douglas Crockford创建的，JSON全名是JavaScript Object Notation，由JSON英文全文字义我们可以推敲JSON的缘由，最初是为JavaScript开发的。这种数据格式由于简单好用被大量应用在Web开发与大数据数据库(NoSQL)，现在已成为一种著名数据格式，Python与许多程序语言同时采用与支持。也由此在使用Python设计程序时，可以将数据以JSON格式存储,与其他程序语言的设计师分享。<br>
python程序设计时需要使用import json导入json模块。

### 1 认识json数据格式

json的数据格式有2种，分别是：<br>**对象**(object)：一般用大括号{ }表示。<br>**数组**(array)：一般用中括号[ ]表示。

### 1.1 对象（object）

在json中对象就是用“键-值(key:value)”方式配对存储，对象内容用左大括号“{”开始，右大括号“}”结束，键(key)和值(value)用“:”区隔，每一组键:值间以逗号“,”隔开，以下是取材自json.org的官方图说明。

在json格式中键(key)是一个字符串(string)。值可以是数值(number)、字符串(string)、布尔值(bool)、数组(array)或是null值。   
例如：下列是对象的实例。  

     {"Name":"Hung","Age":25}
使用json时需留意，键(key)必须是文字，例如下列是错误的实例。
  
     {"Name":"Hung", 25:"Key"}
在json格式中字符串需用双引号，同时在json文件内不可以有批注。

### 1.2 数组（array）

数组基本上是一系列的值(value)所组成，用左中括号“[”开始，右中括号“]”结束。各值之间用逗号“,”隔开，以下是取材自json.org的官方图说明。   
数组的值可以是数值(number)、字符串(string)、布尔值(bool)、数组(array)或是null值。

### 1.3 json数据存在方式

在python中json数据存在方式是**字符串（string）**   
使用json模块执行将Python数据转成json字符串类型数据或json文件使用不同方法，下面24-2和24-3节将分别说明。

## 2 将Python应用在json字符串形式数据

### 2.1 使用dumps() 将python数据转成json格式

| python 格式 | JSON 格式|
|---|---|
|dict|object|
|list, tuple|array|
|str, unicode| string|
|int, float, long| number|
True|true
False|false
None|null

In [2]:

# 将python的列表与元组数据转成json的数组数据的实例
import json
listNumbers = [5, 10, 20, 1]        # 列表数据
tupleNumbers = (1, 5, 10, 9)        # 元组资料
jsonData1 = json.dumps(listNumbers)     # 将列表数据转成json数据
jsonData2 = json.dumps(tupleNumbers)        # 将列表数据转成json数据
print('列表转成json的数组', jsonData1)
print('元组转成json的数组', jsonData2)
print('json数组在python的数据类型', type(jsonData1))

列表转成json的数组 [5, 10, 20, 1]
元组转成json的数组 [1, 5, 10, 9]
json数组在python的数据类型 <class 'str'>


In [1]:
# 将python由字典元素所组成的列表转成json数组，转换后原先字典元素变为json的对象

import json
listObj = [{'Name':'Peter', 'Age':25, 'Gender':'M'}]        # 列表数据元素是字典
jsonData = json.dumps(listObj)              # 将列表数据转成json数据
print('列表转成json的数组', jsonData)
print('json数组在python的数据类型', type(jsonData))

列表转成json的数据 [{"Name": "Peter", "Age": 25, "Gender": "M"}]
json数组在python的数据类型 <class 'str'>


### 2.2 dumps()的sort keys参数

Python的字典是无序的数据，使用dumps( )将Python数据转成json对象时，可以增加使用sort_keys=True，则可以将转成json格式的对象排序。

In [None]:
# 将字典转成json格式的对象，分别是未使用排序与使用排序。
import json
from pstats import SortKey
dicObj = {'b':88, 'a':25, 'c':165}
jsonObj1 = json.dumps(dicObj)
jsonObj2 = json.dumps(dicObj, sort_keys= True)
print('未用排序将字典转换成json对象', jsonObj1)
print('使用排序将字典转换成json对象', jsonObj2)
print('有排序与未排序对象是否相同', jsonObj1 == jsonObj2)
print('json物件在python的数据类型', type(jsonObj1))

### 2.3 dumps()的indent参数

从ch24_3.py的执行结果可以看到数据不太容易阅读，特别是资料量如果更多的时候，在将Python的字典数据转成json格式的对象时，可以加上indent设定缩排json对象的键-值，让json对象可以更容易显示。

In [3]:
# 将python的字典转成json格式对象时，设定缩排4个字符宽度。
import json
dicObj = {'b':80, 'a':25, 'c':80 }
jsonObj = json.dumps(dicObj, sort_keys=True, indent=4)      # 用内缩呈现json对象
print(jsonObj)

{
    "a": 25,
    "b": 80,
    "c": 80
}


### 2.4 使用load()将json格式数据转成python的数据

在json模块内有loads( )，可以将json格式数据转成Python数据，下列是转化对照表。

| python 格式 | JSON 格式|
|---|---|
|dict|object|
|list|array|
|unicode| string|
|int, long| number(int)|
True|true
False|false
None|null

In [5]:
# 将json的对象数据转成python数据的实例，留意在建立json数据时，要加上引号，因为json数据在python内是以字符串形式存在
import json

jsonObj = '{"b":80, "a":25, "c":160}'
dicObj = json.loads(jsonObj)    # 转成python对象
print(dicObj)
print(type(dicObj))

{'b': 80, 'a': 25, 'c': 160}
<class 'dict'>


## 3 将python应用在json文件

### 3.1 使用dump()将python数据转成json文件

json模块内有dump( )，可以将Python数据转成json文件格式，这个文件格式的扩展名是json，下列将直接以程序实例解说dump( )的用法。

In [None]:
# 将一个字典数据，使用json格式存储在07jsonout.json文件内，在这个实例中，dump()方法的第一个参数
# 是欲存储成json格式的数据，第二个参数是欲存储的文件对象

import json

dictObj = {'b':80, 'a':25, 'c':60}
fn = '.\\python\\JSON\\07jsonout.json'
with open(fn, 'w') as fnObj:
    json.dump(dictObj, fnObj)

### 3.2 使用load()读取json文件

在json模块内有load( )，可以读取json文件，读完后这个json文件将被转换成Python的数据格式，下列将直接以程序实例解说dump( )的用法。

In [None]:
# 读取json文件07jsonout.json，同时列出结果
import json

fn = '.\\python\\JSON\\07jsonout.json'
with open(fn, 'r') as fnObj:
    data = json.load(fnObj)

print(data)
print(type(data))

## 4 简单的json文件应用

In [None]:
# 程序执行时会要求输入账号，然后列出所输入账号同时打印欢迎使用本系统。

import json
fn = '.\\python\\JSON\\login.json'
login = input('请输入账号:')
with open(fn, 'w') as fnObj:
    json.dump(login, fnObj)
    print('%s! 欢迎使用本系统' % login)

In [None]:
# 读取login.json的数据，同时输出'欢迎回来使用本系统'

import json

fn = '.\\python\\JSON\\login.json'
with open(fn, 'r') as fnObj:
    login = json.load(fnObj)
    print('%s 欢迎回来使用本系统！' % login)

下列程序基本上是ch24_8.py和ch24_9.py的组合，如果第一次登录会要求输入账号然后将输入账号记录在login24_10.json文件内，如果不是第一次登录，会直接读取已经存在login24_10.json的账号，然后打印“欢迎回来”。这个程序用第7行是否能正常读取login24_10.json方式判断是否是第一次登录，如果这个文件不存在表示是第一次登录，将执行第8行except至12行的内容。如果这个文件已经存在，表示不是第一次登录，将执行第13行else:后面的内容。

In [None]:
# 第一次登录会要求输入账号然后将输入账号记录在login24_10.json文件内，如果不是第一次登录，会直接读取已经存在login24_10.json的账号，然后打印“欢迎回来”。
import json

fn = '.\\python\\JSON\\repeatlogin.json'

try:
    with open(fn) as fnObj:
        login = json.load(fnObj)
except Exception:
    login = input('请输入账号: ')
    with open(fn, 'w') as fnObj:
        json.dump(login, fnObj)
        print('系统已记录你的账号')
else:
    print("%s 欢迎回来" % login)

## 5 世界人口数据的json文件

### 5.1 认识人口统计的json文件

在网络上任何一个号称是真实统计的json数据，在用记事本打开后，初看一定是复杂的，读者碰上这个问题首先不要慌，同时分析数据的共通性，这样有助于未来程序的规划与设计。从上图基本上我们可以了解它的资料格式，这是一个列表，列表元素是字典，有些国家或地区只有2000年的资料，有些只有2010年的资料，有些则同时有这2个年度的数据，每个字典内有4个键-值，如下所示：

上述字段分别是国家或地区名称(Country Name)、国家代码(Country Code)、年份(Year)和人口数(numbers)。从上述文件我们应该注意到，人口数在我们日常生活理解应该是整数，可是这个数据是用字符串表达，另外，在非官方的统计数据中，难免会有错误，例如，上述国家或地区（这是全球人口统计）的2010年人口数据资料出现了小数点，这个需要我们用程序处理。

In [None]:
# 列出population_data.json数据中的人口数据
import json
fn = '.\\python\\JSON\\population_data.json'
with open(fn) as fnObj:
    getDatas = json.load(fnObj)

for getData in getDatas:
    if getData['Year'] == '2000':
        countryName = getData['Country Name']
        countryCode = getData['Country Code']
        population = int(float(getData['Value']))
        print('代码 = ', countryCode)
        print('名称 = ', countryName)
        print('人口数= ', population)


### 5.2 认识pygal.maps.world的地区代码信息

前一节有关populations.json地区代码是3个英文字母，如果我们想要使用这个json数据绘制世界人口地图，需要配合pygal.maps.world模块的方法，这个模块的地区代码是2个英文字母，所以需要将populations.json地区代码转成2个英文字母。这里本节先介绍2个英文字母的信息，pygal.maps.world模块内有COUNTRIES字典，在这个字典中国码是2个英文字母，从这里我们可以列出相关地区与代码的列表。使用pygal.maps.world模块前需先安装此模块，如下所示：

     pip install pygal.maps.world   
程序实例ch24_12.py：列出pygal.maps.world模块COUNTRIES字典的2个英文字母的地区代码与完整的地区名称列表。

In [None]:
# 列出pygal.maps.world模块COUNTRIES字典的2个英文字母的地区代码与完整的地区名称列表
from pygal.maps.world import COUNTRIES

for countryCode in sorted(COUNTRIES.keys()):
    print('代码: ', countryCode, '名称', COUNTRIES[countryCode])

输出2个字母的地区代码时，同时输出，这个程序相当于是将2个不同来源的数据作配对。

从populations.json取每个名称信息，然后将每一个名称放入getCountryCode( )方法中找寻相关代码，如果找到则输出相对应的代码，如果找不到则输出“名称不吻合”。

In [None]:
# 从populations.json取每个名称信息，然后将每一个名称放入getCountryCode( )方法中找寻相关代码，如果找到则输出相对应的代码，如果找不到则输出“名称不吻合”。
import json
from pygal.maps.world import COUNTRIES


def getCountryCode(countryName):
    '''输入名称回传代码'''
    for dictCode, dictName in COUNTRIES.items():    # 搜寻代码字典
        if dictName == countryName:
            return dictCode             # 如果找到就回传代码
    return None         

fn = '.\\python\\JSON\\population_data.json'
with open(fn) as fnObj:
    getDatas = json.load(fnObj)     # 读取入门数据json文件

for getData in getDatas:
    if getData['Year'] == '2000':
        countryName = getData['Country Name']
        countryCode = getCountryCode(countryName)
        population = int(float(getData['Value']))
        if countryCode != None:
            print(countryCode, ':', population)
        else:
            print(countryName, '名称不符合')

### 5.3制作世界人口地图

In [None]:
import json 
from pygal_maps_world.i18n import COUNTRIES
import pygal.maps.world

fn = '.\\python\\JSON\\population_data.json'

with open(fn) as fnObj:
    getDatas = json.load(fnObj)

def get_country_code(country_name):
    '''
    pygal中的地图制作工具要求数据为特定的格式：用国别码表示国家，以及用数字表示人口数量
    因为pygal使用两个字母的国别码，所以我们要想办法过呢据国家名称获取两个字母的国别码
    '''
    for code, name in COUNTRIES.items():
        if name == country_name:
            return code
    return None

# 打印人口数量
ccPopulations = {}
for getData in getDatas:
    if getData['Year'] == '2000':
        countryName = getData['Country Name']
        population = getData['Value']
        population = int(float(population))     # 将数值转换为整数
        code = get_country_code(countryName)
        if code:
            print(code + ':' + str(population))
            ccPopulations[code] = population
        else:
            print('Error- ' + countryName)

# 制作颜色的地图    
wm = pygal.maps.world.World()
wm.title = 'North, Central, and South America'
'''
方法add()接受一个标签和一个列表，其中后者包含我们要突出的国家的国别码
每次调用add()都将为指定的国家选择一种新的颜色，并在图标左边显示该颜色和指定的标签
'''
wm.add('North America', ['ca', 'mx', 'us'])     
wm.add('Central America', ['bz', 'cr', 'gt', 'hn', 'ni', 'pa', 'sv'])
wm.add('South America', ['ar', 'bo', 'br', 'cl', 'co', 'ec', 'gf',
    'gy', 'pe', 'py', 'sr', 'uy', 've'])
wm.render_to_file('.\\python\\JSON\\americas.svg')      # 制作地图



# 绘制完整的世界人口地图
wm = pygal.maps.world.World()
wm.title = 'World Population in 2000, by Country'
wm.add('2000', ccPopulations)
wm.render_to_file('.\\python\\JSON\\World_Population.svg')      # 世界人口地图
print(ccPopulations)

有几个国家没有相关数据，我们将其显示为白色，但对于大多数国家，都根据其人口数量进行了着色。

当前地图中，很多国家都是浅色的，只有两个国家是深色的。对大多数国家而言，颜色深浅差别不足以反映其人口数量的差别。

为修复这种问题，我们将根据人口数量将国家分组，再分别对每个组着色   
我们从模块中导入了样式RotateStyle,创建这个实例时，需要提供一个参数--十六进制的RGB颜色。

十六进制格式的RGB颜色是一个以井号（#）打头的字符串，后面跟着6个字符，其中前两个表示红色分量，接下来是绿色和蓝色。

这里使用的颜色值（#336699）混合了少量的红色（33）、多一些的绿色（66）和更多一些的蓝色（99），它为RotateStyle提供了一种淡蓝色基色。

 

加亮颜色主题
Pygal通常默认使用较暗的颜色主题，为方便印刷，我们使用LightColorizedStyle加亮了地图颜色。

这个类修改整个图表的主题，包括背景色、标签以及各个国家的颜色   
使用这个类时，不能直接控制使用的颜色，Pygal将选择默认的基色，要设置颜色，可使用RotateStyle,并将LightColorizedStyle作为基本样式。

In [None]:
import imp
import json 
from pygal_maps_world.i18n import COUNTRIES
import pygal.maps.world
from pygal.style import RotateStyle, LightColorizedStyle

fn = '.\\python\\JSON\\population_data.json'

with open(fn) as fnObj:
    getDatas = json.load(fnObj)

def get_country_code(country_name):
    '''
    pygal中的地图制作工具要求数据为特定的格式：用国别码表示国家，以及用数字表示人口数量
    因为pygal使用两个字母的国别码，所以我们要想办法过呢据国家名称获取两个字母的国别码
    '''
    for code, name in COUNTRIES.items():
        if name == country_name:
            return code
    return None

# 打印人口数量
ccPopulations = {}
for getData in getDatas:
    if getData['Year'] == '2000':
        countryName = getData['Country Name']
        population = getData['Value']
        population = int(float(population))     # 将数值转换为整数
        code = get_country_code(countryName)
        if code:
            print(code + ':' + str(population))
            ccPopulations[code] = population
        else:
            print('Error- ' + countryName)

#当前地图中，很多国家都是浅色的，只有两个国家是深色的。对大多数国家而言，颜色深浅差别不足以反映其人口数量的差别。
#为修复这种问题，我们将根据人口数量将国家分组，再分别对每个组着色：
ccPopulations1 , ccPopulations2, ccPopulations3 = {}, {}, {}
for countrynames, populations in ccPopulations.items():
    if populations< 10000000:
        ccPopulations1[countrynames] = populations
    elif populations < 100000000:
        ccPopulations2[countrynames] = populations
    else:
        ccPopulations3[countrynames] = populations

print(len(ccPopulations1), len(ccPopulations2), len(ccPopulations3))
wm_style = RotateStyle('#336688', base_style=LightColorizedStyle)
wm = pygal.maps.world.World(style=wm_style)
wm.title='World Population in 2000, by Country'
wm.add('0-10m', ccPopulations1)
wm.add('10m-1bn', ccPopulations2)
wm.add('1b-10bn', ccPopulations3)
wm.render_to_file('.\\python\\JSON\\World_pupulation_2000.svg')


# # 制作颜色的地图
# wm = pygal.maps.world.World()
# wm.title = 'North, Central, and South America'
# '''
# 方法add()接受一个标签和一个列表，其中后者包含我们要突出的国家的国别码
# 每次调用add()都将为指定的国家选择一种新的颜色，并在图标左边显示该颜色和指定的标签
# '''
# wm.add('North America', ['ca', 'mx', 'us'])     
# wm.add('Central America', ['bz', 'cr', 'gt', 'hn', 'ni', 'pa', 'sv'])
# wm.add('South America', ['ar', 'bo', 'br', 'cl', 'co', 'ec', 'gf',
#     'gy', 'pe', 'py', 'sr', 'uy', 've'])
# wm.render_to_file('.\\python\\JSON\\americas.svg')      # 制作地图



# # 绘制完整的世界人口地图
# wm = pygal.maps.world.World()
# wm.title = 'World Population in 2000, by Country'
# wm.add('2000', ccPopulations)
# wm.render_to_file('.\\python\\JSON\\World_Population.svg')      # 世界人口地图
# print(ccPopulations)
