# Python中JSON操作

In [9]:
# 引入json模块
import json
import os

# 函数定义

## 文件保存函数1

In [25]:
def save_file(json_string, file_name, coding):
    """
    保存文件函数：把字符串保存成文件
    :param json_string:
    :param file_name:
    :param coding:
    :return:
    """
    with open(file_name, 'w', encoding=coding) as fp:
        fp.write(json_string)

## 文件保存函数2

In [10]:
def dump_save_file(json_string, file_name, coding):
    """
    使用dump函数，保存文件
    # json.dump(json_string, fp) 这样写会中文乱码，
    # 如果要保存含有中文的字符串，建议加上ensure_ascii=False,json.dump默认使用ascii字符码

    :param json_string: 要保存的json字符串
    :param file_name: 要保存的文件名称
    :param coding: 字符编码(如utf-8)
    :return: 没有返回值
    """
    with open(file_name, 'w', encoding=coding) as fp:
        json.dump(json_string, fp, ensure_ascii=False)

## 文件读取函数1

In [11]:
def read_json_file(file_name, coding):
    """
    使用json.load读取json文件
    :param file_name: 文件名
    :param coding: 编码（如utf-8）
    :return: <class 'list'>
    """
    with open(file_name, 'r', encoding=coding) as fp:
        persons = json.load(fp)
    return persons

In [13]:
json_file =  read_json_file('./person1.json','utf-8')
print(json_file)

[{'country': 'china', 'username': '张三', 'age': 18}, {'country': 'china', 'username': '李四', 'age': 20}, {'country': 'china', 'username': '王五', 'age': 32}]


## 文件读取函数2

In [19]:
def read_file(file_name,coding):
    with open(file_name, 'r',encoding=coding) as f:
        content = f.read()
    return content

In [20]:
file = read_file('./person1.json','utf-8')
print(file)

[{"country": "china", "age": 18, "username": "张三"}, {"country": "china", "age": 20, "username": "李四"}, {"country": "china", "age": 32, "username": "王五"}]


python文件对象提供了三个“读”方法： read()、readline() 和 readlines()。每种方法可以接受一个变量以限制每次读取的数据量。  

- read() 每次读取整个文件，它通常用于将文件内容放到一个字符串变量中。如果文件大于可用内存，为了保险起见，可以反复调用read(size)方法，每次最多读取size个字节的内容。   
- readlines() 之间的差异是后者一次读取整个文件，象 .read() 一样。.readlines() 自动将文件内容分析成一个行的列表，该列表可以由 Python 的 for ... in ... 结构进行处理。  
- readline() 每次只读取一行，通常比readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时，才应该使用 readline()。
<b> 注意：这三种方法是把每行末尾的'\n'也读进来了，它并不会默认的把'\n'去掉，需要我们手动去掉。 </b>

这三种方法是把每行末尾的'\n'也读进来了，它并不会默认的把'\n'去掉，需要我们手动去掉。


In [23]:
with open('test1.txt', 'r') as f1:
    list1 = f1.readlines()

In [24]:
list1

['111\n', '222\n', '333\n', '444\n', '555']

<b>######去掉n#####</b>

In [25]:
with open('test1.txt', 'r') as f1:
    list1 = f1.readlines()
for i in range(0, len(list1)):
    list1[i] = list1[i].rstrip('\n')
    
list1

['111', '222', '333', '444', '555']

# json.dumps使用

 用于将把python对象(dict类型/list类型)的数据转成str(json格式的str)，  
 (1).因为如果直接将dict类型/list类型的数据写入json文件中会发生报错，因此在将数据写入时需要用到该函数;   
 (2).json.dumps会格式化python对象的代码，转换成jsons标准格式。 

## 把python对象代码，转换成json格式

In [15]:
d = dict(name='Bob', age=20, score=88)
print(json.dumps(d))

{"age": 20, "score": 88, "name": "Bob"}


In [16]:
persons_dic = {'username': "zhangsan", 'age': 18, 'country': 'china'}
print(json.dumps(persons_dic))


{"country": "china", "age": 18, "username": "zhangsan"}


## python对象保存前使用

In [47]:
persons = [
            {
                'username': "张三",
                'age': 18,
                'country': 'china'
            },
            {
                'username': '李四',
                'age': 20,
                'country': 'china'
            },
            {
                'username': '王五',
                'age': 32,
                'country': 'china'
            }
        ]

In [10]:
print(type(persons))
print(type(json.dumps(persons)))

<class 'list'>
<class 'str'>


### python对象直接保存会报错

In [67]:
save_file(persons, 'person.json', 'utf-8')

TypeError: write() argument must be str, not list

### 先转换，后保存，不会报错

In [68]:
# 定义文件名
file_name = 'person.json'
# 如果存在，先删除
if os.path.exists(file_name):
    os.remove(file_name)
    print('成功移除文件：%s' % file_name)

# 保存文件
person_string = json.dumps(persons)
save_file(person_string, file_name , 'utf-8')

# 判断文件是否存在
if os.path.exists(file_name):
    print("person.json文件已生成...")


成功移除文件：person.json
person.json文件已生成...


# json.dump()使用

json.dump()用于将Python内置类型序列化为json对象后写入文件 

In [46]:
def dump_save_file(json_string, file_name, coding):
    """
    使用dump函数，保存文件
    # json.dump(json_string, fp) 这样写会中文乱码，
    # 如果要保存含有中文的字符串，建议加上ensure_ascii=False,json.dump默认使用ascii字符码

    :param json_string: 要保存的json字符串
    :param file_name: 要保存的文件名称
    :param coding: 字符编码(如utf-8)
    :return: 没有返回值
    """
    with open(file_name, 'w', encoding=coding) as fp:
        json.dump(json_string, fp, ensure_ascii=False)

## 使用json.dump进行dict直接保存,不会报错

In [69]:
# 定义文件名
file_name = 'person1.json'
# 如果存在，先删除
if os.path.exists(file_name):
    os.remove(file_name)
    print('成功移除文件：%s' % file_name)

# 保存文件
dump_save_file(persons, file_name, 'utf-8')
# 判断文件是否存在
if os.path.exists(file_name):
    print("person1.json文件已生成...")

成功移除文件：person1.json
person1.json文件已生成...


# json.loads 使用

 json.loads()把Json格式(str)字符串解码转换成Python对象(dict/list)

## 把字典转为json格式的字符串

In [70]:
print(type(persons))

<class 'list'>


In [74]:
# json.dumps 默认使用ascii编码
persons_str = json.dumps(persons)
print(persons_str)

[{"country": "china", "age": 18, "username": "\u5f20\u4e09"}, {"country": "china", "age": 20, "username": "\u674e\u56db"}, {"country": "china", "age": 32, "username": "\u738b\u4e94"}]


In [76]:
# 把ensure_ascii设为False中文不会乱
persons_str = json.dumps(persons,ensure_ascii=False)
print(persons_str)

[{"country": "china", "age": 18, "username": "张三"}, {"country": "china", "age": 20, "username": "李四"}, {"country": "china", "age": 32, "username": "王五"}]


## 把字符串转化为字典

In [78]:
persons_dict = json.loads(persons_str)
print(type(persons_dict))

<class 'list'>


In [79]:
print(persons_dict[0]['username'])

张三


In [45]:
name_emb = {'a':'1111','b':'2222','c':'3333','d':'4444'}
# 把字典转为json格式的字符串
jsDumps = json.dumps(name_emb)
# 把字符串转化为字典
jsLoads = json.loads(jsDumps)
 
print(name_emb)
print('*'*50)

print(jsDumps)
print('*'*50)

print(jsLoads)
print('*'*50)
 
print(type(name_emb))
print(type(jsDumps))
print(type(jsLoads))

{'b': '2222', 'c': '3333', 'a': '1111', 'd': '4444'}
**************************************************
{"b": "2222", "c": "3333", "a": "1111", "d": "4444"}
**************************************************
{'b': '2222', 'a': '1111', 'c': '3333', 'd': '4444'}
**************************************************
<class 'dict'>
<class 'str'>
<class 'dict'>


In [40]:
print(jsLoads['a'])

1111


In [44]:
print(jsDumps['a'])

TypeError: string indices must be integers

# json.load() 使用

json.load()用于从json文件中读取数据。

In [51]:
def read_json_file(file_name, coding):
    """
    使用json.load读取json文件
    :param file_name: 文件名
    :param coding: 编码（如utf-8）
    :return: <class 'list'>
    """
    with open(file_name, 'r', encoding=coding) as fp:
        persons = json.load(fp)
    return persons

In [80]:
person_list = read_json_file('person1.json', 'utf-8')
print(type(person_list))
print(person_list)


<class 'list'>
[{'country': 'china', 'age': 18, 'username': '张三'}, {'country': 'china', 'age': 20, 'username': '李四'}, {'country': 'china', 'age': 32, 'username': '王五'}]


In [83]:
person_list1 = read_json_file('person1.json', 'utf-8')
print(type(person_list1))
print(person_list1)

<class 'list'>
[{'country': 'china', 'age': 18, 'username': '张三'}, {'country': 'china', 'age': 20, 'username': '李四'}, {'country': 'china', 'age': 32, 'username': '王五'}]
