# JSON
- JavaScript Object Notation(JavaScript对象表示法)
- JSON是存储和交换文本信息的语法，类似XML
- JSON比xml更小，更快，更易解析
- 使用JavaScript语法来描述数据对象
- JSON语法是JavaScript语法的子集。由于这种相似性，无需解析器，JavaScript 程序能够使用内建的 eval() 函数，用 JSON 数据来生成原生的 JavaScript 对象。
    - JSON.parse（）：将一个JSON字符串转化为JavaScript对象
    - JSON.stringify():将JavaScript值转化为JSON字符串
- JSON 数据的书写格式是：
    - 名称/值对，用大括号包裹。如{"name" : "菜鸟教程"}，
    - JSON键必须是字符串，json中的字符串必须用双引号不能使用单引号包裹
    - JSON值可以是数字，字符串，逻辑值，数组，对象，null
    - 多个键值对用逗号隔开
    - JSON对象可以嵌套
- json和Python格式的对应,python中只有基本数据类型才可以转换成json格式
    - 字符串：字符串
    - 数字：数字
    - 数组：list，tuple
    - 对象：dict
    - 布尔值(小写)：布尔值
    - null：None
- python中的json包
    - json和Python的相互转换
        - json.dumps(obj)：对数据编码，把Python格式表示成json格式
        - json.loads(obj):对数据解码，将json格式转换为Python，不需要写入文件
        - json.dump(obj, file):把Python格式转化为json格式，同时把内容写入file
        - json.load(obj,file)：把json文件内容读入Python
        - 注意，在将Python数据写成json格式时，若含有中文，需要在dumps中把参数设置成这样ensure_ascii=False
- 参数
    - Skipkeys：默认值是False，如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None)，设置为False时，就会报TypeError的错误。此时设置成True，则会跳过这类key

    - ensure_ascii：默认值True，如果dict内含有non-ASCII的字符，则会类似\uXXXX的显示数据，设置成False后，就能正常显示

    - indent：应该是一个非负的整型，如果是0，或者为空，则一行显示数据，否则会换行且按照indent的数量显示前面的空白，这样打印出来的json数据也叫pretty-printed json

    - separators：分隔符，实际上是(item_separator, dict_separator)的一个元组，默认的就是(',',':')；这表示dictionary内keys之间用“,”隔开，而KEY和value之间用“：”隔开。

    - encoding：默认是UTF-8，设置json数据的编码方式。

    - sort_keys：将数据根据keys的值进行排序。

    - Decode过程，是把json对象转换成python对象的一个过程，常用的两个函数是loads和load函数。区别跟dump和dumps是一样的
    
# Json进阶
- 把类对象序列化为json对象：json.dumps()中有一个参数default,这个参数就是把任意一个对象变成可序列为json对象的参数，为此，需要传入一个函数参数，就可把类对象序列化为json对象
        json.dumps(类实例, lambda obj: obj.__dict__)
- 把json反序列化为一个类对象实例，同样需要指定一个函数

In [1]:
import json

info = [
    {"name": "刘涛", "age": 23},
    {"name": "娇娇", "age": 21}
]
json_info = json.dumps(info)
print(json_info)
json_info = json.dumps(info, ensure_ascii=False)
print(json_info)

[{"name": "\u5218\u6d9b", "age": 23}, {"name": "\u5a07\u5a07", "age": 21}]
[{"name": "刘涛", "age": 23}, {"name": "娇娇", "age": 21}]


In [4]:
# json进阶:第一种方法
# 缺点：只能针对某一个特定类对象的实例，不能针对多个类
import json

# 定义一个类对象
class Student():
    def __init__(self, name, age, score):
        self.name = name
        self.age = age
        self.score = score

s = Student("jiaojiap", 21, 99)

# 定义一个将实例转化成dict的函数
def stu_to_dict(stu):
    return {
        "name": stu.name,
        "age": stu.age,
        "score": stu.score
    }
print(json.dumps(s, default=stu_to_dict))

{"name": "jiaojiap", "age": 21, "score": 99}


In [8]:
# json进阶，第二种
import json

# 定义一个类对象
class Teacher():
    def __init__(self, name, age, salary):
        self.name = name
        self.age = age
        self.salary = salary

s = Teacher("LiuLaoshi", 23, 8000)

print(json.dumps(s, default=lambda obj: obj.__dict__))

{"name": "LiuLaoshi", "age": 23, "salary": 8000}


In [15]:
# json反序列化为实例对象
json_str = '{"age": 23, "score": 100, "name": "taotao"}'
def json_to_stu(d):
    return Student(d['name'], d['age'], d['score'])
new_stu = json.loads(json_str, object_hook=json_to_stu)
print(new_stu.name, new_stu.age, new_stu.score)

taotao 23 100


# CSV模块
- 方法：
    - csv.reader(csvfile, dialect='excel', **fmtparams):读取csv数据格式
        - dialect参数：以什么规范操作csv文件，可选的参数有三个，分别是excel，excel-tab和unix,，'excel-tab'指用tab键分隔。默认是excel，也就是用逗号分隔，这个参数支持自定义
                - 自定义：csv.register_dialect('mydialect',delimiter='|', quoting=csv.QUOTE_ALL) ，然后在reader中设置参数dialect="mydialect"
                - csv.list_dialects()：列出dialects方法有哪些
        - fmtparam:格式化参数，用来覆盖之前dialect对象指定的编码风格。
            - delimiter="":指定分隔符的
            - quotechar="":指明引用符
            - quoting：指明引用的模式：QUOTE_ALL、QUOTE_MINIMAL、.QUOTE_NONNUMERIC等
            - 详见：https://blog.csdn.net/dominic_z/article/details/81362610
    - writer = csv.writer(file, dialect='excel', **fmtparams):
        - 用法：
             - writer.writerow()单行写入
             - writer.writerows()多行写入
    - writer = csv.DictWriter(file, 表头)以字典方式写入
    

In [8]:
# csv模块用法
import os
import csv

# 普通方法写入
headers = ["name", "age", "address"]
info = [("liutao", 23, "chengdu"),
       ("jiaojiao", 21, "chengdu"),
       ("xiaoxiao", 22, "shanghai")]
os.chdir(r"C:\Users\acer\Desktop")
# newline是如果不设置他默认是\n,也就是会默认空一行
with open("test.csv", "w", encoding='utf-8', newline='') as f:
    writer = csv.writer(f)
    writer.writerow(headers)
    writer.writerows(info)
    
print("写入完成")

写入完成


In [13]:
# 以字典方式写入
info = [
    {"username": "liutao", "usetools": "phone", "age": 23},
    {"username": "jiaojiao", "usetools": "computer", "age": 21},
    {"username": "xiaoxiao", "usetools": "ipad", "age": 22}
    
]
headers = ["username", "usetools", "age"]

with open("testing.csv", "w", encoding="utf-8", newline="") as f:
    writer = csv.DictWriter(f, headers)
    #表头需要单独写入
    writer.writeheader()
    writer.writerows(info)
    
print("写入完成")

写入完成


In [14]:
# 用字典方式读取csv数据
with open("testing.csv", "r", encoding="utf-8") as f:
    reader = csv.DictReader(f)
    # reader是一个迭代器，而且这种方法读出的数据不包含header
    for x in reader:
        print(x)

OrderedDict([('username', 'liutao'), ('usetools', 'phone'), ('age', '23')])
OrderedDict([('username', 'jiaojiao'), ('usetools', 'computer'), ('age', '21')])
OrderedDict([('username', 'xiaoxiao'), ('usetools', 'ipad'), ('age', '22')])


# Excel文件处理
- 需要用到xlrd，xlwt两个库

## 获取sheet
- 一个Excel可能含有多个sheet，可以通过以下方法获取
    - sheet_names:获取所有的sheet名字
    - sheet_by_index:根据索引获取sheet对象
    - sheet_by_name:根据名字获取sheet对象
    - sheets：获取所有的sheet对象
    - sheet.nrows:这个sheet中的行数
    - sheet.nclos:这个sheet中的列数
    
## 获取cell及其属性
- 每个cell代表表格中的一员
- sheet.cell(row, col):获取指定行和列的cell对象
- sheet.row_slice(row, start_col, end_col):获取指定行的某几列的cell对象
- sheet.col_slice(col, start_row, end_row):获取指定列的某几行的cell对象
- sheet.cell_value(row,col):获取指定行和列的值
- sheet.row_values(row, start_col, end_col):获取指定行的某几列的值
- sheet.col_value(col, start_row, end_row)获取指定列的某几行的值
- cell.ctype:获取cell的数据类型,得到的是一个数字，每个数字代表什么类型可以看下面cell的数据类型
- cell.value:获取cell的值

### cell的数据类型
- 1.xlrd.XL_CELL_TEXT(text):文本类型 1
- 2.xlrd.XL_CELL_NUMBEER(number）:数值类型 2
- 3.xlrd.XL_CELL_DATA(Date):日期时间 3
- 4.xlrd.XL_CELL_BOOLEAN(bool）：布尔类型 4
- r.xlrd.XL_CELL_BLANK：空白数据类性 0


# 写入Excel
- 写入Excel步骤如下：
    - 1.导入xlwt模块
    - 2.创建一个workbook对象
    - 3.创建一个sheet对象
    - 4.把数据写入到sheet下指定行和列中，如果想要在原来的workbook对象上添加新的cell，那么需要调用put_cell来添加值
    - 5.保存成Excel文件
    
# 

In [None]:
import xlrd
import os
os.chdir(r"C:\Users\acer\Desktop")
workbook = xlrd.open_workbook("记账.xls",encoding="utf-8")
sheet = workbook.sheet_by_index(0)

#使用cell方法获取指定的cell对象
for col in range(sheet.ncols):
    for row in range(sheet.nrows):
        print(sheet.cell(row, col))
        
# 使用row_slice获取第0行的1-2列的cell对象
cells = sheet.row_slice(0, 1, 3)
print(cells)

# 使用col_slice获取第0列的10=-2行的cell对象
cells = sheet.col_slice(0, 1, 3)
print(cells)