# 第14章  处理CSV文件和JSON数据

- CSV和JSON：纯文本文件，可以用文本编辑器进行查看
- Python有专门的csv和json模块
- CSV：Comma Separated Values  逗号分隔的值。
    - CSV文件中每行代表电子表格中的一行，逗号分割了该行中的单元格
    - CSV文件是简单的，缺少Excel电子表格的许多功能：
        - 值没有类型，所有东西都是字符串
        - 没有字体大小或颜色的设置
        - 没有多个工作表
        - 不能指定单元格的宽度和高度
        - 不能合并单元格
        - 不能嵌入图像或图表
- JSON：JavaScript Object Notation

## csv模块

### Reader对象
- csv模块是Python自带的，无需安装
- open()函数打开CSV文件
- 不用在open()返回的File对象上调用read()或readlines()方法，而是将它传递给csv.reader()函数
- 不能直接将文件名字符串传递给csv.reader()函数
- 要访问Reader对象中的函数，直接将它转换成一个普通的Python列表，即将它传递给list()

In [7]:
import csv
exampleFile = open('example.csv')
exampleReader = csv.reader(exampleFile)
exampleData = list(exampleReader)
print(exampleData)

print(exampleData[0][0])
print(exampleData[0][1])
print(exampleData[0][2])
print(exampleData[1][0])

[['4/5/2014 13:34', 'Apples', '73'], ['4/5/2014 3:41', 'Cherries', '85'], ['4/6/2014 12:46', 'Pears', '14'], ['4/8/2014 8:59', 'Oranges', '52'], ['4/10/2014 2:07', 'Apples', '152'], ['4/10/2014 18:10', 'Bananas', '23'], ['4/10/2014 2:40', 'Strawberries', '98']]
4/5/2014 13:34
Apples
73
4/5/2014 3:41


### 在for循环中，从Reader对象读取数据

In [9]:
import csv
exampleFile = open('example.csv')
exampleReader = csv.reader(exampleFile)

for row in exampleReader:
    print('Row #' + str(exampleReader.line_num) + ' ' + str(row))  # 使用Reader对象的line_num变量，获取当前行的编号

Row #1 ['4/5/2014 13:34', 'Apples', '73']
Row #2 ['4/5/2014 3:41', 'Cherries', '85']
Row #3 ['4/6/2014 12:46', 'Pears', '14']
Row #4 ['4/8/2014 8:59', 'Oranges', '52']
Row #5 ['4/10/2014 2:07', 'Apples', '152']
Row #6 ['4/10/2014 18:10', 'Bananas', '23']
Row #7 ['4/10/2014 2:40', 'Strawberries', '98']


### Write对象
- Write对象将数据写入CSV文件
- Write对象的writerow()方法接受一个列表参数。列表中的每个词放在输出的CSV文件中的一个单元格中
- writerow()函数的返回值是写入文件中的这一行字符数（包括换行符）
- Write对象自动转义了‘Hello，world！’中的逗号，在CSV文件中使用了双引号。

In [16]:
import csv
outputFile = open('output.csv', 'w', newline='')
outputWriter = csv.writer(outputFile)
outputWriter.writerow(['spam', 'eggs', 'bacon', 'ham'])
outputWriter.writerow(['Hello, world!', 'eggs', 'bacon', 'ham'])
outputWriter.writerow([1, 2, 3.1415926, 4])
outputFile.close()


### delimiter和lineterminator关键字参数
- 用制表符分隔单元格: delimiter = '\t'
- 有两倍行距：lineterminator = '\n\n'


In [22]:
import csv
csvFile = open('example.tsv', 'w', newline='')
csvWriter = csv.writer(csvFile, delimiter = '\t', lineterminator = '\n\n')
csvWriter.writerow(['apples', 'oranges', 'grapes'])
csvWriter.writerow(['eggs', 'bacon', 'ham'])
csvWriter.writerow(['spam', 'spam', 'spam', 'spam', 'spam', 'spam'])
csvFile.close()

### 从CSV文件中删除表头
程序需要做到以下几点：
- 找出当前工作目录中的所有CSV文件
- 读取每一个文件的全部内容
- 跳过第一行，将内容写入一个新的CSV文件

在代码上，程序需要做到以下几点：
- 循环遍历从os.listdir()得到的文件列表，跳过非CSV文件
- 创建一个CSV Reader对象，读取该文件的内容，利用line_num属性确定要跳过哪一行
- 创建一个CSV Writer对象，将输入的数据写入新文件。

参见/AutomateTheBoringStuff/DealWithCSV&JSON/removeCsvHeader/removeCsvHeader.py

## JSON和API
- JSON是JavaScript程序编写数据结构的原生方式，通常类似python的pprint()函数产生的结果
- API返回的数据是针对机器格式化的（例如用JSON），API不是人容易阅读的


## json模块
- Python的json模块处理了JSON数据字符串和Python值之间转换的所有细节
- 得到了json.loads()和json.dumps()函数
- JSON通常不能存储每一种Python值，只能包含以下数据类型的值：
    - 字符串、整型、浮点型、布尔型、列表、字典和NoneType
- JSON不能表示Python特有的对象：
    - File对象、CSV Reader对象或Writer对象、Regex对象或Selenium WebElement对象

### 用loads()函数读取json
- 导入json模块后，就可以调用loads()，向它传入一个JSON数据字符串
- JSON字符串总是用双引号
- 将数据返回为一个Python字典，Python字典是没有顺序的，如果打印jsonDataAsPythonValue，键-值对可能已不同顺序出现

In [25]:
stringOfJsonData = '
    "status":0,
    "message":"ok",
    "total":10,
    "results":[
        {
            "name":"罗世文烈士史料陈列馆",
            "location":{
                "lat":29.532769,
                "lng":104.678836
            },
            "address":"四川省内江市威远县公园路北(大风车儿童乐园附近)",
            "province":"四川省",
            "city":"内江市",
            "area":"威远县",
            "telephone":"(0832)8101197",
            "detail":1,
            "uid":"8a6079f6877d7321a20464e3"
        },
        {
            "name":"资中博物馆",
            "location":{
                "lat":29.786495,
                "lng":104.858368
            },
            "address":"内江市资中县武庙街62号",
            "province":"四川省",
            "city":"内江市",
            "area":"资中县",
            "telephone":"(0832)5518339",
            "detail":1,
            "uid":"14076dee180126f503294f9a"
        },
        {
            "name":"爱品客(翠花街店)",
            "location":{
                "lat":29.781853,
                "lng":104.86157
            },
            "address":"四川省内江市资中县中东街72",
            "province":"四川省",
            "city":"内江市",
            "area":"资中县",
            "telephone":"18680961319",
            "detail":1,
            "uid":"15f60d8f386b3419f60e771d"
        },
        {
            "name":"张大千美术馆",
            "location":{
                "lat":29.598763,
                "lng":105.064276
            },
            "address":"内江市东兴区大千路336号",
            "province":"四川省",
            "city":"内江市",
            "area":"东兴区",
            "street_id":"52e0c91b25c40da002897207",
            "detail":1,
            "uid":"52e0c91b25c40da002897207"
        },
        {
            "name":"石牌坊博物馆",
            "location":{
                "lat":29.350544,
                "lng":105.286194
            },
            "address":"内江市隆昌市金华路与隆华西路交叉口西北150米",
            "province":"四川省",
            "city":"内江市",
            "area":"隆昌市",
            "detail":1,
            "uid":"615f98b16b0638fc2ce67bc4"
        },
        {
            "name":"内江书画院",
            "location":{
                "lat":29.599704,
                "lng":105.065455
            },
            "address":"四川省内江市东兴区东桐路园丁山",
            "province":"四川省",
            "city":"内江市",
            "area":"东兴区",
            "telephone":"(0832)2255773",
            "detail":1,
            "uid":"ec747168cd8de416cf06a41d"
        },
        {
            "name":"茂康民俗博物馆",
            "location":{
                "lat":29.786638,
                "lng":104.861072
            },
            "address":"公园路与荷花池街交叉口西50米",
            "province":"四川省",
            "city":"内江市",
            "area":"资中县",
            "detail":1,
            "uid":"bcb46654105458d9b64f5488"
        },
        {
            "name":"牌楼霓光艺术像馆",
            "location":{
                "lat":29.579858,
                "lng":105.071122
            },
            "address":"环城路488号",
            "province":"四川省",
            "city":"内江市",
            "area":"市中区",
            "street_id":"143dc5fba337cc38d8ecedbd",
            "detail":1,
            "uid":"143dc5fba337cc38d8ecedbd"
        },
        {
            "name":"快乐宝贝艺术馆",
            "location":{
                "lat":29.439477,
                "lng":105.353301
            },
            "address":"环镇路东50米",
            "province":"四川省",
            "city":"内江市",
            "area":"隆昌市",
            "detail":1,
            "uid":"9b1d10de2f5d09a4e8e58277"
        },
        {
            "name":"大蓬车表演艺术馆",
            "location":{
                "lat":29.597676,
                "lng":105.08239
            },
            "address":"中兴路115号",
            "province":"四川省",
            "city":"内江市",
            "area":"东兴区",
            "street_id":"ce1691bd69d44e20c5effb09",
            "detail":1,
            "uid":"ce1691bd69d44e20c5effb09"
        }
    ]
'

import json
jsonDataAsPythonValue = json.loads(stringOfJsonData)
print(jsonDataAsPythonValue)

SyntaxError: EOL while scanning string literal (<ipython-input-25-6a0c3e399f02>, line 1)

### 用dumps函数写出JSON
- json.dumps()函数  表示的是dump string 而不是dumps
- 它将一个Python值转换为JSON格式的数据字符串