# 第14章  处理CSV文件和JSON数据

- CSV和JSON：纯文本文件，可以用文本编辑器进行查看
- Python有专门的csv和json模块
- CSV：Comma Separated Values  逗号分隔的值。
    - CSV文件中每行代表电子表格中的一行，逗号分割了该行中的单元格
    - CSV文件是简单的，缺少Excel电子表格的许多功能：
        - 值没有类型，所有东西都是字符串
        - 没有字体大小或颜色的设置
        - 没有多个工作表
        - 不能指定单元格的宽度和高度
        - 不能合并单元格
        - 不能嵌入图像或图表
- JSON：JavaScript Object Notation

## csv模块

### Reader对象
- csv模块是Python自带的，无需安装
- open()函数打开CSV文件
- 不用在open()返回的File对象上调用read()或readlines()方法，而是将它传递给csv.reader()函数
- 不能直接将文件名字符串传递给csv.reader()函数
- 要访问Reader对象中的函数，直接将它转换成一个普通的Python列表，即将它传递给list()

In [7]:
import csv
exampleFile = open('example.csv')
exampleReader = csv.reader(exampleFile)
exampleData = list(exampleReader)
print(exampleData)

print(exampleData[0][0])
print(exampleData[0][1])
print(exampleData[0][2])
print(exampleData[1][0])

[['4/5/2014 13:34', 'Apples', '73'], ['4/5/2014 3:41', 'Cherries', '85'], ['4/6/2014 12:46', 'Pears', '14'], ['4/8/2014 8:59', 'Oranges', '52'], ['4/10/2014 2:07', 'Apples', '152'], ['4/10/2014 18:10', 'Bananas', '23'], ['4/10/2014 2:40', 'Strawberries', '98']]
4/5/2014 13:34
Apples
73
4/5/2014 3:41


### 在for循环中，从Reader对象读取数据

In [9]:
import csv
exampleFile = open('example.csv')
exampleReader = csv.reader(exampleFile)

for row in exampleReader:
    print('Row #' + str(exampleReader.line_num) + ' ' + str(row))  # 使用Reader对象的line_num变量，获取当前行的编号

Row #1 ['4/5/2014 13:34', 'Apples', '73']
Row #2 ['4/5/2014 3:41', 'Cherries', '85']
Row #3 ['4/6/2014 12:46', 'Pears', '14']
Row #4 ['4/8/2014 8:59', 'Oranges', '52']
Row #5 ['4/10/2014 2:07', 'Apples', '152']
Row #6 ['4/10/2014 18:10', 'Bananas', '23']
Row #7 ['4/10/2014 2:40', 'Strawberries', '98']


### Write对象
- Write对象将数据写入CSV文件
- Write对象的writerow()方法接受一个列表参数。列表中的每个词放在输出的CSV文件中的一个单元格中
- writerow()函数的返回值是写入文件中的这一行字符数（包括换行符）
- Write对象自动转义了‘Hello，world！’中的逗号，在CSV文件中使用了双引号。

In [16]:
import csv
outputFile = open('output.csv', 'w', newline='')
outputWriter = csv.writer(outputFile)
outputWriter.writerow(['spam', 'eggs', 'bacon', 'ham'])
outputWriter.writerow(['Hello, world!', 'eggs', 'bacon', 'ham'])
outputWriter.writerow([1, 2, 3.1415926, 4])
outputFile.close()


### delimiter和lineterminator关键字参数
- 用制表符分隔单元格: delimiter = '\t'
- 有两倍行距：lineterminator = '\n\n'


In [22]:
import csv
csvFile = open('example.tsv', 'w', newline='')
csvWriter = csv.writer(csvFile, delimiter = '\t', lineterminator = '\n\n')
csvWriter.writerow(['apples', 'oranges', 'grapes'])
csvWriter.writerow(['eggs', 'bacon', 'ham'])
csvWriter.writerow(['spam', 'spam', 'spam', 'spam', 'spam', 'spam'])
csvFile.close()

### 从CSV文件中删除表头
程序需要做到以下几点：
- 找出当前工作目录中的所有CSV文件
- 读取每一个文件的全部内容
- 跳过第一行，将内容写入一个新的CSV文件

在代码上，程序需要做到以下几点：
- 循环遍历从os.listdir()得到的文件列表，跳过非CSV文件
- 创建一个CSV Reader对象，读取该文件的内容，利用line_num属性确定要跳过哪一行
- 创建一个CSV Writer对象，将输入的数据写入新文件。

参见/AutomateTheBoringStuff/DealWithCSV&JSON/removeCsvHeader/removeCsvHeader.py

## JSON和API
- JSON是JavaScript程序编写数据结构的原生方式，通常类似python的pprint()函数产生的结果
- API返回的数据是针对机器格式化的（例如用JSON），API不是人容易阅读的


## json模块
- Python的json模块处理了JSON数据字符串和Python值之间转换的所有细节
- 得到了json.loads()和json.dumps()函数
- JSON通常不能存储每一种Python值，只能包含以下数据类型的值：
    - 字符串、整型、浮点型、布尔型、列表、字典和NoneType
- JSON不能表示Python特有的对象：
    - File对象、CSV Reader对象或Writer对象、Regex对象或Selenium WebElement对象

### 用loads()函数读取json
- 导入json模块后，就可以调用loads()，向它传入一个JSON数据字符串
- JSON字符串总是用双引号
- 将数据返回为一个Python字典，Python字典是没有顺序的，如果打印jsonDataAsPythonValue，键-值对可能已不同顺序出现

In [30]:
stringOfJsonData = '{"name": "Zophie", "isCat": true, "miceCaught": 0, "felineIQ": null}'

import json
jsonDataAsPythonValue = json.loads(stringOfJsonData)
print(jsonDataAsPythonValue)

{'name': 'Zophie', 'isCat': True, 'miceCaught': 0, 'felineIQ': None}


### 用dumps函数写出JSON
- json.dumps()函数  表示的是dump string 而不是dumps
- 它将一个Python值转换为JSON格式的数据字符串

In [31]:
pythonValue = {'name': 'Zophie', 'isCat': True, 'miceCaught': 0, 'felineIQ': None}

import json
stringOfJsonData = json.dumps(pythonValue)
print(stringOfJsonData)

{"name": "Zophie", "isCat": true, "miceCaught": 0, "felineIQ": null}


## 项目：取得当前的天气数据
程序将执行以下操作：
- 从命令行读取请求位置
- 从OpenWeatherMap.org下载JSON天气数据
- 将JSON数据字符串转换成Python的数据结构
- 打印今天和未来两天的天气

代码需要执行以下任务：
- 连接sys.argv中的字符串，得到位置
- 调用requests.get()，下载天气数据
- 调用json.loads(),将JSON数据转换为Python数据结构
- 打印天气预报

参考quickWeather.py