- stram
- 速度匹配
- 同步，异步
- 
注意，本章的IO编程都是同步模式，异步IO由于复杂度太高，后续涉及到服务器端程序开发时我们再讨论。

## 13.1 文件读写

### read
- 操作系统、磁盘
- ```try...finally```
- ```with...close```
- ```read()```, ```read(size)```, ```readline()```, ```readlines()```
```python
for line in f.readlines():
    print(line.strip()) # 把末尾的'\n'删掉

```

- file-like Object
- ```open()```, ```read()```
- ```open("xxxxxxxxx", "rb")```
- ```open('xxxxxx', 'r', encoding='gbk')```
- ```open('xxxxxx', 'r', encoding='gbk', errors='ignore')```

### write

- ```'w'```, ```'wb'```
- ```write()``` -> buffer -> file, f.close() -> finish.
- ```'w'```, ```'a'```  [参数说明](https://docs.python.org/3/library/functions.html#open)

### practise

请将本地一个文本文件读为一个str并打印出来：

In [2]:
%%writefile tt

123
321

Writing tt


In [3]:
fpath = r'./tt'

with open(fpath, 'r') as f:
    s = f.read()
    print(s)

# 运行代码观察结果



123
321



在Python中，文件读写是通过```open()```函数打开的文件对象完成的。使用```with```语句操作文件IO是个好习惯。

## 13.2 StringIO 和 BytesIO

模拟

### 小结
```StringIO```和```BytesIO```是在内存中操作```str```和```bytes```的方法，使得和读写文件具有一致的接口。

## 13.3 操作文件和目录

python 中的 ```os``` 模块可以调用操作系统提供的各种接口。

因此，通过```os```模块实现各种地址和文件操作可以更好的兼容不同的操作系统。

### practise
1. 利用os模块编写一个能实现dir -l输出的程序。
2. 编写一个程序，能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件，并打印出相对路径。(递归查找， list.extend())

In [None]:
import os
os.listdir('.')

['10_面向对象编程.ipynb',
 '11_面向对象高级编程.ipynb',
 '12_错误_调试和测试.ipynb',
 '13_IO编程.ipynb',
 '5_Python基础.ipynb',
 '6_函数.ipynb',
 '7_高级特性.ipynb',
 '8_函数式编程.ipynb',
 '9_模块.ipynb',
 'doctest_practise.py',
 'mydict_doctest.py',
 'README.md',
 'tmp.py',
 'tt',
 'unittest_practise.py']

### 小结
Python的```os```模块封装了操作系统的目录和文件操作，要注意这些函数有的在```os```模块中，有的在```os.path```模块中。

除此以外```shutil```模块中也有很多实用的函数，可以当作对```os```模块的补充。

## 13.4 序列化

我们把变量从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。

 对保存和接收的序列化数据，可以通过反序列化得到保存的信息。

 Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系。

In [5]:
import pickle
d = dict(name='Bob', age=20, score=88)
pickle.dumps(d)

b'\x80\x04\x95$\x00\x00\x00\x00\x00\x00\x00}\x94(\x8c\x04name\x94\x8c\x03Bob\x94\x8c\x03age\x94K\x14\x8c\x05score\x94KXu.'

### JSON

更泛用

- default
- ```json.load()``` 与 ```json.loads()```

In [9]:
import json

class Student(object):
    def __init__(self, name, age, score):
        self.name = name
        self.age = age
        self.score = score

s = Student('Bob', 20, 88)

def student2dict(std):
    return {
        'name': std.name,
        'age': std.age,
        'score': std.score
    }

print(json.dumps(s, default=student2dict))

{"name": "Bob", "age": 20, "score": 88}


In [11]:
s = [Student('Bob', 20, 88), Student('QAQ', 28, 18)]
print(json.dumps(s, default=student2dict))

[{"name": "Bob", "age": 20, "score": 88}, {"name": "QAQ", "age": 28, "score": 18}]


In [12]:
print(json.dumps({'a':'A', 'b': 'B'}, default=student2dict))

{"a": "A", "b": "B"}


In [26]:
import json

obj = dict(name='小明', age=20)
s = json.dumps(obj, ensure_ascii=True)
s
# json.load(s, ensure_ascii=False)

'{"name": "\\u5c0f\\u660e", "age": 20}'

In [27]:
json.loads(s)

{'name': '小明', 'age': 20}

### 小结
Python语言特定的序列化模块是```pickle```，但如果要把序列化搞得更通用、更符合Web标准，就可以使用```json```模块。

```json```模块的```dumps()```和```loads()```函数是定义得非常好的接口的典范。当我们使用时，只需要传入一个必须的参数。但是，当默认的序列化或反序列机制不满足我们的要求时，我们又可以传入更多的参数来定制序列化或反序列化的规则，既做到了接口简单易用，又做到了充分的扩展性和灵活性。