内置函数`open`能够创建一个Python文件对象作为计算机一个文件的链接。在调用open后，可以通过返回的文件对象的方法，在程序和对应文件之间来回传递串形式的数据

## 打开文件

```python
afile = open(filename, mode)
```
mode: r -> 读， w -> 写， a -> 添加， b -> 二进制处理 + -> 同时读写  
afile 是函数产生的文件对象

- 文件迭代器最适合逐行读取
- 内容是字符串，不是对象
- 文件是被缓冲的以及可定位的
- close是可选的，回收时会自动关闭

In [1]:
myfile = open("myfile.txt", 'w') # 打开一个文件，写操作

In [2]:
myfile.write("hello text file \n") # 向文件中写入一行数据

17

In [3]:
myfile.write("goodbye text file \n") 

19

In [4]:
myfile.close() # 关闭文件对象

In [5]:
myfile = open("myfile.txt") # 以默认的读模式打开文件

In [6]:
myfile.readline() # 读取一行

'hello text file \n'

In [7]:
myfile.readline() # 读取一行


'goodbye text file \n'

In [8]:
myfile.readline() # 读取一行

''

In [10]:
open("myfile.txt", "r").read() # 使用read读取整个文件

'hello text file \ngoodbye text file \n'

In [11]:
for line in open("myfile.txt"): # 使用文件迭代器逐行读取
    print(line, end="")

hello text file 
goodbye text file 


## 文本和二进制文件

-  文本文件把内容表示为常规的str字符串，自动执行Unicode编码和解码，并且默认地执行末行转换
- 二进制文件把内容表示为一个特殊地bytes 字符串类型，并且允许程序不修改地访问文件内容

## 在文件中存储python对象: 转换

python不能存储对象，必须将对象转化成字符串存储

In [12]:
X, Y, Z = 43, 44, 45
S = 'Spam'
D = {'a':1, 'b':2}
L = [1, 2, 3]

In [16]:
F = open("datafile.txt", 'w')

In [17]:
F.write(S + '\n') # 字符串后加换行

5

In [18]:
F.write('%s, %s, %s\n'%(X, Y, Z)) # 将数字转成字符串

11

In [19]:
F.write(str(L) + '$' + str(D) + '\n')

27

In [20]:
F.close()

In [23]:
for char in open('datafile.txt'):
    print(char)

Spam

43, 44, 45

[1, 2, 3]${'a': 1, 'b': 2}



In [24]:
open("datafile.txt").read()

"Spam\n43, 44, 45\n[1, 2, 3]${'a': 1, 'b': 2}\n"

从文件中读取得到的是字符串，但是手动转成对象才行

## 存储原生对象： pickle

pickle 能够让我们直接在文件中存储几乎任何Python对象地高级工具,同时并不需要我们对字符串进行来回转换

In [26]:
D = {'a':1, 'b':2}

In [28]:
F = open("datafile.pkl", "wb") # 注意二进制形式

In [29]:
import pickle

In [30]:
pickle.dump(D, F) # 将字典写到F文件中去
F.close()

In [31]:
F = open("datafile.pkl", 'rb')
E = pickle.load(F) # 从文件中加载对象
E

{'a': 1, 'b': 2}

## 用JSON格式存储Python对象

In [35]:
name = dict(first='Bob', last='Smith')
name

{'first': 'Bob', 'last': 'Smith'}

In [36]:
rec = dict(name=name, job=['dev', 'mgr'], age=4.5)
rec

{'name': {'first': 'Bob', 'last': 'Smith'}, 'job': ['dev', 'mgr'], 'age': 4.5}

In [37]:
import json
json.dumps(rec)

'{"name": {"first": "Bob", "last": "Smith"}, "job": ["dev", "mgr"], "age": 4.5}'

In [39]:
S = json.dumps(rec) # 将字典转成内存中地字符串
S

'{"name": {"first": "Bob", "last": "Smith"}, "job": ["dev", "mgr"], "age": 4.5}'

In [40]:
O = json.loads(S) # 将字符串加载为字典
O

{'name': {'first': 'Bob', 'last': 'Smith'}, 'job': ['dev', 'mgr'], 'age': 4.5}

In [42]:
json.dump(rec, fp=open("testjson.txt", 'w'), indent=4)
print(open('testjson.txt').read())

{
    "name": {
        "first": "Bob",
        "last": "Smith"
    },
    "job": [
        "dev",
        "mgr"
    ],
    "age": 4.5
}


In [44]:
P = json.load(open("testjson.txt"))
P

{'name': {'first': 'Bob', 'last': 'Smith'}, 'job': ['dev', 'mgr'], 'age': 4.5}

## 存储打包二进制数据: struct

In [45]:
F = open("data.bin", 'wb')

In [46]:
import struct

In [47]:
data = struct.pack('>i4sh', 7, b'spam', 8)
data

b'\x00\x00\x00\x07spam\x00\x08'

In [48]:
F.write(data)
F.close()

In [49]:
F = open('data.bin', 'rb')
data = F.read()

In [51]:
data

b'\x00\x00\x00\x07spam\x00\x08'

In [52]:
values = struct.unpack('>i4sh', data)
values

(7, b'spam', 8)