# 文件读写

Python对文件的操作大致就是三种, 打开文件, 操作文件, 关闭文件.
`open()`方法的返回值就是一个file对象, 可以赋值给变量, `f = open(filename, mode)`

所有具有`read`和`write`方法的对象, 都是file类型. 而所有file类型对象都可以使用`open`打开, `close`方法结束和被`with`上下文管理器管理

In [1]:
# 打开一个文件
f = open("./test.txt", "w")
# 向文件写入内容, 操作文件
f.write("Hello World")
# 关闭文件
f.close()

## 打开模式

* r: **只读**, 默认模式, 如果文件不存在就报错, 存在就正常读取
* w: **只写**, 如果文件不存在, 新建文件然后写入, 如果存在, 先清空文件内容, 再写入
* a: **追加**, 如果文件不存在, 新建文件, 然后写入, 如果存在, 在文件的最后追加写入
* x: **新建**, 如果文件存在则报错, 如果不存在就新建文件, 然后写入内容, 比w更安全
* b: **二进制模式**, 比如rb, wb, ab, 以byte类型操作数据
* +: **读写模式**, 比如r+, w+, a+

### b模式

二进制模式, 通常用来读取图片, 视频等内容. 在读写过程中需要自己指定编码格式

In [3]:
s = 'this is a test'
b = bytes(s,encoding='utf-8')

f = open('test.txt','w')
f.write(s)

##这样没问题，正常写入了文件。

##-------------------------------------------------
s = 'this is a test'
b = bytes(s,encoding='utf-8')

f = open('test.txt','wb')    ##注意多了个b
f.write(s)

##报错
# TypeError: a bytes-like object is required, not 'str'
##意思是它需要一个bytes类型数据，你却给了个字符串

##---------------------------------------------------
s = 'this is a test'
b = bytes(s,encoding='utf-8')

f = open('test.txt','wb')    ##注意多了个b
f.write(b)                        ##将变量b传给它，b是个bytes类型

TypeError: a bytes-like object is required, not 'str'

### +模式

* w+, 在读写前清空原文件内容, 不推荐使用
* a+, 只能在文件末尾写入, 不推荐使用
* r+, 读写模式, 可以结合`seek()`和`tell()`使用

### 编码问题

要读取非`UTF-8`编码的文件, 需要给`open()`函数传入encoding参数, 例如读取GBK编码的文件
```
f = open("gbk.txt", "r", encoding="gbk")
f.read()
```
遇到有些编码不规范的文件, 可能会抛出`UnicodeDecodeError`异常, 文件中可能夹杂了一些非法编码的字符. 这种情况下可以提供errors参数
```
f = open("gbk.txt", "r", encoding="gbk", errors="igonre")
```

### 文件对象操作

#### f.read(size)

读取一定大小的数据, 然后作为字符串或字节对象返回. size是一个可选的数字类型的参数, 用于指定读取的数据量. 当size被忽略, 那么文件的所有内容都将被读取
```
f = open("1.txt", "r")
str = f.read()
print(str)
f.close()
```
如果文件体积过大, 不要使用`read()`一次性全部读入

#### f.readline()

从文件中读取一行内容, 换行符为`\n`. 如果返回了一个空字符串, 说明已经读取到最后一行. 这种方法通常是读一行处理一行, 并且无法回溯
```
f = open("1.txt", "r")
str = f.readline()
print(str)
f.close()
```

#### f.readlines()

将文件中所有的行, 一行一行全部读入一个列表中, 按顺序一个个作为列表元素返回这个列表. `readlines`方法会一次性将文件全部读入内存
```
f = open("1.txt", "r")
a = f.readlines()
print(a)
f.close()
```

#### 遍历文件

将文件对象作为一个迭代器来使用:
```
f = open("1.txt", "r")
for line in f:
    print(line, end="")
f.close()
```

### f.write()

将字符串或bytes类型的数据写入文件内. `write()`可以多次重复进行, 其实都是内存内的操作, 但并不会立刻写回硬盘, 直到`close()`执行, 才会把所有的写入操作写入到硬盘中
```
# 打开一个文件
f = open("./test.txt", "w")
# 向文件写入内容, 操作文件
f.write("Hello World")
# 关闭文件
f.close()
```

### f.tell()

返回文件读写指针当前所指的位置, 从文件开头开始算起的**字节数**

### f.seek()

如果要改变文职指针的位置, 可以使用`f.seek(offset, from_what)`, `seek()`经常和`tell()`配合使用. from_what的取值, 如果是0表示从文件开头计算, 如果是1表示从文件读写指针的当前位置开始计算, 2表示从文件的结尾开始计算

### with关键字

with关键字用于Python的上下文管理器机制. 为了防止诸如open这一类文件打开方法在操作过程中出现异常或错误等问题, with关键字这种机制会保证文件会被正常关闭

```
with open("test.txt", "w") as f:
    f.write("Hello World")
```

with也支持同时打开多个文件
```
with open("log1") as obj1, open("log2", "w") as obj2:
    s = obj1.read()
    obj2.write(s)
```