# 文件操作

## 1 文件操作基本知识

无论是文本文件还是二进制文件，其操作流程基本都是一致的，首先打开文件并创建文件对象，然后通过该文件对象对文件进行读取、写入、删除和修改等操作，最后关闭并保存文件内容。

### 1.1 内置函数`open()`

Python内置函数`open()`可以指定模式打开指定文件并创建文件对象，该函数的完整的用法如下：

        open(file, mode='r', buffering=-1, encoding=None, errors=None,newline=None, closefd=True, opener=None)
内置函数`open()`的主要参数函数如下:
- 参数`file`指定要打开或创建的文件名称，如果该文件不在当前目录中，可以使用相对路径或绝对路径。
- 参数`mode`指定打开文件的处理方式，其取值范围见表2.5。
- 参数`encoding`指定对文本进行编码和解码的方式，只适用于文本模式，可以使用Python支持的任何格式，如GBK、UTF-8、CP936等。



| 模式  |                       说明                       |
|:---:|:----------------------------------------------:|
| r	  |           读模式(默认模式，可省略)，如果文件不存在则抛出异常           |
| w	  |              写模式，如果文件已存在，先清空原有内容               |
| x	  |             写模式，创建新文件，如果文件已存在则抛出异常             |
| a	  |                追加模式，不覆盖文件中原有内容                 |
| b	  | 二进制模式（可与其他模式组合使用），使用二进制模式打开文件时不允许指定encoding参数  |
| t	  |                 文本模式（默认模式，可省略）                 |
| +	  |               读、写模式（可与其他模式组合使用）                |
<center>表格2.5</center>

### 1.2 文件常用函数

如果执行正常，open()函数返回1个可迭代的文件对象，通过该文件对象可以对文件进行读写操作，文件对象常用方法如表2.6所示。

|           方法	           |                                         功能说明                                         |
|:-----------------------:|:------------------------------------------------------------------------------------:|
|        close()	         |                              把缓冲区的内容写入文件，同时关闭文件，并释放文件对象                              |
|      read([size])	      |             从文本文件中读取size个字符作为结果返回，或从二进制文件中读取指定数量的字节并返回，如果省略size则表示读取所有内容             |
|       readline()	       |                                  从文本文件中读取一行内容作为结果返回                                  |
|      readlines()	       |                   把文本文件中的每行文本作为一个字符串存入列表中，返回该列表，对于大文件会占用较多内存，不建议使用                   |
| seek(offset[,whence])	  | 把文件指针移动到指定位置，offset表示相对于whence的偏移量。whence为0表示从文件头开始计算，1表示从当前位置开始计算，2表示从文件尾开始计算，默认为0  |
|         tell()	         |                                     返回文件指针的当前位置                                      |
|        write(s)	        |                                     把字符串s的内容写入文件                                     |
|     writelines(s)	      |                                 把字符串列表写入文本文件，不添加换行符                                  |
<center>表2.6</center>

### 1.3 上下文管理语句with

在实际应用中，读写文件应优先考虑使用上下文管理语句with，关键字with可以自动管理资源，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，释放资源，比如文件使用后自动关闭。with语句的用法如下：
`with open(filename, mode, encoding) as fp`: #通过文件对象`fp`读写文件内容


In [1]:
with open('data2_2') as fp:
    L1=[]; L2=[];
    for line in fp:
        L1.append(len(line))
        L2.append(len(line.strip()))  #去掉换行符
data = [str(num)+'\t' for num in L2]  #转换为字符串
print(L1); print(L2)
with open('data2_42', 'w') as fp2:
    fp2.writelines(data)

[58, 52, 57, 54, 57]
[57, 51, 56, 53, 57]


随机产生一个数据矩阵，把它存入具有不同分隔符格式的文本文件中，再把数据从文本文件中提取出来。


In [2]:
import numpy as np
a=np.random.rand(6,8)  #生成6×8的[0,1)上均匀分布的随机数矩阵
np.savetxt("data2_43_1.txt", a)  #存成以制表符分隔的文本文件
np.savetxt("data2_43_2.csv", a, delimiter=',')  #存成以逗号分隔的CSV文件
b=np.loadtxt("data2_43_1.txt")   #加载空格分隔的文本文件
c=np.loadtxt("data2_43_2.csv", delimiter=',')  #加载CSV文件
print('b为\n', b);print('c为\n', c)

b为
 [[0.90639968 0.08070739 0.14078191 0.15876783 0.49265307 0.05708421
  0.17118227 0.07351293]
 [0.52231773 0.25374102 0.51907801 0.06861019 0.56766112 0.22250735
  0.22212059 0.55115416]
 [0.5830217  0.45916982 0.5774143  0.38621261 0.01870012 0.0953844
  0.94554359 0.32718355]
 [0.97528312 0.59379145 0.52603636 0.60094546 0.89112041 0.09351341
  0.28103503 0.85133149]
 [0.13790593 0.94681666 0.51464086 0.84252926 0.38883035 0.66716694
  0.19980099 0.76098937]
 [0.96953351 0.24596862 0.57948041 0.79747427 0.11757246 0.77870842
  0.96686101 0.66300314]]
c为
 [[0.90639968 0.08070739 0.14078191 0.15876783 0.49265307 0.05708421
  0.17118227 0.07351293]
 [0.52231773 0.25374102 0.51907801 0.06861019 0.56766112 0.22250735
  0.22212059 0.55115416]
 [0.5830217  0.45916982 0.5774143  0.38621261 0.01870012 0.0953844
  0.94554359 0.32718355]
 [0.97528312 0.59379145 0.52603636 0.60094546 0.89112041 0.09351341
  0.28103503 0.85133149]
 [0.13790593 0.94681666 0.51464086 0.84252926 0.38883035 0.6671