- open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)->_io.TextIOWrapper 打开一个文件,返回这个文件的IO流对象和文件描述符。如果打开失败抛出异常
-
file 文件路径,(可以是相对路径或绝对路径)
-
mode:文件模式,默认为r只读模式
文字描述符 意义 r 缺省的,表示只读打开 打开后文件指针指向开头 w 只写打开,打开后文件指针指向开头。不管文件是否存在,都会生成全新内容的文件 x 创建并写入一个新文件,打开后文件指针指向开头,文件不存在,创建文件。文件存在抛异常FillExistsError a 写入打开,打开后文件指针指向末尾。文件不存在,创建文件,只写打开,文件存在,只写打开,尾部追加内容。 组合描述符 b 二精制模式打开文件,可以和r,w,x,a组合,打开后读取和写入都是二进制。 t 缺省值,默认打开模式为文本模式。上面r,w,x,a默认都是用文本模式打开 - | 读写打开一个文件,给,给原来只读、只写方式打开提供缺失的读或者写能力,需要与r,w,x,a组合使用。不能单独使用
-
buffering 缓冲区,默认值为None
- -1 表示使用缺省大小的buffer。如果是二精制模式,使用io.DEFAULT_BUFFER_SIZE值,默认是4096或者8192。如果是文本模式,如果是终端设备,是行缓存方式,如果不是,则使用二进制模式的策略。
- 0 只在二进制模式使用,表示关闭buffer。文本模式t禁止使用
- 1 只在文本模式使用,表示使用行缓冲,意思就是见到换行符flush。 b字节模式无法使用。会使用默认缓冲区
- 即,一批数据里面带换行符,这一批数据全部写入磁盘
- 大于1 使用指定buffer的大小,在t模式没有效果,缓冲区还是默认缓冲区
- buffer缓冲区:缓冲区是一个内存空间,一般来说是一个FIFO队列,到缓冲区满了或者达到阀值,数据才会flush到磁盘。flush()将缓冲区数据写入到磁盘,close()关闭文件流,关闭前会调用flush()
buffering 说明 buffering=-1 t模式和b模式,都是io.DEFAULT_BUFFER_SIZE缺省缓冲区大小,字节 buffering=0 b模式:关闭缓冲区,t模式:不支持 buffering=1 t模式:行缓冲,遇到换行符才flush buffering>1 b模式:表示缓冲区大小。缓冲区的值可以超过io.DEFAULT_BUFFER_SIZE,直到设定的值超出后才把缓冲区flush。 t模式,是io.DEFAULT_BUFFER_SIZE字节,flush完后把当前字符串也写入磁盘 - 总结规律:
- 文本模式,一般都用默认缓冲区大小
- 二精制模式,是一个个字节的操作,可以指定buffer的大小
- 一般来说,默认缓冲区大小是比较好的选择,除非明确知道,否则不调控它
- 一般编程中,明确知道需要写磁盘了,都会手动调用一次flush,而不是等到自动调用flush或者close的时候。
- -1 表示使用缺省大小的buffer。如果是二精制模式,使用io.DEFAULT_BUFFER_SIZE值,默认是4096或者8192。如果是文本模式,如果是终端设备,是行缓存方式,如果不是,则使用二进制模式的策略。
-
encoding 编码,仅文本模式使用。如果是b字节模式,无用
- 默认值为None表示使用缺省编码,依赖操作系统。即 为默认值None是,使用文本模式打开文件时,默认使用的编码为系统默认编码。windows下缺省值为GBK(0xBOA1),Linux下缺省值为:UTF-8(0xE5 95 8A)
-
errors 什么样的编码错误将被捕获。默认值为None
- None和strict表示有编码错误将抛出ValueError异常;ignore表示忽略
-
newline 文本模式中,换行的转换。默认值为None。可选为None,"空串","\r","\n","\r\n"
- 读模式:
- None 表示\r,\n,\r\n都被转换为\n;
- "表示不会自动转换通用换行符;
- 其他合法字符表示换行符就是指定字符,就会按照指定字符分行
- 写模式:
- None表示\n 都会被替换为当前系统的缺省行分割符os.linesep;
- \n或""表示\n不替换;
- 其他合法字符表示\n会被替换为指定字符
- 示例:
fil = open("test2.txt","w+") #打开文件 #newline缺省值为None,windows下会把\n替换成\r\n fil.write("python\rwww.baidu.com\nwww.gdy.com\r\npython3") #真正写入的是 # 'python\rwww.baidu.com\rwww.gdy.com\r\r\npython3' fil.seek(0) #注意:读取时\r,\n,\r\n都会被替换成\n所以这里显示出来应该为: #'python\nwww.baidu.com\nwww.gdy.com\n\npython3' fil.read() fil.close()
- 读模式:
-
closefd 关闭文件描述符,True表示关闭它。False会在文件关闭后保持这个描述符。默认值为True。fileobj.fileno()查看
-
opener 默认值为None
-
- mode = r 指针起始在0位置
- mode = a 指针起始在EOF文件末尾位置
- tell() 显示指针当前位置
- seek(offset[,whence]) 移动文件指针,是按照字节偏移
-
BufferedIoBase类中常用方法。注意:TextIoWrapper继承了BufferedIoBase类
- write(s) 把字符串s写入到文件中并返回字符的个数
- writelines(lines) #将字符串列表写入文件。注意:换行符需要自己添加在字符中
f = open("test2.txt","w+") lines= ["abc","123\n","456\r\n"] f.writelines(lines) f.seek(0) print(f.read()) f.close()
-
read(size=-1] #读取文件内容,默认从指针开始位置读取到末尾。如果是t文本模式打开,默认读取为一个字符读取,如果是b二精制打开,默认读取是按照字节读取。
-
readline(size=-1) #一行一行读取文件内容。size设置一次能读取行内几个字符或字节。
-
readlines(hint=-1)->list #默认hint=-1,表示读取所有行。返回一个列表。如果指定hint,表示从0行开始读取到hint行
f = open("test") #返回可迭代对象 for line in f: print(line.encode()) #将读取内容转换为bytes f.close()
-
seek(offset[,whence]) 移动文件指针。是按照字节偏移
- offset 偏移的字节数。可以为正和负数。
- 偏移后可以超过文件末尾EOF,超过部分用字节O表示。
- 不能超过文件开始。如果超过会报错
- whence 可选值为0 1 2.默认值为0 表示指针相对于文件开始位置做偏移
- 0 表示指针相对于文件开始位置做偏移
- 1 表示指针在相对于当前指针所在位置做偏移
- 2 表示指针相对于文件末尾EOF位置做偏移
- offset 偏移的字节数。可以为正和负数。
-
tell()方法,可以显示当前文件指针位置,注意指针位置是按照字节计算的。
fil = open("test","a+") #打开文件 fil.write("abcd你好") fil.seek(0) #指针回到起始位置 fil.seek(2,0) #指针相对于开始位置向左移动2个位置 print(fil.tell()) #查看当前指针位置 fil.close() #关闭文件流
-
flush() 将缓冲区数据写入到磁盘
-
close() 关闭文件流。关闭前会调用flush()。文件已经关闭,再次关闭没有任何效果
-
seekable() #是否可以seek
-
readable() #是否可读
-
writable() #是否可写
-
closed #是否已经关闭
- 一般情况,系统对打开文件上限做了限制,linux中可以使用ulimit -a 查看所有限制。其中open file就是打开文件数的现在,默认是1024。如果打开文件达到上线,程序在次打开文件就会出错。出现OSError异常。为了防止打开文件后没有关闭文件,一般都需要添加异常处理。当发生异常是。关闭文件。
f = None
try:
f = open('test')
f.write("abc") # 文件是用只读模式打开,写入失败。
f.close()
finally:
if f!=None:
f.close() #当发生异常,如果f不为空,关闭文件流。释放文件对象
-
上下文管理:一种特殊的语法,交给解释器去释放文件对象
- 使用with...as 关键字
- 上下文管理的语句块并不会开启新的作用域
- with语句块执行完的时候,会自动关闭文件对象
- 第一种写法示例:
del f #使用with...as 语法,当代码块中出现异常时,会自动关闭f with open("test") as f: f.write("abc") #因为是只读模式打开,所有会出错。写入失败 #测试f发现f已经关闭 f.closed
- 第二种写法:
f = open("test") with f: f.write("abcd") #因为是只读模式打开,所有会出错。写入失败 #测试f,f已经关闭 f.closed
-
对于类似于文件对象的IO对象,一般来说都需要在不使用的时候关闭,注销,已释放资源。IO被打开的时候,会获得一个文件描述符。计算机资源是有线的,所以操作系统都会做限制。就是为了保护计算机的资源不要被完全耗尽,计算资源是共享的,不是独占的。
-
一般情况下,除非特别明确的知道资源情况,否则不要提高资源的限制值来解决问题。
- 类文件对象:可以像文件对象一样操作的对象
- socket对象、标准输入对象stdin,标准输出对象stdout,标准 错误输出对象stderr都是类文件对象
- StringIO,和BytesIO也都是类文件对象
import sys
sys.stdout.write("xdd") #标准输出中输出xdd
sys.stderr.write("xdd") #标准错误输出中输出xdd
a = sys.stdin.readline() #标准输入中接受用户输入
print(a)