# 文件操作

文件操作主要包括对文本内容的读写操作，这些操作是通过文件对象（file object）实现的，通过文件对象可以读写文本和二进制文件。

## 打开文件

文件对象可以通过open()函数获得。open()函数是Python内置函数，它屏蔽了创建文件对象的细节，使得创建文件对象变得简单。

open(file,mode="r",buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)

file参数是要打开的文件，可以使字符串或整数。字符串表示文件路径和文件名，整数表示文件描述符，文件描述符指向一个已经打开的文件。

mode参数用来设置文件打开模式。二进制文件需要设置rb、wb、xb、ab，如果是文本文件需要设置rt、wt、xt、at，由于t是默认模式，可以省略。

r 只读模式打开文件(默认)

w 写入模式打开文件，会覆盖已经存在的文件

x 独占创建模式，文件不存在时创建并以写入模式打开，如果文件已经存在则抛出异常FileExistsError

a 追加模式，如果文件存在则写入内容追加到文本末尾

b 二进制模式

t 文本模式（默认）

+ 更新模式（必须与r w x a组合使用来设置文件为读写模式）

buffering 参数设置缓冲区策略，默认值为-1，当buffering=-1时，系统会自动设置缓冲区，通常是4096或8192字节；当buffering=0时关闭缓冲区，关闭缓冲区时数据直接写入文件中，这种模式主要应用于二进制文件的写入操作；当buffering > 0 时，buffering 用来设置缓冲区字节大小。

encoding 和 errors参数: encoding 用来指定打开文件时的文件编码，主要用于文本文件的打开。errors 参数用来指定编码发生错误时如何处理

newline参数用来设置换行模式

closefd和opener参数: 这两个参数在file参数为文件描述符时使用。closefd 为True 时，文件对象调用close()方法关闭文件，但不会关闭文件描述符所对应的文件。opener用于打开文件时执行一些加工操作，opener参数执行一个函数，改函数返回一个文件描述符。


In [1]:
# coding = utf-8

f = open("test.txt","w+")
f.write("World")

f = open("test.txt","r+")
f.write("Hello")

f = open("test.txt","a")
f.write(" ")

f = open("test.txt","a+")
f.write("World")
f = open("test.txt","a+")
f.write("\nHello World")
f.close()

## 关闭文件

调用文件对象的close()方法关闭文件。文件的操作往往会抛出异常，为了保证文件操作无论正常结束还是异常结束都能关闭文件，调用close()方法应该放在异常处理的finally块中。更推荐使用with   as 代码块。

In [2]:
f_name = "test.txt"
try:
    f = open(f_name)
except OSError as e:
    print("文件打开失败")
else:
    print("打开文件成功")
    try:
        content = f.read()
        print(content)
    except OSError as e:
        print("处理OSError异常")
    finally:
        f.close()
with open (f_name,"r") as f:
    content = f.read()
    print(content)

打开文件成功
Hello World
Hello World
Hello World
Hello World


## 文本文件读写

文本文件读写的单位是字符，而且是有字符编码的。文本文件读写主要有

read(size=-1):读取到换行符或文件尾并返回单行字符串，如果已经到文件尾，则返回一个空字符串，size 是限制读取的字符数，size=-1时没有限制。

readlines(hint=-1):读取文件数据到一个字符串列表中，每一个行数据是列表的一个元素，hint是限制读取行数，hint=-1时，没有限制。

write(s):将字符串s写入文件，并返回写入的字符数。

writelines(lines):向文件中写入一个列表，不添加行分隔符，因此通常为每一行末尾提供行分割符。

flush():刷新写缓冲区，数据会写入到文件中。

In [3]:
f_name = "test.txt"
with open(f_name,"r",encoding="utf-8") as f:
    lines = f.readlines()
    print(lines)
    copy_file = "copy.txt"
    with open(copy_file,"w",encoding="utf-8") as copy_f:
        copy_f.writelines(lines)
        print("文件复制成功")

['Hello World\n', 'Hello World']
文件复制成功


## 二进制文件读写

二进制文件的读写单位是字节，不需要考虑编码的问题。二进制文件读写主要方法:

read(size=-1):从文件读取并返回一行，size限制读取的字节数，size=-1时没有限制。

readline(size=-1):从文件中读取并返回一行数据，size限制读取的行数，size=-1时没有限制。

readlines(hint=-1):读取文件数据到一个列表中，每一行数据是列表的一个元素，hint是限制读取的行数，hint=-1时没有限制。

write(b):写入b字节，并返回写入的字节数

writelines(lines): 向文件中写入一个列表，不添加行分隔符，因此通常为每一行末尾提供分隔符。

flush():刷新写缓冲区，数据会写入到文件中。

In [4]:
f_name = "imgs/timg.jpg"
with open(f_name,"rb") as f:
    b = f.read()
    copy_f_name = "imgs/copy.jpg"
    with open(copy_f_name,"wb") as copy_f:
        copy_f.write(b)
        print("文件复制成功")

文件复制成功


# os 模块

Python对文件的操作是通过文件对象实现的，文件对象时属于Python 的os模块。

os.rename(src,dst):修改文件名，src是源文件，dst是目标文件

os.remove(path):删除path所指定的文件，如果path是目录，则会引发OSError。

os.mkdir(path):创建path所指定的目录，如果目录已经存在，则会引发FileExistsError

os.rmdir(path):删除path所指定的目录，如果目录为空，则会引发OSError。

os.walk(top):遍历top所指定的目录树，自顶向下遍历目录树，返回值是一个三元组

os.listdir(dir):列出指定目录中的文件和子目录。

常用属性有以下两种：os.curdir属性：获得当前目录；os.pardir属性：获得当前父目录。

In [5]:
import os

f_name = "test.txt"
copy_f_name = "copy.txt"

with open(f_name,"r") as f:
    b = f.read()
    with open(copy_f_name,"w") as copy_f:
        copy_f.write(b)
        
try:
    os.rename(copy_f_name,"copy2.txt")
except OSError:
    os.remove("copy2.txt")
    
print(os.listdir(os.curdir))
print(os.listdir(os.pardir))

try:
    os.mkdir("subdir")
except OSError:
    os.rmdir("subdir")
    
for item in os.walk("."):
    print(item)

['.ipynb_checkpoints', 'copy2.txt', 'imgs', 'logging 日志模块.ipynb', 'test.txt', '函数式编程.ipynb', '数据结构.ipynb', '文件操作与管理.ipynb', '正则表达式.ipynb', '面向对象编程.ipynb']
['.android', '.BigNox', '.idlerc', '.ipynb_checkpoints', '.ipython', '.jupyter', '.keras', '.kivy', '.matplotlib', '.pynche', '123.log', 'AppData', 'Application Data', 'Contacts', 'Cookies', 'inittk.ini', 'inst.ini', 'IntelGraphicsProfiles', 'JuPyter', 'Links', 'Local Settings', 'My Documents', 'NetHood', 'NewNox', 'Nox_share', 'NTUSER.DAT', 'ntuser.dat.LOG1', 'ntuser.dat.LOG2', 'NTUSER.DAT{b163567f-af4b-11e6-8895-d77619fd6c5d}.TM.blf', 'NTUSER.DAT{b163567f-af4b-11e6-8895-d77619fd6c5d}.TMContainer00000000000000000001.regtrans-ms', 'NTUSER.DAT{b163567f-af4b-11e6-8895-d77619fd6c5d}.TMContainer00000000000000000002.regtrans-ms', 'ntuser.ini', 'ntuser.pol', 'nuuid.ini', 'OneDrive', 'Oracle', 'PrintHood', 'Python 复习笔记', 'Python 核心编程', 'Python数据结构', 'Recent', 'Saved Games', 'Searches', 'SendTo', 'temp.log', 'Templates', '「開始」功能表']
('.', ['.

# os.path 模块

Python 提供的os.path模块提供对路径、目录和文件等进行管理的函数。

os.path.abspath(path):返回path的绝对路径

os.path.basename(path):返回path路径的基础名部分，如果path指向的是一个文件，则返回文件名；如果path指向的是一个目录，则返回最后目录名

os.path.dirname(path):返回path路径中目录部分

os.path.exists(path):判断path文件是否存在

os.path.isfile(path):如果path是文件，则返回True

os.path.isdir(path):如果path是目录，则返回True

os.path.getatime(path):返回最后一次的访问时间

os.path.getmtime(path):返回最后一次修改时间

os.path.getctime(path):返回创建时间

os.path.getsize(path):返回文件大小以字节为单位

In [6]:
import os.path

from datetime import datetime

f_name = "test.txt"
af_name = r"imgs/timg.jpg"

basename = os.path.basename(af_name)
print(basename)

dirname = os.path.dirname(af_name)
print(dirname)

print(os.path.abspath(f_name))

print(os.path.getsize(f_name))

atime = datetime.fromtimestamp(os.path.getatime(f_name))
print(atime)

ctime = datetime.fromtimestamp(os.path.getctime(f_name))
print(ctime)

mtime = datetime.fromtimestamp(os.path.getmtime(f_name))
print(mtime)


timg.jpg
imgs
C:\Users\jacky_yin\Python 复习笔记\test.txt
24
2020-01-09 10:09:50.942745
2020-01-09 10:09:50.942745
2020-01-09 15:33:42.868504


In [7]:
print(os.path.isfile(f_name))
print(os.path.isdir(dirname))
print(os.path.isfile(dirname))
print(os.path.isdir(f_name))
print(os.path.exists(f_name))

True
True
False
False
True
