# Python对文件和文件夹的操作

## 打开文件

如果要对文件进行读或写，首先需要使用内置的`open`函数打开文件，创建一个File类型的Object，同时还需要指定文件打开的模式(读、写、读和写)。文件分为文本文件和二进制文件，如果要打开的文件是二进制文件(如图片，pdf等)，则文件打开的模式后面需要跟一个`b`。`b`代表二进制文件。

In [1]:
# 以读模式打开文本文件
txtFileObj = open('../Notes/密码', 'r')
print(txtFileObj, type(txtFileObj))
txtFileObj.close()

# 以读模式打开二进制文件
imgFileObj = open('../Notes/images/ORM与DB映射关系图.gif', 'rb')
print(imgFileObj, type(imgFileObj))
imgFileObj.close()

<_io.TextIOWrapper name='../Notes/密码' mode='r' encoding='cp936'> <class '_io.TextIOWrapper'>
<_io.BufferedReader name='../Notes/images/ORM与DB映射关系图.gif'> <class '_io.BufferedReader'>


常用文件打开模式如下：

| 模式 | 描述 |
| :--- | :--- |
| r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
| rb | 以二进制模式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式，一般用于非文本文件如图片等 |
| r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
| rb+ | 以二进制模式打开一个文件用于读写。文件指针将会放在文件的开头，一般用于非文本文件如图片等。 |
| w | 打开一个文件只用于写入。如果该文件已存在则将覆盖。如果该文件不存在，创建新文件。 |
| wb | 以二进制模式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。 |
| w+ | 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果文件不存在，创建新文件。 |
| wb+ | 以二进制模式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，则创建新文件。一般用于非文本文件如图片等 |
| a | 打开一个文件用于追加。如果文件存在，文件指针将会放在文件的结尾。即新内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。 |
| ab | 以二进制模式打开一个文件用于追加。如果文件存在，文件指针会在文件的几位。即新内容将会被写入到已有内容的后面。如果文件不存在，创建新文件进行写入。 |
| a+ | 打开一个文件用于读写。如果该文件存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。 |
| ab+ | 以二进制模式打开一个文件用于追加。如果该文件存在，文件指针会在文件的结尾。如果文件不存在，创建新文件用于读写。 |

## File对象的属性

| 属性 | 描述 |
| :--- | :--- |
| file.closed | 返回true文件已被关闭，否则返回false |
| file.mode | 返回被打开文件的访问模式 |
| file.name | 返回文件的名称 |
| file.softspace | 如果用print输出后，必须跟一个空格符，则返回false。否则返回true。 |

## 读文件-read()/readlines()方法
```
# 打开文本文件
txtFileObj = open('some.txt', 'r')
# 读取文本文件中的所有内容
print(txtFileObj.read())
# 打印第x行
print(txtFileObj.read(2))
# 逐行打印
print(txtFileObj.readlines())
# 或者等同下面操作
for line in txtFileObj:
    print(line)
txtFileObj.close()

# 打开非文本文件
pdfFileObj = open('original.pdf', 'rb')
pdfFileObj.read()
pdfFileObj.close()
```

## 写文件-write方法
```
# 以写模式创建文件对象，然后写入
txtFileObj = open('some.txt', 'r+')
txtFileObj.write("hello world")
txtFileObj.close()

# 以写模式打开非文本文件，然后写入
f = some_data
with open('some.pdf', 'wb+') as pdfFileObj:
    for chunk in f.chunks():
        pdfFileObj.write(chunk)
```

## 关闭文件与with声明
当打开文件之后，要使用file.close()方法关闭这个文件对象，这样才会释放系统资源。为了方便起见，可以使用`with`来打开一个文件，这样在完成文件的读写操作之后，python会自动关闭文件对象。

```
with open('some.txt', 'w') as txtFileObj:
    txtFileObj.write('Hello World')
```

# os模块常见的功能

| 方法 | 描述 |
| :--- | :--- |
| os.getcwd() | 得到当前工作目录的路径 |
| os.chdir() | 改变当前工作目录 |
| os.listdir(path) | 返回指定目录下的所有文件和目录名 |
| os.remove(path)/os.unlink(path) | 删除一个文件 |
| os.path.isfile(path) | 判断是否是一个文件 |
| os.path.isdir(path) | 判断是否是一个目录 |
| os.path.isabs() | 判断是否是绝对路径 |
| os.path.islink(path) | 判断是否是快捷方式 |
| os.path.exists(path) | 检查给出的路径是否存在 |
| os.path.split() | 返回路径的目录名和文件名 |
| os.path.join(str1, str2, str3, ...) | 拼接工作路径 |
| os.path.splitext() | 分离扩展名 |
| os.path.dirname(path) | 获取路径名 |
| os.paht.basename() | 获取文件名 |
| os.system() | 运行shell命令 |
| os.getenv()/os.putenv() | 读取和设置环境变量 |
| os.linesep | 给出当前平台使用的终止符 |
| os.name | 当前平台的名称(Windwos是'nt'，Linux/Unix是'posix') |
| os.rename(old, new) | 重命名 |
| os.makedirs(dirnames)) | 创建多级目录 |
| os.makedir(dirname) | 创建单个目录 |
| os.rmdir(dirname) | 删除单个目录 |
| os.removedirs(dirnames) | 删除多级目录 |
| os.tat() | 获取文件属性 |
| os.chmod() | 修改文件权限与时间戳 |
| os.exit() | 终止当前进程 |
| os.path.getsize(filename) | 获取文件大小 |

**注意**：`os.remove()`和`os.unlink()`是删除的那个文件，在Windows系统下删除一个正在使用的文件会报错。删除文件夹使用的是`os.rmdir()`，此方法只能删除一个空的目录。

**查找某个目录下的全部txt文件并删除**
```
>>> import os
>>> os.getcwd() # 获取当前工作目录
'C:\\Users\\MissEnka\\Python'
>>> os.listdir('tutorial') # 查看tutorial文件夹
['notes.txt', 'pdf docs', 'txtfiles']
>>> for filename in os.listdir('tutorial'):
    if filename.endswith('.txt'):
        os.remove(os.path.join('tutorial', filename)) # 使用os.path.join拼接路径
        print("{} deleted.".format(filename))

notes.txt deleted.
```

## 使用`os.walk()`遍历一个文件夹子目录查找所有txt文件并删除
```
for foldName, subolders, filenames in os.walk('tutorial'):
    for filename in filenames:
        if filename.endswith('.txt'):
            os.remove(os.path.join(foldName, filename))
            print("{} deleted.".format(filename))
```

## 使用os.walk()打印某个文件夹下所有子目录和文件名称
```
In [1]: for folderName, subfolders, filenames in os.walk(os.getcwd()):
    ...:     print('The current folder is ' + folderName)
    ...:     for subfolder in subfolders:
    ...:         print('SUBFOLDER OF ' + folderName + ': ' + subfolder)
    ...:     for filename in filenames:
    ...:         print('FILE INSIDE {} ： {}'.format(folderName, filename))
    ...: 
The current folder is D:\Git_projects\studyspace\Notes
SUBFOLDER OF D:\Git_projects\studyspace\Notes: images
FILE INSIDE D:\Git_projects\studyspace\Notes ： python3学习.ipynb
FILE INSIDE D:\Git_projects\studyspace\Notes ： Python参考书籍.md
FILE INSIDE D:\Git_projects\studyspace\Notes ： 密码
FILE INSIDE D:\Git_projects\studyspace\Notes ： 高级架构师.ipynb
The current folder is D:\Git_projects\studyspace\Notes\images
FILE INSIDE D:\Git_projects\studyspace\Notes\images ： ORM与DB映射关系图.gif
```

## 利用shutil模块复制和移动文件
1. shutil.copy()：用来复制文件
    - 第一个参数：需要复制的文件
    - 第二个参数：文件夹或者文件名
2. shutil.copyffile()：用来复制文件，两个参数都必须是文件名

```
>> import shutil
>> import os
>> os.chdir('C:\\')
>> shutil.copy('C:\\spam.txt', 'C:\\delicious')
'C:\\delicious\\spam.txt'
>> shutil.copy('eggs.txt', 'C:\\delicious\\eggs2.txt')
'C:\\delicious\\eggs2.txt'
```
shutil还可以用来复制文件夹或移动文件
```
# 复制文件夹. olddir和newdir都只能是目录，且newdir必须不存在
shutil.copytree("老目录", "新目录")

# 移动文件（目录）
shutil.move("老位置", "新位置")
```

## golb模块快速查找当前文件夹文件
glob模块可以查找符合特定规则的文件路径名，并那会所有匹配的文件路径列表。类似正则表达式，glob支持三个匹配符："*", "?", "[]"。"*"匹配0个或多个字符；"?"匹配单个字符；"[]"匹配指定范围内的字符。
```
>>> import os
>>> os.getcwd()
'C:\\Users\\MissEnka\\Python'
>>> import glob
>>> glob.glob('*.txt')
['LICENSE.txt', 'list.txt', 'NEWS.txt']
>>> glob.glob('tutorial/.txt')
[]
>>> glob.glob('tutorial/*.txt')
['tutorial\\new.txt']
```
glob一般只搜索当前工作目录或指定目录里的文件，不能做文件夹遍历。