# shutil 模块

shutil（或称为 shell 工具）模块中包含一些函数，让你在 Python 程序中复制、 移动、改名和删除文件。要使用 shutil 的函数，首先需要 import shutil。

In [1]:
import shutil, os

In [2]:
os.getcwd()

'/Users/liangzhuobin/Github/Python-Sweigart2016'

## 复制文件和文件夹

`shutil.copy(source, destination)`，将路径 source 处的文件复制到路径 destination 处的文件夹（source 和 destination 都是字符串）。如果 destination 是一个文件名，它将作为被复制文件的新名字。该函数返回一个字符串，表示被复制文件的路径。

In [3]:
shutil.copy('myCats.py', './test/chapter09')

'./test/chapter09/myCats.py'

`shutil.copy()` 将复制一个文件，`shutil.copytree()` 将复制整个文件夹。

`shutil.copytree(source, destination)`，将路径 source 处的文件夹，包括它的所有文件和子文件夹，复制到路径 destination 处的文件夹。source 和 destination 参数都是字符串。该函数返回一个字符串，是新复制的文件夹的路径。

## 文件和文件夹的移动和改名

`shutil.move(source, destination)`， 将路径 source 处的文件（夹）**移动**到路径 destination，并返回新位置的绝对路径的字符串。**移动** 后，原来位置上的文件不再存在。

设 destination = ./test/abc/def，并假设 source 是指向一个文件（如 source = ./myCats.py）

* 如果 destination 中的路径 `./test/abc` **不**存在，则出错
* 如果 destination 中的路径 `./test/abc` 存在，但 `def` 是一个**不存在**的文件夹，则 source 文件将**移动**到 `./test/abc` 中，并被命名为 `def`（注意，这是一个没有后缀的文件）。
* 如果 destination 中的路径 `./test/abc` 存在，而 `def` 是一个存在的文件夹，则 source 文件将**移动**到 `./test/abc/def` 中，。
* 如果 destination 中的路径 `./test/abc` 存在，而 `def` 是一个文件名（有后缀），则 source 文件将**移动**到 `./test/abc` 中，并被命名为 `def`。如果文件 `def` 原本已经存在，则被覆写。

# 永久删除文件和文件夹

利用 os 模块中的函数，可以删除一个文件或一个空文件夹。但利用 shutil 模块， 可以删除一个文件夹及其所有的内容。

* 用 os.unlink(path) 将删除 path 处的文件。
* 调用 os.rmdir(path) 将删除 path 处的文件夹。该文件夹必须为空，其中没有任何文件和文件夹。
* 调用 shutil.rmtree(path) 将删除 path 处的文件夹，它包含的所有文件和文件夹都会被删除。

这些命令**不可恢复地删除文件和文件夹**，所以在程序中使用这些函数时要小心！可以第一次运行程序时，注释掉这些调用， 并且加上 print() 显示将会被删除的文件。这样可以检查是否正确。

```python
import os
for filename in os.listdir():
    if filename.endswith('.rxt'):
        #os.unlink(filename) 
        print(filename)
```

## 用 send2trash 模块安全地删除

删除文件和文件夹的更好方法，是使用第三方的 send2trash 模块。在 conda 下的安装方法：

`conda install -c conda-forge send2trash`

利用 send2trash，比 Python 常规的删除函数要安全得多，因为它会将文件夹和文件发送到计算机的垃圾箱或回收站，而不是永久删除它们。

In [4]:
import send2trash

In [5]:
baconFile = open('bacon.txt','a') # creates the file
baconFile.write('Bacon is not a vegetable.')

25

In [6]:
baconFile.close()
send2trash.send2trash('bacon.txt')

一般来说，总是应该使用 send2trash.send2trash()函数来删除文件和文件夹。虽然它将文件发送到垃圾箱，让你稍后能够恢复它们，但是这不像永久删除文件，不会释放磁盘空间。如果你希望程序释放磁盘空间，就要用 os 和 shutil 来删除文件和文件夹。请注意，send2trash()函数只能将文件送到垃圾箱，不能从中恢复文件。

# 历遍目录树


In [9]:
for folderName, subfolders, filenames in os.walk('./'):
    print('The current folder is ' + folderName)
    
    for subfolder in subfolders:
        print('SUBFOLDER OF ' + folderName + ': ' + subfolder)
    for filename in filenames:
        print('FILE INSIDE ' + folderName + ': ' + filename)
        
    print(' ')

The current folder is ./
SUBFOLDER OF ./: test
SUBFOLDER OF ./: __pycache__
SUBFOLDER OF ./: .ipynb_checkpoints
SUBFOLDER OF ./: .git
FILE INSIDE ./: myCats.py
FILE INSIDE ./: Chapter04-列表.ipynb
FILE INSIDE ./: Chapter07-模式匹配与正则表达式.ipynb
FILE INSIDE ./: .DS_Store
FILE INSIDE ./: Chapter01-Python基础.ipynb
FILE INSIDE ./: Chapter03-函数.ipynb
FILE INSIDE ./: Chapter02-控制流.ipynb
FILE INSIDE ./: Chapter09-组织文件.ipynb
FILE INSIDE ./: Chapter06-字符串操作.ipynb
FILE INSIDE ./: Chapter05-字典和结构化数据.ipynb
FILE INSIDE ./: Chapter08-读写文件.ipynb
 
The current folder is ./test
SUBFOLDER OF ./test: chapter08
SUBFOLDER OF ./test: chapter09
FILE INSIDE ./test: .DS_Store
FILE INSIDE ./test: eggs
 
The current folder is ./test/chapter08
FILE INSIDE ./test/chapter08: myCats.py
FILE INSIDE ./test/chapter08: sonnet29.txt
FILE INSIDE ./test/chapter08: bacon.txt
FILE INSIDE ./test/chapter08: mydata.db
FILE INSIDE ./test/chapter08: hello.txt
 
The current folder is ./test/chapter09
FILE INSIDE ./test/chapter09: myCats.p

上述命令，将历遍以 `./` 开头的路径下的所有文件夹（包括子文件夹、子子文件夹，等等）。每当走到一个文件夹时，打印该文件夹的名字（`folderName`），然后打印该文件夹下的所有子文件夹名（`subfolder`）和文件名（`filename`）。

# 用 zipfile 模块压缩文件

## 读取和解压缩 zip 文件

要读取 ZIP 文件的内容，首先必须创建一个 ZipFile 对象（请注意大写首字母 Z 和 F）

In [13]:
import zipfile
os.chdir('./test') # move to the folder with zip file

In [20]:
testZip = zipfile.ZipFile('Automate_the_Boring_Stuff_2e_onlinematerials.zip') # 创建一个 ZipFile 对象

In [21]:
testZip.namelist()

['automate_online-materials/',
 'automate_online-materials/alarm.wav',
 'automate_online-materials/allMyCats1.py',
 'automate_online-materials/allMyCats2.py',
 'automate_online-materials/backupToZip.py',
 'automate_online-materials/birthdays.py',
 'automate_online-materials/boxPrint.py',
 'automate_online-materials/buggyAddingProgram.py',
 'automate_online-materials/bulletPointAdder.py',
 'automate_online-materials/calcProd.py',
 'automate_online-materials/catlogo.png',
 'automate_online-materials/catnapping.py',
 'automate_online-materials/census2010.py',
 'automate_online-materials/censuspopdata.xlsx',
 'automate_online-materials/characterCount.py',
 'automate_online-materials/coinFlip.py',
 'automate_online-materials/combinedminutes.pdf',
 'automate_online-materials/combinePdfs.py',
 'automate_online-materials/countdown.py',
 'automate_online-materials/demo.docx',
 'automate_online-materials/dictionary.txt',
 'automate_online-materials/dimensions.xlsx',
 'automate_online-materials/d

In [24]:
dictInfo = testZip.getinfo('automate_online-materials/dictionary.txt')

In [25]:
dictInfo.file_size # 该文件 automate_online-materials/dictionary.txt 的原始大小

454061

In [26]:
dictInfo.compress_size # 该文件 automate_online-materials/dictionary.txt 压缩后的大小

126834

In [27]:
testZip.extract('automate_online-materials/dictionary.txt', './testzip') 

'testzip/automate_online-materials/dictionary.txt'

ZipFile 对象的 extract()方法从 ZIP 文件中解压缩单个文件。 extract()的第二个参数是可选，表示将文件解压缩到指定的文件夹，而不是当前工作目录。如果第二个参数指定的文件夹不存在，Python 就会创建它。extract() 的返回值是被压缩后文件的路径。

`extractall()` 方法从 ZIP 文件中解压缩所有文件和文件夹，放到当前工作目录中。如运行：

`testZip.extractall()`

## 创建和添加到 zip 文件

In [28]:
newZip = zipfile.ZipFile('new.zip', 'w') # 创建 ZipFile 对象，必须传入 'w' 作为第二个参数，new.zip 是新 zip 文件的名字。
newZip.write('dictionary.txt', compress_type=zipfile.ZIP_DEFLATED) # dictionary.txt 是要压缩的文件，第二个参数是“压缩类型”参数，它告诉计算机使用怎样的算法来压缩文件。可以总是将这个值设置为 zipfile.ZIP_DEFLATED（这指定了 deflate 压缩 算法，它对各种类型的数据都很有效）
newZip.close()

# 项目：将带有美国风格日期的文件改名为欧洲风格日期

假设现在有上千个文件， 文件名包含美国风格的日期 （MM-DD-YYYY），需要将它们改名为欧洲风格的日期（DD-MM-YYYY）。

思路：

* 创建一个正则表达式，可以识别美国风格日期的文本模式。

* 调用 os.listdir()，找出工作目录中的所有文件。

* 循环遍历每个文件名，利用该正则表达式检查它是否包含日期。

* 如果它包含日期，用 shutil.move()对该文件改名。

In [1]:
import shutil, os, re

## Step 1: 创建能匹配美式日期的正则表达式

In [2]:
datePattern = re.compile(r"""^(.*?) # all text before the date
    ((0|1)?\d) -                    # one or two digits for the month
    ((0|1|2|3)?\d) -                # one or two digits for the day
    ((19|20)\d\d)                   # four digits for the year
    (.*?)$                          # all text after the date
    """, re.VERBOSE)

## Step 2: 识别文件中的日期部分，并对文件改名

正则表达式中的分组编号方式，每遇到一个左括号就计数加一。

In [3]:
for amerFilename in os.listdir('.'):
    mo = datePattern.search(amerFilename)
    
    # Skip files without a date.
    if mo == None:
        continue
        
    # Get the different parts of the filename.
    beforePart = mo.group(1)
    monthPart = mo.group(2)
    dayPart = mo.group(4)
    yearPart = mo.group(6)
    afterPart = mo.group(8)
    
    # Form the European-style filename.
    euroFilename = beforePart + dayPart + '-' + monthPart + '-' + yearPart + afterPart
    
    # Get the full, absolute file paths
    absWorkingDir = os.path.abspath('.')
    amerFilename = os.path.join(absWorkingDir, amerFilename)
    euroFilename = os.path.join(absWorkingDir, euroFilename)
    
    # Rename the files.
    print('Renaming "%s" to "%s"...' (amerFilename, euroFilename))
    #shutil.move(amerFilename, euroFilename) # uncomment after testing