# 1、利用os.walk(path)遍历目录树

In [1]:
import os

In [2]:
for dirpath, subdirs, filenames in os.walk('.'):
    print(dirpath)
    print(subdirs)
    print(filenames)
    print("++++++++")

.
[]
['1_shutil模块.ipynb', '2_遍历目录树.ipynb', '3_zipfile模块压缩文件.ipynb']
++++++++


In [3]:
for dirpath, subdirs, filenames in os.walk('../Test'):
    print(dirpath)
    print(subdirs)
    print(filenames)
    print("++++++++")

../Test
['b', 'demo']
['List.py', 'test01.py', 'test02.py', 'test03.py', '这是测试文件.txt']
++++++++
../Test\b
['b']
[]
++++++++
../Test\b\b
[]
[]
++++++++
../Test\demo
[]
['01.py', '这是测试.txt']
++++++++


In [5]:
# os.walk(path)返回三元组，
# 第一个是当前文件夹的路径
# 第二个是当前文件夹下的所有直接子目录(列表形式)
# 第三个是当前文件夹下的所有文件(列表形式)

In [4]:
# 实际运用
# (1)第一个返回值可以用来拼接完整路径
# (2)for循环是深度遍历当前文件夹及所有子文件夹
# (3)核心是只需要处理第三个参数即可

# 2、利用Path对象的iterdir()方法

In [3]:
from pathlib import Path

def traverse(path, handle_file_func):
    """
    遍历目录树，并处理文件
    :param path: 路径，str或Path对象
    :param handle_file_func: 处理文件的函数
    :return:
    """
    p = Path(path)
    if p.is_file():
        handle_file_func(p)
        return
    elif p.is_dir():
        for p2 in p.iterdir():
            traverse(p2, handle_file_func)

def your_func(path):
    print(path)


traverse('../Test', your_func)

..\Test\demo\01.py
..\Test\demo\这是测试.txt
..\Test\List.py
..\Test\test01.py
..\Test\test02.py
..\Test\test03.py
..\Test\这是测试文件.txt


#### 注意: os.listdir(path)和iterdir(path)类似，只不过需要拼接路径，这很容易出错，不建议大家使用

# 3、同理os.walk(path)也可写成函数的形式

In [12]:
import os

def traverse2(path, handle_file_func):
    """
    遍历目录树，并处理文件
    :param path: 路径，str
    :param handle_file_func: 处理文件的函数
    :return:
    """
    for dirpath, subdirs, filenames in os.walk(path):
        for filename in filenames:
            filepath = os.path.join(dirpath, filename)
            handle_file_func(filepath)

def your_func(path):
    print(path)

traverse2('../Test', your_func)

../Test\List.py
../Test\test01.py
../Test\test02.py
../Test\test03.py
../Test\这是测试文件.txt
../Test\demo\01.py
../Test\demo\这是测试.txt
