# 问题

- 你想获取文件系统中某个目录下的所有文件列表。

## 解决方案

- 使用os.listdir() 函数来获取某个目录中的文件列表：

In [4]:
import os

files = os.listdir('.')

print(files)

files_ipynb = [file for file in files if file.endswith('.ipynb')]

for i in files_ipynb:
    print(i)

['.ipynb_checkpoints', '5_11_文件路径名的操作.ipynb', '5_12_测试文件是否存在.ipynb', '5_13_获取文件夹中的文件列表.ipynb', '5_1_读取文件数据.ipynb', '5_2_打印输出结果到文件.ipynb', '5_3_使用其他分隔符或行终止符打印.ipynb', '5_4_读取字节数据.ipynb', '5_5_文件不存在才能写入.ipynb', '5_6_字符串的IO操作.ipynb', '5_7_读取压缩文件.ipynb', '5_8_固定大小记录的文件迭代.ipynb', '5_9_读取二进制数据到可变缓冲区中.ipynb', 'bin.bin', 'print.txt', 'text.bz2', 'text.gz', 'text.rar', 'text.txt']
5_11_文件路径名的操作.ipynb
5_12_测试文件是否存在.ipynb
5_13_获取文件夹中的文件列表.ipynb
5_1_读取文件数据.ipynb
5_2_打印输出结果到文件.ipynb
5_3_使用其他分隔符或行终止符打印.ipynb
5_4_读取字节数据.ipynb
5_5_文件不存在才能写入.ipynb
5_6_字符串的IO操作.ipynb
5_7_读取压缩文件.ipynb
5_8_固定大小记录的文件迭代.ipynb
5_9_读取二进制数据到可变缓冲区中.ipynb


- 结果会返回目录中所有文件列表，包括所有文件，子目录，符号链接等等。如果你需要通过某种方式过滤数据，可以考虑结合os.path 库中的一些函数来使用列表推导。比如：

In [7]:
import os.path

new_files = [file for file in files if os.path.isfile(os.path.join('.', file))]
new_dirs = [dir for dir in files if os.path.isdir(os.path.join('.', dir))]

for i in new_files:
    print(i)
    
for i in new_dirs:
    print(i)

5_11_文件路径名的操作.ipynb
5_12_测试文件是否存在.ipynb
5_13_获取文件夹中的文件列表.ipynb
5_1_读取文件数据.ipynb
5_2_打印输出结果到文件.ipynb
5_3_使用其他分隔符或行终止符打印.ipynb
5_4_读取字节数据.ipynb
5_5_文件不存在才能写入.ipynb
5_6_字符串的IO操作.ipynb
5_7_读取压缩文件.ipynb
5_8_固定大小记录的文件迭代.ipynb
5_9_读取二进制数据到可变缓冲区中.ipynb
bin.bin
print.txt
text.bz2
text.gz
text.rar
text.txt
.ipynb_checkpoints


- 字符串的startswith() 和endswith() 方法对于过滤一个目录的内容也是很有用的。比如：

- 对于文件名的匹配，你可能会考虑使用glob 或fnmatch 模块。比如：

In [10]:
import glob 

pyfiles = glob.glob("./*.ipynb")

print(pyfiles)

['.\\5_11_文件路径名的操作.ipynb', '.\\5_12_测试文件是否存在.ipynb', '.\\5_13_获取文件夹中的文件列表.ipynb', '.\\5_1_读取文件数据.ipynb', '.\\5_2_打印输出结果到文件.ipynb', '.\\5_3_使用其他分隔符或行终止符打印.ipynb', '.\\5_4_读取字节数据.ipynb', '.\\5_5_文件不存在才能写入.ipynb', '.\\5_6_字符串的IO操作.ipynb', '.\\5_7_读取压缩文件.ipynb', '.\\5_8_固定大小记录的文件迭代.ipynb', '.\\5_9_读取二进制数据到可变缓冲区中.ipynb']


In [14]:
from fnmatch import fnmatch

pyfiles = [name for name in os.listdir('.') if fnmatch(name, '*.ipynb')]

print(pyfiles)

['5_11_文件路径名的操作.ipynb', '5_12_测试文件是否存在.ipynb', '5_13_获取文件夹中的文件列表.ipynb', '5_1_读取文件数据.ipynb', '5_2_打印输出结果到文件.ipynb', '5_3_使用其他分隔符或行终止符打印.ipynb', '5_4_读取字节数据.ipynb', '5_5_文件不存在才能写入.ipynb', '5_6_字符串的IO操作.ipynb', '5_7_读取压缩文件.ipynb', '5_8_固定大小记录的文件迭代.ipynb', '5_9_读取二进制数据到可变缓冲区中.ipynb']


## 讨论

- 获取目录中的列表是很容易的，但是其返回结果只是目录中实体名列表而已。如果你还想获取其他的元信息，比如文件大小，修改时间等等，你或许还需要使用到os.path 模块中的函数或着os.stat() 函数来收集数据。比如：

In [78]:
import os
import glob

pyfiles = glob.glob('*.ipynb')

file_info_list = [(file, os.path.getsize(file), os.path.getmtime(file)) for file in pyfiles]

for filename, filesize, filemtime in file_info_list:
    print('{:35s}\t{:<10s}\t{:<30f}'.format(filename, str(filesize), filemtime))
    
print("*"*50)
for file_info in file_info_list:
    print("{:<35s}\t{:<10d}\t{:<30f}".format(*file_info))

5_11_文件路径名的操作.ipynb                	2309      	1564738800.757235             
5_12_测试文件是否存在.ipynb                	2720      	1564739616.090775             
5_13_获取文件夹中的文件列表.ipynb             	10066     	1564970988.608899             
5_1_读取文件数据.ipynb                   	6065      	1564726844.401713             
5_2_打印输出结果到文件.ipynb                	1238      	1564727147.006051             
5_3_使用其他分隔符或行终止符打印.ipynb           	4562      	1564727765.395956             
5_4_读取字节数据.ipynb                   	4386      	1564731817.488847             
5_5_文件不存在才能写入.ipynb                	3688      	1564732435.875894             
5_6_字符串的IO操作.ipynb                 	2597      	1564734684.175950             
5_7_读取压缩文件.ipynb                   	6140      	1564735578.872045             
5_8_固定大小记录的文件迭代.ipynb              	2594      	1564737166.810447             
5_9_读取二进制数据到可变缓冲区中.ipynb           	3933      	1564738379.257534             
**************************************************
5_11_文件路径名的操作

In [83]:
file_metadata = [(name, os.stat(name)) for name in pyfiles]

for name, meta in file_metadata:
    print("{:35s}\t{}\t{}".format(name, meta.st_size, meta.st_mtime))

5_11_文件路径名的操作.ipynb                	2309	1564738800.7572353
5_12_测试文件是否存在.ipynb                	2720	1564739616.0907748
5_13_获取文件夹中的文件列表.ipynb             	10166	1564971108.6095908
5_1_读取文件数据.ipynb                   	6065	1564726844.401713
5_2_打印输出结果到文件.ipynb                	1238	1564727147.006051
5_3_使用其他分隔符或行终止符打印.ipynb           	4562	1564727765.3959563
5_4_读取字节数据.ipynb                   	4386	1564731817.488847
5_5_文件不存在才能写入.ipynb                	3688	1564732435.875894
5_6_字符串的IO操作.ipynb                 	2597	1564734684.1759496
5_7_读取压缩文件.ipynb                   	6140	1564735578.872045
5_8_固定大小记录的文件迭代.ipynb              	2594	1564737166.8104472
5_9_读取二进制数据到可变缓冲区中.ipynb           	3933	1564738379.2575336


- 最后还有一点要注意的就是，有时候在处理文件名编码问题时候可能会出现一些问题。通常来讲，函数os.listdir() 返回的实体列表会根据系统默认的文件名编码来解码。但是有时候也会碰到一些不能正常解码的文件名。关于文件名的处理问题，在5.14 和5.15 小节有更详细的讲解。