# 第十三章：脚本编程与系统管理
 许多人使用Python作为一个shell脚本的替代，用来实现常用系统任务的自动化，如文件的操作，系统的配置等。本章的主要目标是描述关于编写脚本时候经常遇到的一些功能。例如，解析命令行选项、获取有用的系统配置数据等等。第5章也包含了与文件和目录相关的一般信息。

## 13.1 通过重定向/管道/文件接受输入


### 问题


你希望你的脚本接受任何用户认为最简单的输入方式。包括将命令行的输出通过管道传递给该脚本、
重定向文件到该脚本，或在命令行中传递一个文件名或文件名列表给该脚本。

### 解决方案


Python内置的 fileinput 模块让这个变得简单。如果你有一个下面这样的脚本：

In [None]:
#
!
/
u
s
r
/
b
i
n
/
e
n
v
 
p
y
t
h
o
n
3


i
m
p
o
r
t
 
f
i
l
e
i
n
p
u
t




w
i
t
h
 
f
i
l
e
i
n
p
u
t
.
i
n
p
u
t
(
)
 
a
s
 
f
_
i
n
p
u
t
:


 
 
 
 
f
o
r
 
l
i
n
e
 
i
n
 
f
_
i
n
p
u
t
:


 
 
 
 
 
 
 
 
p
r
i
n
t
(
l
i
n
e
,
 
e
n
d
=
'
'
)



那么你就能以前面提到的所有方式来为此脚本提供输入。假设你将此脚本保存为 filein.py 并将其变为可执行文件，
那么你可以像下面这样调用它，得到期望的输出：

In [None]:
$
 
l
s
 
|
 
.
/
f
i
l
e
i
n
.
p
y
 
 
 
 
 
 
 
 
 
 
#
 
P
r
i
n
t
s
 
a
 
d
i
r
e
c
t
o
r
y
 
l
i
s
t
i
n
g
 
t
o
 
s
t
d
o
u
t
.


$
 
.
/
f
i
l
e
i
n
.
p
y
 
/
e
t
c
/
p
a
s
s
w
d
 
 
 
#
 
R
e
a
d
s
 
/
e
t
c
/
p
a
s
s
w
d
 
t
o
 
s
t
d
o
u
t
.


$
 
.
/
f
i
l
e
i
n
.
p
y
 
<
 
/
e
t
c
/
p
a
s
s
w
d
 
#
 
R
e
a
d
s
 
/
e
t
c
/
p
a
s
s
w
d
 
t
o
 
s
t
d
o
u
t
.



### 讨论


fileinput.input() 创建并返回一个 FileInput 类的实例。
该实例除了拥有一些有用的帮助方法外，它还可被当做一个上下文管理器使用。
因此，整合起来，如果我们要写一个打印多个文件输出的脚本，那么我们需要在输出中包含文件名和行号，如下所示：

In [None]:
import fileinput
with fileinput.input('/etc/passwd') as f:
    for line in f:
        print(f.filename(), f.lineno(), line, end='')

通过将它作为一个上下文管理器使用，可以确保它不再使用时文件能自动关闭，
而且我们在之后还演示了 FileInput 的一些有用的帮助方法来获取输出中的一些其他信息。

## 13.2 终止程序并给出错误信息


### 问题


你想向标准错误打印一条消息并返回某个非零状态码来终止程序运行

### 解决方案


你有一个程序像下面这样终止，抛出一个 SystemExit 异常，使用错误消息作为参数。例如：

In [None]:
r
a
i
s
e
 
S
y
s
t
e
m
E
x
i
t
(
'
I
t
 
f
a
i
l
e
d
!
'
)



它会将消息在 sys.stderr 中打印，然后程序以状态码1退出。

### 讨论


本节虽然很短小，但是它能解决在写脚本时的一个常见问题。
也就是说，当你想要终止某个程序时，你可能会像下面这样写：

In [None]:
i
m
p
o
r
t
 
s
y
s


s
y
s
.
s
t
d
e
r
r
.
w
r
i
t
e
(
'
I
t
 
f
a
i
l
e
d
!
\
n
'
)


r
a
i
s
e
 
S
y
s
t
e
m
E
x
i
t
(
1
)



如果你直接将消息作为参数传给 SystemExit() ，那么你可以省略其他步骤，
比如import语句或将错误消息写入 sys.stderr

## 13.3 解析命令行选项


### 问题


你的程序如何能够解析命令行选项（位于sys.argv中）

### 解决方案


argparse 模块可被用来解析命令行选项。下面一个简单例子演示了最基本的用法：

In [None]:
#
 
s
e
a
r
c
h
.
p
y


'
'
'


H
y
p
o
t
h
e
t
i
c
a
l
 
c
o
m
m
a
n
d
-
l
i
n
e
 
t
o
o
l
 
f
o
r
 
s
e
a
r
c
h
i
n
g
 
a
 
c
o
l
l
e
c
t
i
o
n
 
o
f


f
i
l
e
s
 
f
o
r
 
o
n
e
 
o
r
 
m
o
r
e
 
t
e
x
t
 
p
a
t
t
e
r
n
s
.


'
'
'


i
m
p
o
r
t
 
a
r
g
p
a
r
s
e


p
a
r
s
e
r
 
=
 
a
r
g
p
a
r
s
e
.
A
r
g
u
m
e
n
t
P
a
r
s
e
r
(
d
e
s
c
r
i
p
t
i
o
n
=
'
S
e
a
r
c
h
 
s
o
m
e
 
f
i
l
e
s
'
)




p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
d
e
s
t
=
'
f
i
l
e
n
a
m
e
s
'
,
m
e
t
a
v
a
r
=
'
f
i
l
e
n
a
m
e
'
,
 
n
a
r
g
s
=
'
*
'
)




p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
p
'
,
 
'
-
-
p
a
t
'
,
m
e
t
a
v
a
r
=
'
p
a
t
t
e
r
n
'
,
 
r
e
q
u
i
r
e
d
=
T
r
u
e
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d
e
s
t
=
'
p
a
t
t
e
r
n
s
'
,
 
a
c
t
i
o
n
=
'
a
p
p
e
n
d
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
t
e
x
t
 
p
a
t
t
e
r
n
 
t
o
 
s
e
a
r
c
h
 
f
o
r
'
)




p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
v
'
,
 
d
e
s
t
=
'
v
e
r
b
o
s
e
'
,
 
a
c
t
i
o
n
=
'
s
t
o
r
e
_
t
r
u
e
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
v
e
r
b
o
s
e
 
m
o
d
e
'
)




p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
o
'
,
 
d
e
s
t
=
'
o
u
t
f
i
l
e
'
,
 
a
c
t
i
o
n
=
'
s
t
o
r
e
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
o
u
t
p
u
t
 
f
i
l
e
'
)




p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
-
s
p
e
e
d
'
,
 
d
e
s
t
=
'
s
p
e
e
d
'
,
 
a
c
t
i
o
n
=
'
s
t
o
r
e
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c
h
o
i
c
e
s
=
{
'
s
l
o
w
'
,
'
f
a
s
t
'
}
,
 
d
e
f
a
u
l
t
=
'
s
l
o
w
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
s
e
a
r
c
h
 
s
p
e
e
d
'
)




a
r
g
s
 
=
 
p
a
r
s
e
r
.
p
a
r
s
e
_
a
r
g
s
(
)




#
 
O
u
t
p
u
t
 
t
h
e
 
c
o
l
l
e
c
t
e
d
 
a
r
g
u
m
e
n
t
s


p
r
i
n
t
(
a
r
g
s
.
f
i
l
e
n
a
m
e
s
)


p
r
i
n
t
(
a
r
g
s
.
p
a
t
t
e
r
n
s
)


p
r
i
n
t
(
a
r
g
s
.
v
e
r
b
o
s
e
)


p
r
i
n
t
(
a
r
g
s
.
o
u
t
f
i
l
e
)


p
r
i
n
t
(
a
r
g
s
.
s
p
e
e
d
)



该程序定义了一个如下使用的命令行解析器：

In [None]:
b
a
s
h
 
%
 
p
y
t
h
o
n
3
 
s
e
a
r
c
h
.
p
y
 
-
h


u
s
a
g
e
:
 
s
e
a
r
c
h
.
p
y
 
[
-
h
]
 
[
-
p
 
p
a
t
t
e
r
n
]
 
[
-
v
]
 
[
-
o
 
O
U
T
F
I
L
E
]
 
[
-
-
s
p
e
e
d
 
{
s
l
o
w
,
f
a
s
t
}
]


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
[
f
i
l
e
n
a
m
e
 
[
f
i
l
e
n
a
m
e
 
.
.
.
]
]




S
e
a
r
c
h
 
s
o
m
e
 
f
i
l
e
s




p
o
s
i
t
i
o
n
a
l
 
a
r
g
u
m
e
n
t
s
:


 
 
f
i
l
e
n
a
m
e




o
p
t
i
o
n
a
l
 
a
r
g
u
m
e
n
t
s
:


 
 
-
h
,
 
-
-
h
e
l
p
 
 
 
 
 
 
 
 
 
 
 
 
s
h
o
w
 
t
h
i
s
 
h
e
l
p
 
m
e
s
s
a
g
e
 
a
n
d
 
e
x
i
t


 
 
-
p
 
p
a
t
t
e
r
n
,
 
-
-
p
a
t
 
p
a
t
t
e
r
n


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
t
e
x
t
 
p
a
t
t
e
r
n
 
t
o
 
s
e
a
r
c
h
 
f
o
r


 
 
-
v
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
v
e
r
b
o
s
e
 
m
o
d
e


 
 
-
o
 
O
U
T
F
I
L
E
 
 
 
 
 
 
 
 
 
 
 
 
o
u
t
p
u
t
 
f
i
l
e


 
 
-
-
s
p
e
e
d
 
{
s
l
o
w
,
f
a
s
t
}
 
 
 
s
e
a
r
c
h
 
s
p
e
e
d



下面的部分演示了程序中的数据部分。仔细观察print()语句的打印输出。

In [None]:
b
a
s
h
 
%
 
p
y
t
h
o
n
3
 
s
e
a
r
c
h
.
p
y
 
f
o
o
.
t
x
t
 
b
a
r
.
t
x
t


u
s
a
g
e
:
 
s
e
a
r
c
h
.
p
y
 
[
-
h
]
 
-
p
 
p
a
t
t
e
r
n
 
[
-
v
]
 
[
-
o
 
O
U
T
F
I
L
E
]
 
[
-
-
s
p
e
e
d
 
{
f
a
s
t
,
s
l
o
w
}
]


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
[
f
i
l
e
n
a
m
e
 
[
f
i
l
e
n
a
m
e
 
.
.
.
]
]


s
e
a
r
c
h
.
p
y
:
 
e
r
r
o
r
:
 
t
h
e
 
f
o
l
l
o
w
i
n
g
 
a
r
g
u
m
e
n
t
s
 
a
r
e
 
r
e
q
u
i
r
e
d
:
 
-
p
/
-
-
p
a
t




b
a
s
h
 
%
 
p
y
t
h
o
n
3
 
s
e
a
r
c
h
.
p
y
 
-
v
 
-
p
 
s
p
a
m
 
-
-
p
a
t
=
e
g
g
s
 
f
o
o
.
t
x
t
 
b
a
r
.
t
x
t


f
i
l
e
n
a
m
e
s
 
=
 
[
'
f
o
o
.
t
x
t
'
,
 
'
b
a
r
.
t
x
t
'
]


p
a
t
t
e
r
n
s
 
 
=
 
[
'
s
p
a
m
'
,
 
'
e
g
g
s
'
]


v
e
r
b
o
s
e
 
 
 
=
 
T
r
u
e


o
u
t
f
i
l
e
 
 
 
=
 
N
o
n
e


s
p
e
e
d
 
 
 
 
 
=
 
s
l
o
w




b
a
s
h
 
%
 
p
y
t
h
o
n
3
 
s
e
a
r
c
h
.
p
y
 
-
v
 
-
p
 
s
p
a
m
 
-
-
p
a
t
=
e
g
g
s
 
f
o
o
.
t
x
t
 
b
a
r
.
t
x
t
 
-
o
 
r
e
s
u
l
t
s


f
i
l
e
n
a
m
e
s
 
=
 
[
'
f
o
o
.
t
x
t
'
,
 
'
b
a
r
.
t
x
t
'
]


p
a
t
t
e
r
n
s
 
 
=
 
[
'
s
p
a
m
'
,
 
'
e
g
g
s
'
]


v
e
r
b
o
s
e
 
 
 
=
 
T
r
u
e


o
u
t
f
i
l
e
 
 
 
=
 
r
e
s
u
l
t
s


s
p
e
e
d
 
 
 
 
 
=
 
s
l
o
w




b
a
s
h
 
%
 
p
y
t
h
o
n
3
 
s
e
a
r
c
h
.
p
y
 
-
v
 
-
p
 
s
p
a
m
 
-
-
p
a
t
=
e
g
g
s
 
f
o
o
.
t
x
t
 
b
a
r
.
t
x
t
 
-
o
 
r
e
s
u
l
t
s
 
\


 
 
 
 
 
 
 
 
 
 
 
 
 
-
-
s
p
e
e
d
=
f
a
s
t


f
i
l
e
n
a
m
e
s
 
=
 
[
'
f
o
o
.
t
x
t
'
,
 
'
b
a
r
.
t
x
t
'
]


p
a
t
t
e
r
n
s
 
 
=
 
[
'
s
p
a
m
'
,
 
'
e
g
g
s
'
]


v
e
r
b
o
s
e
 
 
 
=
 
T
r
u
e


o
u
t
f
i
l
e
 
 
 
=
 
r
e
s
u
l
t
s


s
p
e
e
d
 
 
 
 
 
=
 
f
a
s
t



对于选项值的进一步处理由程序来决定，用你自己的逻辑来替代 print() 函数。

### 讨论


argparse 模块是标准库中最大的模块之一，拥有大量的配置选项。
本节只是演示了其中最基础的一些特性，帮助你入门。

为了解析命令行选项，你首先要创建一个 ArgumentParser 实例，
并使用 add_argument() 方法声明你想要支持的选项。
在每个 add_argument() 调用中，dest 参数指定解析结果被指派给属性的名字。
metavar 参数被用来生成帮助信息。action 参数指定跟属性对应的处理逻辑，
通常的值为 store ,被用来存储某个值或将多个参数值收集到一个列表中。
下面的参数收集所有剩余的命令行参数到一个列表中。在本例中它被用来构造一个文件名列表：

In [None]:
p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
d
e
s
t
=
'
f
i
l
e
n
a
m
e
s
'
,
m
e
t
a
v
a
r
=
'
f
i
l
e
n
a
m
e
'
,
 
n
a
r
g
s
=
'
*
'
)



下面的参数根据参数是否存在来设置一个 Boolean 标志：

In [None]:
p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
v
'
,
 
d
e
s
t
=
'
v
e
r
b
o
s
e
'
,
 
a
c
t
i
o
n
=
'
s
t
o
r
e
_
t
r
u
e
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
v
e
r
b
o
s
e
 
m
o
d
e
'
)



下面的参数接受一个单独值并将其存储为一个字符串：

In [None]:
p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
o
'
,
 
d
e
s
t
=
'
o
u
t
f
i
l
e
'
,
 
a
c
t
i
o
n
=
'
s
t
o
r
e
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
o
u
t
p
u
t
 
f
i
l
e
'
)



下面的参数说明允许某个参数重复出现多次，并将它们追加到一个列表中去。
required 标志表示该参数至少要有一个。-p 和 --pat 表示两个参数名形式都可使用。

In [None]:
p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
p
'
,
 
'
-
-
p
a
t
'
,
m
e
t
a
v
a
r
=
'
p
a
t
t
e
r
n
'
,
 
r
e
q
u
i
r
e
d
=
T
r
u
e
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d
e
s
t
=
'
p
a
t
t
e
r
n
s
'
,
 
a
c
t
i
o
n
=
'
a
p
p
e
n
d
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
t
e
x
t
 
p
a
t
t
e
r
n
 
t
o
 
s
e
a
r
c
h
 
f
o
r
'
)



最后，下面的参数说明接受一个值，但是会将其和可能的选择值做比较，以检测其合法性：

In [None]:
p
a
r
s
e
r
.
a
d
d
_
a
r
g
u
m
e
n
t
(
'
-
-
s
p
e
e
d
'
,
 
d
e
s
t
=
'
s
p
e
e
d
'
,
 
a
c
t
i
o
n
=
'
s
t
o
r
e
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c
h
o
i
c
e
s
=
{
'
s
l
o
w
'
,
'
f
a
s
t
'
}
,
 
d
e
f
a
u
l
t
=
'
s
l
o
w
'
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
h
e
l
p
=
'
s
e
a
r
c
h
 
s
p
e
e
d
'
)



一旦参数选项被指定，你就可以执行 parser.parse() 方法了。
它会处理 sys.argv 的值并返回一个结果实例。
每个参数值会被设置成该实例中 add_argument() 方法的 dest 参数指定的属性值。

还很多种其他方法解析命令行选项。
例如，你可能会手动的处理 sys.argv 或者使用 getopt 模块。
但是，如果你采用本节的方式，将会减少很多冗余代码，底层细节 argparse 模块已经帮你处理了。
你可能还会碰到使用 optparse 库解析选项的代码。
尽管 optparse 和 argparse 很像，但是后者更先进，因此在新的程序中你应该使用它。

## 13.4 运行时弹出密码输入提示


### 问题


你写了个脚本，运行时需要一个密码。此脚本是交互式的，因此不能将密码在脚本中硬编码，
而是需要弹出一个密码输入提示，让用户自己输入。

### 解决方案


这时候Python的 getpass 模块正是你所需要的。你可以让你很轻松的弹出密码输入提示，
并且不会在用户终端回显密码。下面是具体代码：

In [None]:
i
m
p
o
r
t
 
g
e
t
p
a
s
s




u
s
e
r
 
=
 
g
e
t
p
a
s
s
.
g
e
t
u
s
e
r
(
)


p
a
s
s
w
d
 
=
 
g
e
t
p
a
s
s
.
g
e
t
p
a
s
s
(
)




i
f
 
s
v
c
_
l
o
g
i
n
(
u
s
e
r
,
 
p
a
s
s
w
d
)
:
 
 
 
 
#
 
Y
o
u
 
m
u
s
t
 
w
r
i
t
e
 
s
v
c
_
l
o
g
i
n
(
)


 
 
 
p
r
i
n
t
(
'
Y
a
y
!
'
)


e
l
s
e
:


 
 
 
p
r
i
n
t
(
'
B
o
o
!
'
)



在此代码中，svc_login() 是你要实现的处理密码的函数，具体的处理过程你自己决定。

### 讨论


注意在前面代码中 getpass.getuser() 不会弹出用户名的输入提示。
它会根据该用户的shell环境或者会依据本地系统的密码库（支持 pwd 模块的平台）来使用当前用户的登录名，

如果你想显示的弹出用户名输入提示，使用内置的 input 函数：

In [None]:
u
s
e
r
 
=
 
i
n
p
u
t
(
'
E
n
t
e
r
 
y
o
u
r
 
u
s
e
r
n
a
m
e
:
 
'
)



还有一点很重要，有些系统可能不支持 getpass() 方法隐藏输入密码。
这种情况下，Python会提前警告你这些问题（例如它会警告你说密码会以明文形式显示）

## 13.5 获取终端的大小


### 问题


你需要知道当前终端的大小以便正确的格式化输出。

### 解决方案


使用 os.get_terminal_size() 函数来做到这一点。

代码示例：

In [None]:
import os
sz = os.get_terminal_size()
sz

In [None]:
sz.columns

In [None]:
sz.lines

### 讨论


有太多方式来得知终端大小了，从读取环境变量到执行底层的 ioctl() 函数等等。
不过，为什么要去研究这些复杂的办法而不是仅仅调用一个简单的函数呢？

## 13.6 执行外部命令并获取它的输出


### 问题


你想执行一个外部命令并以Python字符串的形式获取执行结果。

### 解决方案


使用 subprocess.check_output() 函数。例如：

In [None]:
i
m
p
o
r
t
 
s
u
b
p
r
o
c
e
s
s


o
u
t
_
b
y
t
e
s
 
=
 
s
u
b
p
r
o
c
e
s
s
.
c
h
e
c
k
_
o
u
t
p
u
t
(
[
'
n
e
t
s
t
a
t
'
,
'
-
a
'
]
)



这段代码执行一个指定的命令并将执行结果以一个字节字符串的形式返回。
如果你需要文本形式返回，加一个解码步骤即可。例如：

In [None]:
o
u
t
_
t
e
x
t
 
=
 
o
u
t
_
b
y
t
e
s
.
d
e
c
o
d
e
(
'
u
t
f
-
8
'
)



如果被执行的命令以非零码返回，就会抛出异常。
下面的例子捕获到错误并获取返回码：

In [None]:
t
r
y
:


 
 
 
 
o
u
t
_
b
y
t
e
s
 
=
 
s
u
b
p
r
o
c
e
s
s
.
c
h
e
c
k
_
o
u
t
p
u
t
(
[
'
c
m
d
'
,
'
a
r
g
1
'
,
'
a
r
g
2
'
]
)


e
x
c
e
p
t
 
s
u
b
p
r
o
c
e
s
s
.
C
a
l
l
e
d
P
r
o
c
e
s
s
E
r
r
o
r
 
a
s
 
e
:


 
 
 
 
o
u
t
_
b
y
t
e
s
 
=
 
e
.
o
u
t
p
u
t
 
 
 
 
 
 
 
#
 
O
u
t
p
u
t
 
g
e
n
e
r
a
t
e
d
 
b
e
f
o
r
e
 
e
r
r
o
r


 
 
 
 
c
o
d
e
 
 
 
 
 
 
=
 
e
.
r
e
t
u
r
n
c
o
d
e
 
 
 
#
 
R
e
t
u
r
n
 
c
o
d
e



默认情况下，check_output() 仅仅返回输入到标准输出的值。
如果你需要同时收集标准输出和错误输出，使用 stderr 参数：

In [None]:
o
u
t
_
b
y
t
e
s
 
=
 
s
u
b
p
r
o
c
e
s
s
.
c
h
e
c
k
_
o
u
t
p
u
t
(
[
'
c
m
d
'
,
'
a
r
g
1
'
,
'
a
r
g
2
'
]
,


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
s
t
d
e
r
r
=
s
u
b
p
r
o
c
e
s
s
.
S
T
D
O
U
T
)



如果你需要用一个超时机制来执行命令，使用 timeout 参数：

In [None]:
t
r
y
:


 
 
 
 
o
u
t
_
b
y
t
e
s
 
=
 
s
u
b
p
r
o
c
e
s
s
.
c
h
e
c
k
_
o
u
t
p
u
t
(
[
'
c
m
d
'
,
'
a
r
g
1
'
,
'
a
r
g
2
'
]
,
 
t
i
m
e
o
u
t
=
5
)


e
x
c
e
p
t
 
s
u
b
p
r
o
c
e
s
s
.
T
i
m
e
o
u
t
E
x
p
i
r
e
d
 
a
s
 
e
:


 
 
 
 
.
.
.



通常来讲，命令的执行不需要使用到底层shell环境（比如sh、bash）。
一个字符串列表会被传递给一个低级系统命令，比如 os.execve() 。
如果你想让命令被一个shell执行，传递一个字符串参数，并设置参数 shell=True .
有时候你想要Python去执行一个复杂的shell命令的时候这个就很有用了，比如管道流、I/O重定向和其他特性。例如：

In [None]:
o
u
t
_
b
y
t
e
s
 
=
 
s
u
b
p
r
o
c
e
s
s
.
c
h
e
c
k
_
o
u
t
p
u
t
(
'
g
r
e
p
 
p
y
t
h
o
n
 
|
 
w
c
 
>
 
o
u
t
'
,
 
s
h
e
l
l
=
T
r
u
e
)



需要注意的是在shell中执行命令会存在一定的安全风险，特别是当参数来自于用户输入时。
这时候可以使用 shlex.quote() 函数来将参数正确的用双引用引起来。

### 讨论


使用 check_output() 函数是执行外部命令并获取其返回值的最简单方式。
但是，如果你需要对子进程做更复杂的交互，比如给它发送输入，你得采用另外一种方法。
这时候可直接使用 subprocess.Popen 类。例如：

In [None]:
i
m
p
o
r
t
 
s
u
b
p
r
o
c
e
s
s




#
 
S
o
m
e
 
t
e
x
t
 
t
o
 
s
e
n
d


t
e
x
t
 
=
 
b
'
'
'


h
e
l
l
o
 
w
o
r
l
d


t
h
i
s
 
i
s
 
a
 
t
e
s
t


g
o
o
d
b
y
e


'
'
'




#
 
L
a
u
n
c
h
 
a
 
c
o
m
m
a
n
d
 
w
i
t
h
 
p
i
p
e
s


p
 
=
 
s
u
b
p
r
o
c
e
s
s
.
P
o
p
e
n
(
[
'
w
c
'
]
,


 
 
 
 
 
 
 
 
 
 
s
t
d
o
u
t
 
=
 
s
u
b
p
r
o
c
e
s
s
.
P
I
P
E
,


 
 
 
 
 
 
 
 
 
 
s
t
d
i
n
 
=
 
s
u
b
p
r
o
c
e
s
s
.
P
I
P
E
)




#
 
S
e
n
d
 
t
h
e
 
d
a
t
a
 
a
n
d
 
g
e
t
 
t
h
e
 
o
u
t
p
u
t


s
t
d
o
u
t
,
 
s
t
d
e
r
r
 
=
 
p
.
c
o
m
m
u
n
i
c
a
t
e
(
t
e
x
t
)




#
 
T
o
 
i
n
t
e
r
p
r
e
t
 
a
s
 
t
e
x
t
,
 
d
e
c
o
d
e


o
u
t
 
=
 
s
t
d
o
u
t
.
d
e
c
o
d
e
(
'
u
t
f
-
8
'
)


e
r
r
 
=
 
s
t
d
e
r
r
.
d
e
c
o
d
e
(
'
u
t
f
-
8
'
)



subprocess 模块对于依赖TTY的外部命令不合适用。
例如，你不能使用它来自动化一个用户输入密码的任务（比如一个ssh会话）。
这时候，你需要使用到第三方模块了，比如基于著名的 expect 家族的工具（pexpect或类似的）

## 13.7 复制或者移动文件和目录


### 问题


你想要复制或移动文件和目录，但是又不想调用shell命令。

### 解决方案


shutil 模块有很多便捷的函数可以复制文件和目录。使用起来非常简单，比如：

In [None]:
i
m
p
o
r
t
 
s
h
u
t
i
l




#
 
C
o
p
y
 
s
r
c
 
t
o
 
d
s
t
.
 
(
c
p
 
s
r
c
 
d
s
t
)


s
h
u
t
i
l
.
c
o
p
y
(
s
r
c
,
 
d
s
t
)




#
 
C
o
p
y
 
f
i
l
e
s
,
 
b
u
t
 
p
r
e
s
e
r
v
e
 
m
e
t
a
d
a
t
a
 
(
c
p
 
-
p
 
s
r
c
 
d
s
t
)


s
h
u
t
i
l
.
c
o
p
y
2
(
s
r
c
,
 
d
s
t
)




#
 
C
o
p
y
 
d
i
r
e
c
t
o
r
y
 
t
r
e
e
 
(
c
p
 
-
R
 
s
r
c
 
d
s
t
)


s
h
u
t
i
l
.
c
o
p
y
t
r
e
e
(
s
r
c
,
 
d
s
t
)




#
 
M
o
v
e
 
s
r
c
 
t
o
 
d
s
t
 
(
m
v
 
s
r
c
 
d
s
t
)


s
h
u
t
i
l
.
m
o
v
e
(
s
r
c
,
 
d
s
t
)



这些函数的参数都是字符串形式的文件或目录名。
底层语义模拟了类似的Unix命令，如上面的注释部分。

默认情况下，对于符号链接而已这些命令处理的是它指向的东西。
例如，如果源文件是一个符号链接，那么目标文件将会是符号链接指向的文件。
如果你只想复制符号链接本身，那么需要指定关键字参数 follow_symlinks ,如下：

如果你想保留被复制目录中的符号链接，像这样做：

In [None]:
s
h
u
t
i
l
.
c
o
p
y
t
r
e
e
(
s
r
c
,
 
d
s
t
,
 
s
y
m
l
i
n
k
s
=
T
r
u
e
)



copytree() 可以让你在复制过程中选择性的忽略某些文件或目录。
你可以提供一个忽略函数，接受一个目录名和文件名列表作为输入，返回一个忽略的名称列表。例如：

In [None]:
d
e
f
 
i
g
n
o
r
e
_
p
y
c
_
f
i
l
e
s
(
d
i
r
n
a
m
e
,
 
f
i
l
e
n
a
m
e
s
)
:


 
 
 
 
r
e
t
u
r
n
 
[
n
a
m
e
 
i
n
 
f
i
l
e
n
a
m
e
s
 
i
f
 
n
a
m
e
.
e
n
d
s
w
i
t
h
(
'
.
p
y
c
'
)
]




s
h
u
t
i
l
.
c
o
p
y
t
r
e
e
(
s
r
c
,
 
d
s
t
,
 
i
g
n
o
r
e
=
i
g
n
o
r
e
_
p
y
c
_
f
i
l
e
s
)



由于忽略某种模式的文件名是很常见的，因此一个便捷的函数 ignore_patterns() 已经包含在里面了。例如：

In [None]:
s
h
u
t
i
l
.
c
o
p
y
t
r
e
e
(
s
r
c
,
 
d
s
t
,
 
i
g
n
o
r
e
=
s
h
u
t
i
l
.
i
g
n
o
r
e
_
p
a
t
t
e
r
n
s
(
'
*
~
'
,
 
'
*
.
p
y
c
'
)
)



### 讨论


使用 shutil 复制文件和目录也忒简单了点吧。
不过，对于文件元数据信息，copy2() 这样的函数只能尽自己最大能力来保留它。
访问时间、创建时间和权限这些基本信息会被保留，
但是对于所有者、ACLs、资源fork和其他更深层次的文件元信息就说不准了，
这个还得依赖于底层操作系统类型和用户所拥有的访问权限。
你通常不会去使用 shutil.copytree() 函数来执行系统备份。
当处理文件名的时候，最好使用 os.path 中的函数来确保最大的可移植性（特别是同时要适用于Unix和Windows）。
例如：

In [None]:
filename = '/Users/guido/programs/spam.py'
import os.path
os.path.basename(filename)

In [None]:
os.path.dirname(filename)

In [None]:
os.path.split(filename)

In [None]:
os.path.join('/new/dir', os.path.basename(filename))

In [None]:
os.path.expanduser('~/guido/programs/spam.py')

使用 copytree() 复制文件夹的一个棘手的问题是对于错误的处理。
例如，在复制过程中，函数可能会碰到损坏的符号链接，因为权限无法访问文件的问题等等。
为了解决这个问题，所有碰到的问题会被收集到一个列表中并打包为一个单独的异常，到了最后再抛出。
下面是一个例子：

In [None]:
t
r
y
:


 
 
 
 
s
h
u
t
i
l
.
c
o
p
y
t
r
e
e
(
s
r
c
,
 
d
s
t
)


e
x
c
e
p
t
 
s
h
u
t
i
l
.
E
r
r
o
r
 
a
s
 
e
:


 
 
 
 
f
o
r
 
s
r
c
,
 
d
s
t
,
 
m
s
g
 
i
n
 
e
.
a
r
g
s
[
0
]
:


 
 
 
 
 
 
 
 
 
#
 
s
r
c
 
i
s
 
s
o
u
r
c
e
 
n
a
m
e


 
 
 
 
 
 
 
 
 
#
 
d
s
t
 
i
s
 
d
e
s
t
i
n
a
t
i
o
n
 
n
a
m
e


 
 
 
 
 
 
 
 
 
#
 
m
s
g
 
i
s
 
e
r
r
o
r
 
m
e
s
s
a
g
e
 
f
r
o
m
 
e
x
c
e
p
t
i
o
n


 
 
 
 
 
 
 
 
 
p
r
i
n
t
(
d
s
t
,
 
s
r
c
,
 
m
s
g
)



如果你提供关键字参数 ignore_dangling_symlinks=True ，
这时候 copytree() 会忽略掉无效符号链接。

本节演示的这些函数都是最常见的。不过，shutil 还有更多的和复制数据相关的操作。
它的文档很值得一看，参考 Python documentation

## 13.8 创建和解压归档文件


### 问题


你需要创建或解压常见格式的归档文件（比如.tar, .tgz或.zip）

### 解决方案


shutil 模块拥有两个函数—— make_archive() 和 unpack_archive() 可派上用场。
例如：

In [None]:
import shutil
shutil.unpack_archive('Python-3.3.0.tgz')

In [None]:
shutil.make_archive('py33','zip','Python-3.3.0')

make_archive() 的第二个参数是期望的输出格式。
可以使用 get_archive_formats() 获取所有支持的归档格式列表。例如：

In [None]:
shutil.get_archive_formats()

### 讨论


Python还有其他的模块可用来处理多种归档格式（比如tarfile, zipfile, gzip, bz2）的底层细节。
不过，如果你仅仅只是要创建或提取某个归档，就没有必要使用底层库了。
可以直接使用 shutil 中的这些高层函数。

这些函数还有很多其他选项，用于日志打印、预检、文件权限等等。
参考 shutil文档

## 13.9 通过文件名查找文件


### 问题


你需要写一个涉及到文件查找操作的脚本，比如对日志归档文件的重命名工具，
你不想在Python脚本中调用shell，或者你要实现一些shell不能做的功能。

### 解决方案


查找文件，可使用 os.walk() 函数，传一个顶级目录名给它。
下面是一个例子，查找特定的文件名并答应所有符合条件的文件全路径：

In [None]:
#
!
/
u
s
r
/
b
i
n
/
e
n
v
 
p
y
t
h
o
n
3
.
3


i
m
p
o
r
t
 
o
s




d
e
f
 
f
i
n
d
f
i
l
e
(
s
t
a
r
t
,
 
n
a
m
e
)
:


 
 
 
 
f
o
r
 
r
e
l
p
a
t
h
,
 
d
i
r
s
,
 
f
i
l
e
s
 
i
n
 
o
s
.
w
a
l
k
(
s
t
a
r
t
)
:


 
 
 
 
 
 
 
 
i
f
 
n
a
m
e
 
i
n
 
f
i
l
e
s
:


 
 
 
 
 
 
 
 
 
 
 
 
f
u
l
l
_
p
a
t
h
 
=
 
o
s
.
p
a
t
h
.
j
o
i
n
(
s
t
a
r
t
,
 
r
e
l
p
a
t
h
,
 
n
a
m
e
)


 
 
 
 
 
 
 
 
 
 
 
 
p
r
i
n
t
(
o
s
.
p
a
t
h
.
n
o
r
m
p
a
t
h
(
o
s
.
p
a
t
h
.
a
b
s
p
a
t
h
(
f
u
l
l
_
p
a
t
h
)
)
)




i
f
 
_
_
n
a
m
e
_
_
 
=
=
 
'
_
_
m
a
i
n
_
_
'
:


 
 
 
 
f
i
n
d
f
i
l
e
(
s
y
s
.
a
r
g
v
[
1
]
,
 
s
y
s
.
a
r
g
v
[
2
]
)



保存脚本为文件findfile.py，然后在命令行中执行它。
指定初始查找目录以及名字作为位置参数，如下：

### 讨论


os.walk() 方法为我们遍历目录树，
每次进入一个目录，它会返回一个三元组，包含相对于查找目录的相对路径，一个该目录下的目录名列表，
以及那个目录下面的文件名列表。

对于每个元组，只需检测一下目标文件名是否在文件列表中。如果是就使用 os.path.join() 合并路径。
为了避免奇怪的路径名比如 ././foo//bar ，使用了另外两个函数来修正结果。
第一个是 os.path.abspath() ,它接受一个路径，可能是相对路径，最后返回绝对路径。
第二个是 os.path.normpath() ，用来返回正常路径，可以解决双斜杆、对目录的多重引用的问题等。

尽管这个脚本相对于UNIX平台上面的很多查找来讲要简单很多，它还有跨平台的优势。
并且，还能很轻松的加入其他的功能。
我们再演示一个例子，下面的函数打印所有最近被修改过的文件：

In [None]:
#
!
/
u
s
r
/
b
i
n
/
e
n
v
 
p
y
t
h
o
n
3
.
3




i
m
p
o
r
t
 
o
s


i
m
p
o
r
t
 
t
i
m
e




d
e
f
 
m
o
d
i
f
i
e
d
_
w
i
t
h
i
n
(
t
o
p
,
 
s
e
c
o
n
d
s
)
:


 
 
 
 
n
o
w
 
=
 
t
i
m
e
.
t
i
m
e
(
)


 
 
 
 
f
o
r
 
p
a
t
h
,
 
d
i
r
s
,
 
f
i
l
e
s
 
i
n
 
o
s
.
w
a
l
k
(
t
o
p
)
:


 
 
 
 
 
 
 
 
f
o
r
 
n
a
m
e
 
i
n
 
f
i
l
e
s
:


 
 
 
 
 
 
 
 
 
 
 
 
f
u
l
l
p
a
t
h
 
=
 
o
s
.
p
a
t
h
.
j
o
i
n
(
p
a
t
h
,
 
n
a
m
e
)


 
 
 
 
 
 
 
 
 
 
 
 
i
f
 
o
s
.
p
a
t
h
.
e
x
i
s
t
s
(
f
u
l
l
p
a
t
h
)
:


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
m
t
i
m
e
 
=
 
o
s
.
p
a
t
h
.
g
e
t
m
t
i
m
e
(
f
u
l
l
p
a
t
h
)


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
i
f
 
m
t
i
m
e
 
>
 
(
n
o
w
 
-
 
s
e
c
o
n
d
s
)
:


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
p
r
i
n
t
(
f
u
l
l
p
a
t
h
)




i
f
 
_
_
n
a
m
e
_
_
 
=
=
 
'
_
_
m
a
i
n
_
_
'
:


 
 
 
 
i
m
p
o
r
t
 
s
y
s


 
 
 
 
i
f
 
l
e
n
(
s
y
s
.
a
r
g
v
)
 
!
=
 
3
:


 
 
 
 
 
 
 
 
p
r
i
n
t
(
'
U
s
a
g
e
:
 
{
}
 
d
i
r
 
s
e
c
o
n
d
s
'
.
f
o
r
m
a
t
(
s
y
s
.
a
r
g
v
[
0
]
)
)


 
 
 
 
 
 
 
 
r
a
i
s
e
 
S
y
s
t
e
m
E
x
i
t
(
1
)




 
 
 
 
m
o
d
i
f
i
e
d
_
w
i
t
h
i
n
(
s
y
s
.
a
r
g
v
[
1
]
,
 
f
l
o
a
t
(
s
y
s
.
a
r
g
v
[
2
]
)
)



在此函数的基础之上，使用os,os.path,glob等类似模块，你就能实现更加复杂的操作了。
可参考5.11小节和5.13小节等相关章节。

## 13.10 读取配置文件


### 问题


怎样读取普通.ini格式的配置文件？

### 解决方案


configparser 模块能被用来读取配置文件。例如，假设你有如下的配置文件：

In [None]:
;
 
c
o
n
f
i
g
.
i
n
i


;
 
S
a
m
p
l
e
 
c
o
n
f
i
g
u
r
a
t
i
o
n
 
f
i
l
e




[
i
n
s
t
a
l
l
a
t
i
o
n
]


l
i
b
r
a
r
y
=
%
(
p
r
e
f
i
x
)
s
/
l
i
b


i
n
c
l
u
d
e
=
%
(
p
r
e
f
i
x
)
s
/
i
n
c
l
u
d
e


b
i
n
=
%
(
p
r
e
f
i
x
)
s
/
b
i
n


p
r
e
f
i
x
=
/
u
s
r
/
l
o
c
a
l




#
 
S
e
t
t
i
n
g
 
r
e
l
a
t
e
d
 
t
o
 
d
e
b
u
g
 
c
o
n
f
i
g
u
r
a
t
i
o
n


[
d
e
b
u
g
]


l
o
g
_
e
r
r
o
r
s
=
t
r
u
e


s
h
o
w
_
w
a
r
n
i
n
g
s
=
F
a
l
s
e




[
s
e
r
v
e
r
]


p
o
r
t
:
 
8
0
8
0


n
w
o
r
k
e
r
s
:
 
3
2


p
i
d
-
f
i
l
e
=
/
t
m
p
/
s
p
a
m
.
p
i
d


r
o
o
t
=
/
w
w
w
/
r
o
o
t


s
i
g
n
a
t
u
r
e
:


 
 
 
 
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=


 
 
 
 
B
r
o
u
g
h
t
 
t
o
 
y
o
u
 
b
y
 
t
h
e
 
P
y
t
h
o
n
 
C
o
o
k
b
o
o
k


 
 
 
 
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=



下面是一个读取和提取其中值的例子：

In [None]:
from configparser import ConfigParser
cfg = ConfigParser()
cfg.read('config.ini')

In [None]:
cfg.sections()

In [None]:
cfg.get('installation','library')

In [None]:
cfg.getboolean('debug','log_errors')

In [None]:
cfg.getint('server','port')

In [None]:
cfg.getint('server','nworkers')

In [None]:
print(cfg.get('server','signature'))

如果有需要，你还能修改配置并使用 cfg.write() 方法将其写回到文件中。例如：

In [None]:
cfg.set('server','port','9000')
cfg.set('debug','log_errors','False')
import sys
cfg.write(sys.stdout)

### 讨论


配置文件作为一种可读性很好的格式，非常适用于存储程序中的配置数据。
在每个配置文件中，配置数据会被分组（比如例子中的“installation”、 “debug” 和 “server”）。
每个分组在其中指定对应的各个变量值。

对于可实现同样功能的配置文件和Python源文件是有很大的不同的。
首先，配置文件的语法要更自由些，下面的赋值语句是等效的：

In [None]:
p
r
e
f
i
x
=
/
u
s
r
/
l
o
c
a
l


p
r
e
f
i
x
:
 
/
u
s
r
/
l
o
c
a
l



配置文件中的名字是不区分大小写的。例如：

In [None]:
cfg.get('installation','PREFIX')

In [None]:
cfg.get('installation','prefix')

在解析值的时候，getboolean() 方法查找任何可行的值。例如下面都是等价的：

In [None]:
l
o
g
_
e
r
r
o
r
s
 
=
 
t
r
u
e


l
o
g
_
e
r
r
o
r
s
 
=
 
T
R
U
E


l
o
g
_
e
r
r
o
r
s
 
=
 
Y
e
s


l
o
g
_
e
r
r
o
r
s
 
=
 
1



或许配置文件和Python代码最大的不同在于，它并不是从上而下的顺序执行。
文件是安装一个整体被读取的。如果碰到了变量替换，它实际上已经被替换完成了。
例如，在下面这个配置中，prefix 变量在使用它的变量之前或之后定义都是可以的：

In [None]:
[
i
n
s
t
a
l
l
a
t
i
o
n
]


l
i
b
r
a
r
y
=
%
(
p
r
e
f
i
x
)
s
/
l
i
b


i
n
c
l
u
d
e
=
%
(
p
r
e
f
i
x
)
s
/
i
n
c
l
u
d
e


b
i
n
=
%
(
p
r
e
f
i
x
)
s
/
b
i
n


p
r
e
f
i
x
=
/
u
s
r
/
l
o
c
a
l



ConfigParser 有个容易被忽视的特性是它能一次读取多个配置文件然后合并成一个配置。
例如，假设一个用户像下面这样构造了他们的配置文件：

In [None]:
;
 
~
/
.
c
o
n
f
i
g
.
i
n
i


[
i
n
s
t
a
l
l
a
t
i
o
n
]


p
r
e
f
i
x
=
/
U
s
e
r
s
/
b
e
a
z
l
e
y
/
t
e
s
t




[
d
e
b
u
g
]


l
o
g
_
e
r
r
o
r
s
=
F
a
l
s
e



读取这个文件，它就能跟之前的配置合并起来。如：

In [None]:
# Previously read configuration
cfg.get('installation', 'prefix')

In [None]:
# Merge in user-specific configuration
import os
cfg.read(os.path.expanduser('~/.config.ini'))

In [None]:
cfg.get('installation', 'prefix')

In [None]:
cfg.get('installation', 'library')

In [None]:
cfg.getboolean('debug', 'log_errors')

仔细观察下 prefix 变量是怎样覆盖其他相关变量的，比如 library 的设定值。
产生这种结果的原因是变量的改写采取的是后发制人策略，以最后一个为准。
你可以像下面这样做试验：

In [None]:
cfg.get('installation','library')

In [None]:
cfg.set('installation','prefix','/tmp/dir')
cfg.get('installation','library')

最后还有很重要一点要注意的是Python并不能支持.ini文件在其他程序（比如windows应用程序）中的所有特性。
确保你已经参阅了configparser文档中的语法详情以及支持特性。

## 13.11 给简单脚本增加日志功能


### 问题


你希望在脚本和程序中将诊断信息写入日志文件。

### 解决方案


打印日志最简单方式是使用 logging 模块。例如：

In [None]:
i
m
p
o
r
t
 
l
o
g
g
i
n
g




d
e
f
 
m
a
i
n
(
)
:


 
 
 
 
#
 
C
o
n
f
i
g
u
r
e
 
t
h
e
 
l
o
g
g
i
n
g
 
s
y
s
t
e
m


 
 
 
 
l
o
g
g
i
n
g
.
b
a
s
i
c
C
o
n
f
i
g
(


 
 
 
 
 
 
 
 
f
i
l
e
n
a
m
e
=
'
a
p
p
.
l
o
g
'
,


 
 
 
 
 
 
 
 
l
e
v
e
l
=
l
o
g
g
i
n
g
.
E
R
R
O
R


 
 
 
 
)




 
 
 
 
#
 
V
a
r
i
a
b
l
e
s
 
(
t
o
 
m
a
k
e
 
t
h
e
 
c
a
l
l
s
 
t
h
a
t
 
f
o
l
l
o
w
 
w
o
r
k
)


 
 
 
 
h
o
s
t
n
a
m
e
 
=
 
'
w
w
w
.
p
y
t
h
o
n
.
o
r
g
'


 
 
 
 
i
t
e
m
 
=
 
'
s
p
a
m
'


 
 
 
 
f
i
l
e
n
a
m
e
 
=
 
'
d
a
t
a
.
c
s
v
'


 
 
 
 
m
o
d
e
 
=
 
'
r
'




 
 
 
 
#
 
E
x
a
m
p
l
e
 
l
o
g
g
i
n
g
 
c
a
l
l
s
 
(
i
n
s
e
r
t
 
i
n
t
o
 
y
o
u
r
 
p
r
o
g
r
a
m
)


 
 
 
 
l
o
g
g
i
n
g
.
c
r
i
t
i
c
a
l
(
'
H
o
s
t
 
%
s
 
u
n
k
n
o
w
n
'
,
 
h
o
s
t
n
a
m
e
)


 
 
 
 
l
o
g
g
i
n
g
.
e
r
r
o
r
(
"
C
o
u
l
d
n
'
t
 
f
i
n
d
 
%
r
"
,
 
i
t
e
m
)


 
 
 
 
l
o
g
g
i
n
g
.
w
a
r
n
i
n
g
(
'
F
e
a
t
u
r
e
 
i
s
 
d
e
p
r
e
c
a
t
e
d
'
)


 
 
 
 
l
o
g
g
i
n
g
.
i
n
f
o
(
'
O
p
e
n
i
n
g
 
f
i
l
e
 
%
r
,
 
m
o
d
e
=
%
r
'
,
 
f
i
l
e
n
a
m
e
,
 
m
o
d
e
)


 
 
 
 
l
o
g
g
i
n
g
.
d
e
b
u
g
(
'
G
o
t
 
h
e
r
e
'
)




i
f
 
_
_
n
a
m
e
_
_
 
=
=
 
'
_
_
m
a
i
n
_
_
'
:


 
 
 
 
m
a
i
n
(
)



上面五个日志调用（critical(), error(), warning(), info(), debug()）以降序方式表示不同的严重级别。
basicConfig() 的 level 参数是一个过滤器。
所有级别低于此级别的日志消息都会被忽略掉。
每个logging操作的参数是一个消息字符串，后面再跟一个或多个参数。
构造最终的日志消息的时候我们使用了%操作符来格式化消息字符串。

运行这个程序后，在文件 app.log 中的内容应该是下面这样：

In [None]:
C
R
I
T
I
C
A
L
:
r
o
o
t
:
H
o
s
t
 
w
w
w
.
p
y
t
h
o
n
.
o
r
g
 
u
n
k
n
o
w
n


E
R
R
O
R
:
r
o
o
t
:
C
o
u
l
d
 
n
o
t
 
f
i
n
d
 
'
s
p
a
m
'



如果你想改变输出等级，你可以修改 basicConfig() 调用中的参数。例如：

In [None]:
l
o
g
g
i
n
g
.
b
a
s
i
c
C
o
n
f
i
g
(


 
 
 
 
 
f
i
l
e
n
a
m
e
=
'
a
p
p
.
l
o
g
'
,


 
 
 
 
 
l
e
v
e
l
=
l
o
g
g
i
n
g
.
W
A
R
N
I
N
G
,


 
 
 
 
 
f
o
r
m
a
t
=
'
%
(
l
e
v
e
l
n
a
m
e
)
s
:
%
(
a
s
c
t
i
m
e
)
s
:
%
(
m
e
s
s
a
g
e
)
s
'
)



最后输出变成如下：

In [None]:
C
R
I
T
I
C
A
L
:
2
0
1
2
-
1
1
-
2
0
 
1
2
:
2
7
:
1
3
,
5
9
5
:
H
o
s
t
 
w
w
w
.
p
y
t
h
o
n
.
o
r
g
 
u
n
k
n
o
w
n


E
R
R
O
R
:
2
0
1
2
-
1
1
-
2
0
 
1
2
:
2
7
:
1
3
,
5
9
5
:
C
o
u
l
d
 
n
o
t
 
f
i
n
d
 
'
s
p
a
m
'


W
A
R
N
I
N
G
:
2
0
1
2
-
1
1
-
2
0
 
1
2
:
2
7
:
1
3
,
5
9
5
:
F
e
a
t
u
r
e
 
i
s
 
d
e
p
r
e
c
a
t
e
d



上面的日志配置都是硬编码到程序中的。如果你想使用配置文件，
可以像下面这样修改 basicConfig() 调用：

In [None]:
i
m
p
o
r
t
 
l
o
g
g
i
n
g


i
m
p
o
r
t
 
l
o
g
g
i
n
g
.
c
o
n
f
i
g




d
e
f
 
m
a
i
n
(
)
:


 
 
 
 
#
 
C
o
n
f
i
g
u
r
e
 
t
h
e
 
l
o
g
g
i
n
g
 
s
y
s
t
e
m


 
 
 
 
l
o
g
g
i
n
g
.
c
o
n
f
i
g
.
f
i
l
e
C
o
n
f
i
g
(
'
l
o
g
c
o
n
f
i
g
.
i
n
i
'
)


 
 
 
 
.
.
.



创建一个下面这样的文件，名字叫 logconfig.ini ：

In [None]:
[
l
o
g
g
e
r
s
]


k
e
y
s
=
r
o
o
t




[
h
a
n
d
l
e
r
s
]


k
e
y
s
=
d
e
f
a
u
l
t
H
a
n
d
l
e
r




[
f
o
r
m
a
t
t
e
r
s
]


k
e
y
s
=
d
e
f
a
u
l
t
F
o
r
m
a
t
t
e
r




[
l
o
g
g
e
r
_
r
o
o
t
]


l
e
v
e
l
=
I
N
F
O


h
a
n
d
l
e
r
s
=
d
e
f
a
u
l
t
H
a
n
d
l
e
r


q
u
a
l
n
a
m
e
=
r
o
o
t




[
h
a
n
d
l
e
r
_
d
e
f
a
u
l
t
H
a
n
d
l
e
r
]


c
l
a
s
s
=
F
i
l
e
H
a
n
d
l
e
r


f
o
r
m
a
t
t
e
r
=
d
e
f
a
u
l
t
F
o
r
m
a
t
t
e
r


a
r
g
s
=
(
'
a
p
p
.
l
o
g
'
,
 
'
a
'
)




[
f
o
r
m
a
t
t
e
r
_
d
e
f
a
u
l
t
F
o
r
m
a
t
t
e
r
]


f
o
r
m
a
t
=
%
(
l
e
v
e
l
n
a
m
e
)
s
:
%
(
n
a
m
e
)
s
:
%
(
m
e
s
s
a
g
e
)
s



如果你想修改配置，可以直接编辑文件logconfig.ini即可。

### 讨论


尽管对于 logging 模块而已有很多更高级的配置选项，
不过这里的方案对于简单的程序和脚本已经足够了。
只想在调用日志操作前先执行下basicConfig()函数方法，你的程序就能产生日志输出了。

如果你想要你的日志消息写到标准错误中，而不是日志文件中，调用 basicConfig() 时不传文件名参数即可。例如：

In [None]:
l
o
g
g
i
n
g
.
b
a
s
i
c
C
o
n
f
i
g
(
l
e
v
e
l
=
l
o
g
g
i
n
g
.
I
N
F
O
)



basicConfig() 在程序中只能被执行一次。如果你稍后想改变日志配置，
就需要先获取 root logger ，然后直接修改它。例如：

In [None]:
l
o
g
g
i
n
g
.
g
e
t
L
o
g
g
e
r
(
)
.
l
e
v
e
l
 
=
 
l
o
g
g
i
n
g
.
D
E
B
U
G



需要强调的是本节只是演示了 logging 模块的一些基本用法。
它可以做更多更高级的定制。
关于日志定制化一个很好的资源是 Logging Cookbook

## 13.12 给函数库增加日志功能


### 问题


你想给某个函数库增加日志功能，但是又不能影响到那些不使用日志功能的程序。

### 解决方案


对于想要执行日志操作的函数库而已，你应该创建一个专属的 logger 对象，并且像下面这样初始化配置：

In [None]:
#
 
s
o
m
e
l
i
b
.
p
y




i
m
p
o
r
t
 
l
o
g
g
i
n
g


l
o
g
 
=
 
l
o
g
g
i
n
g
.
g
e
t
L
o
g
g
e
r
(
_
_
n
a
m
e
_
_
)


l
o
g
.
a
d
d
H
a
n
d
l
e
r
(
l
o
g
g
i
n
g
.
N
u
l
l
H
a
n
d
l
e
r
(
)
)




#
 
E
x
a
m
p
l
e
 
f
u
n
c
t
i
o
n
 
(
f
o
r
 
t
e
s
t
i
n
g
)


d
e
f
 
f
u
n
c
(
)
:


 
 
 
 
l
o
g
.
c
r
i
t
i
c
a
l
(
'
A
 
C
r
i
t
i
c
a
l
 
E
r
r
o
r
!
'
)


 
 
 
 
l
o
g
.
d
e
b
u
g
(
'
A
 
d
e
b
u
g
 
m
e
s
s
a
g
e
'
)



使用这个配置，默认情况下不会打印日志。例如：

In [None]:
import somelib
somelib.func()

不过，如果配置过日志系统，那么日志消息打印就开始生效，例如：

In [None]:
import logging
logging.basicConfig()
somelib.func()

### 讨论


通常来讲，你不应该在函数库代码中自己配置日志系统，或者是已经假定有个已经存在的日志配置了。

调用 getLogger(__name__) 创建一个和调用模块同名的logger模块。
由于模块都是唯一的，因此创建的logger也将是唯一的。

log.addHandler(logging.NullHandler()) 操作将一个空处理器绑定到刚刚已经创建好的logger对象上。
一个空处理器默认会忽略调用所有的日志消息。
因此，如果使用该函数库的时候还没有配置日志，那么将不会有消息或警告出现。

还有一点就是对于各个函数库的日志配置可以是相互独立的，不影响其他库的日志配置。
例如，对于如下的代码：

In [None]:
import logging
logging.basicConfig(level=logging.ERROR)

In [None]:
import somelib
somelib.func()

In [None]:
# Change the logging level for 'somelib' only
logging.getLogger('somelib').level=logging.DEBUG
somelib.func()

在这里，根日志被配置成仅仅输出ERROR或更高级别的消息。
不过 ，somelib 的日志级别被单独配置成可以输出debug级别的消息，它的优先级比全局配置高。
像这样更改单独模块的日志配置对于调试来讲是很方便的，
因为你无需去更改任何的全局日志配置——只需要修改你想要更多输出的模块的日志等级。

Logging HOWTO
详细介绍了如何配置日志模块和其他有用技巧，可以参阅下。

## 13.13 实现一个计时器


### 问题


你想记录程序执行多个任务所花费的时间

### 解决方案


time 模块包含很多函数来执行跟时间有关的函数。
尽管如此，通常我们会在此基础之上构造一个更高级的接口来模拟一个计时器。例如：

In [None]:
i
m
p
o
r
t
 
t
i
m
e




c
l
a
s
s
 
T
i
m
e
r
:


 
 
 
 
d
e
f
 
_
_
i
n
i
t
_
_
(
s
e
l
f
,
 
f
u
n
c
=
t
i
m
e
.
p
e
r
f
_
c
o
u
n
t
e
r
)
:


 
 
 
 
 
 
 
 
s
e
l
f
.
e
l
a
p
s
e
d
 
=
 
0
.
0


 
 
 
 
 
 
 
 
s
e
l
f
.
_
f
u
n
c
 
=
 
f
u
n
c


 
 
 
 
 
 
 
 
s
e
l
f
.
_
s
t
a
r
t
 
=
 
N
o
n
e




 
 
 
 
d
e
f
 
s
t
a
r
t
(
s
e
l
f
)
:


 
 
 
 
 
 
 
 
i
f
 
s
e
l
f
.
_
s
t
a
r
t
 
i
s
 
n
o
t
 
N
o
n
e
:


 
 
 
 
 
 
 
 
 
 
 
 
r
a
i
s
e
 
R
u
n
t
i
m
e
E
r
r
o
r
(
'
A
l
r
e
a
d
y
 
s
t
a
r
t
e
d
'
)


 
 
 
 
 
 
 
 
s
e
l
f
.
_
s
t
a
r
t
 
=
 
s
e
l
f
.
_
f
u
n
c
(
)




 
 
 
 
d
e
f
 
s
t
o
p
(
s
e
l
f
)
:


 
 
 
 
 
 
 
 
i
f
 
s
e
l
f
.
_
s
t
a
r
t
 
i
s
 
N
o
n
e
:


 
 
 
 
 
 
 
 
 
 
 
 
r
a
i
s
e
 
R
u
n
t
i
m
e
E
r
r
o
r
(
'
N
o
t
 
s
t
a
r
t
e
d
'
)


 
 
 
 
 
 
 
 
e
n
d
 
=
 
s
e
l
f
.
_
f
u
n
c
(
)


 
 
 
 
 
 
 
 
s
e
l
f
.
e
l
a
p
s
e
d
 
+
=
 
e
n
d
 
-
 
s
e
l
f
.
_
s
t
a
r
t


 
 
 
 
 
 
 
 
s
e
l
f
.
_
s
t
a
r
t
 
=
 
N
o
n
e




 
 
 
 
d
e
f
 
r
e
s
e
t
(
s
e
l
f
)
:


 
 
 
 
 
 
 
 
s
e
l
f
.
e
l
a
p
s
e
d
 
=
 
0
.
0




 
 
 
 
@
p
r
o
p
e
r
t
y


 
 
 
 
d
e
f
 
r
u
n
n
i
n
g
(
s
e
l
f
)
:


 
 
 
 
 
 
 
 
r
e
t
u
r
n
 
s
e
l
f
.
_
s
t
a
r
t
 
i
s
 
n
o
t
 
N
o
n
e




 
 
 
 
d
e
f
 
_
_
e
n
t
e
r
_
_
(
s
e
l
f
)
:


 
 
 
 
 
 
 
 
s
e
l
f
.
s
t
a
r
t
(
)


 
 
 
 
 
 
 
 
r
e
t
u
r
n
 
s
e
l
f




 
 
 
 
d
e
f
 
_
_
e
x
i
t
_
_
(
s
e
l
f
,
 
*
a
r
g
s
)
:


 
 
 
 
 
 
 
 
s
e
l
f
.
s
t
o
p
(
)



这个类定义了一个可以被用户根据需要启动、停止和重置的计时器。
它会在 elapsed 属性中记录整个消耗时间。
下面是一个例子来演示怎样使用它：

In [None]:
d
e
f
 
c
o
u
n
t
d
o
w
n
(
n
)
:


 
 
 
 
w
h
i
l
e
 
n
 
>
 
0
:


 
 
 
 
 
 
 
 
n
 
-
=
 
1




#
 
U
s
e
 
1
:
 
E
x
p
l
i
c
i
t
 
s
t
a
r
t
/
s
t
o
p


t
 
=
 
T
i
m
e
r
(
)


t
.
s
t
a
r
t
(
)


c
o
u
n
t
d
o
w
n
(
1
0
0
0
0
0
0
)


t
.
s
t
o
p
(
)


p
r
i
n
t
(
t
.
e
l
a
p
s
e
d
)




#
 
U
s
e
 
2
:
 
A
s
 
a
 
c
o
n
t
e
x
t
 
m
a
n
a
g
e
r


w
i
t
h
 
t
:


 
 
 
 
c
o
u
n
t
d
o
w
n
(
1
0
0
0
0
0
0
)




p
r
i
n
t
(
t
.
e
l
a
p
s
e
d
)




w
i
t
h
 
T
i
m
e
r
(
)
 
a
s
 
t
2
:


 
 
 
 
c
o
u
n
t
d
o
w
n
(
1
0
0
0
0
0
0
)


p
r
i
n
t
(
t
2
.
e
l
a
p
s
e
d
)



### 讨论


本节提供了一个简单而实用的类来实现时间记录以及耗时计算。
同时也是对使用with语句以及上下文管理器协议的一个很好的演示。

在计时中要考虑一个底层的时间函数问题。一般来说，
使用 time.time() 或 time.clock() 计算的时间精度因操作系统的不同会有所不同。
而使用 time.perf_counter() 函数可以确保使用系统上面最精确的计时器。

上述代码中由 Timer 类记录的时间是钟表时间，并包含了所有休眠时间。
如果你只想计算该进程所花费的CPU时间，应该使用 time.process_time() 来代替：

In [None]:
t
 
=
 
T
i
m
e
r
(
t
i
m
e
.
p
r
o
c
e
s
s
_
t
i
m
e
)


w
i
t
h
 
t
:


 
 
 
 
c
o
u
n
t
d
o
w
n
(
1
0
0
0
0
0
0
)


p
r
i
n
t
(
t
.
e
l
a
p
s
e
d
)



time.perf_counter() 和 time.process_time() 都会返回小数形式的秒数时间。
实际的时间值没有任何意义，为了得到有意义的结果，你得执行两次函数然后计算它们的差值。

更多关于计时和性能分析的例子请参考14.13小节。

## 13.14 限制内存和CPU的使用量


### 问题


你想对在Unix系统上面运行的程序设置内存或CPU的使用限制。

### 解决方案


resource 模块能同时执行这两个任务。例如，要限制CPU时间，可以像下面这样做：

In [None]:
i
m
p
o
r
t
 
s
i
g
n
a
l


i
m
p
o
r
t
 
r
e
s
o
u
r
c
e


i
m
p
o
r
t
 
o
s




d
e
f
 
t
i
m
e
_
e
x
c
e
e
d
e
d
(
s
i
g
n
o
,
 
f
r
a
m
e
)
:


 
 
 
 
p
r
i
n
t
(
"
T
i
m
e
'
s
 
u
p
!
"
)


 
 
 
 
r
a
i
s
e
 
S
y
s
t
e
m
E
x
i
t
(
1
)




d
e
f
 
s
e
t
_
m
a
x
_
r
u
n
t
i
m
e
(
s
e
c
o
n
d
s
)
:


 
 
 
 
#
 
I
n
s
t
a
l
l
 
t
h
e
 
s
i
g
n
a
l
 
h
a
n
d
l
e
r
 
a
n
d
 
s
e
t
 
a
 
r
e
s
o
u
r
c
e
 
l
i
m
i
t


 
 
 
 
s
o
f
t
,
 
h
a
r
d
 
=
 
r
e
s
o
u
r
c
e
.
g
e
t
r
l
i
m
i
t
(
r
e
s
o
u
r
c
e
.
R
L
I
M
I
T
_
C
P
U
)


 
 
 
 
r
e
s
o
u
r
c
e
.
s
e
t
r
l
i
m
i
t
(
r
e
s
o
u
r
c
e
.
R
L
I
M
I
T
_
C
P
U
,
 
(
s
e
c
o
n
d
s
,
 
h
a
r
d
)
)


 
 
 
 
s
i
g
n
a
l
.
s
i
g
n
a
l
(
s
i
g
n
a
l
.
S
I
G
X
C
P
U
,
 
t
i
m
e
_
e
x
c
e
e
d
e
d
)




i
f
 
_
_
n
a
m
e
_
_
 
=
=
 
'
_
_
m
a
i
n
_
_
'
:


 
 
 
 
s
e
t
_
m
a
x
_
r
u
n
t
i
m
e
(
1
5
)


 
 
 
 
w
h
i
l
e
 
T
r
u
e
:


 
 
 
 
 
 
 
 
p
a
s
s



程序运行时，SIGXCPU 信号在时间过期时被生成，然后执行清理并退出。

要限制内存使用，设置可使用的总内存值即可，如下：

In [None]:
i
m
p
o
r
t
 
r
e
s
o
u
r
c
e




d
e
f
 
l
i
m
i
t
_
m
e
m
o
r
y
(
m
a
x
s
i
z
e
)
:


 
 
 
 
s
o
f
t
,
 
h
a
r
d
 
=
 
r
e
s
o
u
r
c
e
.
g
e
t
r
l
i
m
i
t
(
r
e
s
o
u
r
c
e
.
R
L
I
M
I
T
_
A
S
)


 
 
 
 
r
e
s
o
u
r
c
e
.
s
e
t
r
l
i
m
i
t
(
r
e
s
o
u
r
c
e
.
R
L
I
M
I
T
_
A
S
,
 
(
m
a
x
s
i
z
e
,
 
h
a
r
d
)
)



像这样设置了内存限制后，程序运行到没有多余内存时会抛出 MemoryError 异常。

### 讨论


在本节例子中，setrlimit() 函数被用来设置特定资源上面的软限制和硬限制。
软限制是一个值，当超过这个值的时候操作系统通常会发送一个信号来限制或通知该进程。
硬限制是用来指定软限制能设定的最大值。通常来讲，这个由系统管理员通过设置系统级参数来决定。
尽管硬限制可以改小一点，但是最好不要使用用户进程去修改。

setrlimit() 函数还能被用来设置子进程数量、打开文件数以及类似系统资源的限制。
更多详情请参考 resource 模块的文档。

需要注意的是本节内容只能适用于Unix系统，并且不保证所有系统都能如期工作。
比如我们在测试的时候，它能在Linux上面正常运行，但是在OS X上却不能。

## 13.15 启动一个WEB浏览器


### 问题


你想通过脚本启动浏览器并打开指定的URL网页

### 解决方案


webbrowser 模块能被用来启动一个浏览器，并且与平台无关。例如：

In [None]:
import webbrowser
webbrowser.open('http://www.python.org')

它会使用默认浏览器打开指定网页。如果你还想对网页打开方式做更多控制，还可以使用下面这些函数：

In [None]:
# Open the page in a new browser window
webbrowser.open_new('http://www.python.org')

In [None]:
# Open the page in a new browser tab
webbrowser.open_new_tab('http://www.python.org')

这样就可以打开一个新的浏览器窗口或者标签，只要浏览器支持就行。

如果你想指定浏览器类型，可以使用 webbrowser.get() 函数来指定某个特定浏览器。例如：

In [None]:
c = webbrowser.get('firefox')
c.open('http://www.python.org')

In [None]:
c.open_new_tab('http://docs.python.org')

对于支持的浏览器名称列表可查阅`Python文档 <http://docs.python.org/3/library/webbrowser.html>`_

### 讨论


在脚本中打开浏览器有时候会很有用。例如，某个脚本执行某个服务器发布任务，
你想快速打开一个浏览器来确保它已经正常运行了。
或者是某个程序以HTML网页格式输出数据，你想打开浏览器查看结果。
不管是上面哪种情况，使用 webbrowser 模块都是一个简单实用的解决方案。