# 第17章 作用域

## python作用域基础

- 一个def内定义的变量名能够被def内的代码使用，不能在函数的外部引用这样的变量名；def之中的变量与def之外的变量名并不冲突

- 一个变量的作用域总是由在代码中被赋值的地方所决定：如果一个变量在def内赋值，它被定位在这个函数之内；如果一个变量在一个嵌套的def中赋值，对于嵌套的函数来说，它是非本地的；如果在def之外赋值，它就是整个文件全局的

## 作用域法则

- 函数定义了本地作用域，而模块定义的是全局作用域

- 全局作用域的作用范围仅限于单个文件，在Python中是没有基于一个单个的、无所不包的情景文件的全局作用域的，替代这种方法的是，变量名由模块文件隔开，并且必须精确地导入一个模块文件才能够使用这个文件中定义的变量名

- 每次对函数的调用都创建了一个新的本地作用域

- 在默认情况下，所有函数定义内部的变量名是位于本地作用域（与函数调用相关的）内的，如果需要给一个在函数内部却位于模块文件顶层的变量名赋值，需要在函数内部通过global语句声明，如果需要给位于一个嵌套的def中的名称赋值，从Python3.0开始可以通过在一条nonlocal语句中声明它来做到

- 一个函数内部的任何类型的赋值都会把一个名称划定为本地的，这包括=语句、import中的模块名称、def中的函数名称、函数参数名称等，如果在一个def语句中以任何方式赋值一个名称，它都将对于该函数成为本地的；原处修改对象并不会把变量划分为本地变量，实际上只有对变量名赋值才可以

In [1]:
L = [1, 2]
def f1():
    L = [1, 2, 3]
f1()
print L

[1, 2]


In [2]:
L = [1, 2]
def f1():
    L.append(3)
f1()
print L

[1, 2, 3]


## 变量名解析：LEGB原则

- 当在函数中使用未认证的变量名时，Python搜索4个作用域【本地作用域（L），之后是上一层结构中的def或lambda的本地作用域（E），之后是全局作用域（G），最后是内置作用域（B）】并且在第一处能够找到这个变量名的地方停下来，如果变量名在这次搜索中没有找到，Python会报错，因为变量名在使用前首先必须赋值过

## 作用域实例

In [3]:
# Global scope
X = 99

def func(Y):
    # Local scope
    Z = X + Y
    return Z
func(1)

100

- 在上一个例子中，X和func是全局变量名，Y和Z是本地变量名

## 内置作用域

- 内置作用域是一个名为\_\_builtin__的内置模块，但是必须要import \_\_builtin\_\_之后才能使用内置作用域，因为变量名\_\_builtin\_\_本身并没有预先内置

In [4]:
# 前一半是内置的异常，后一半是内置函数
import __builtin__
dir(__builtin__)

['ArithmeticError',
 'AssertionError',
 'AttributeError',
 'BaseException',
 'BufferError',
 'EOFError',
 'Ellipsis',
 'EnvironmentError',
 'Exception',
 'False',
 'FloatingPointError',
 'GeneratorExit',
 'IOError',
 'ImportError',
 'IndentationError',
 'IndexError',
 'KeyError',
 'KeyboardInterrupt',
 'LookupError',
 'MemoryError',
 'NameError',
 'None',
 'NotImplemented',
 'NotImplementedError',
 'OSError',
 'OverflowError',
 'ReferenceError',
 'RuntimeError',
 'StandardError',
 'StopIteration',
 'SyntaxError',
 'SystemError',
 'SystemExit',
 'TabError',
 'True',
 'TypeError',
 'UnboundLocalError',
 'UnicodeDecodeError',
 'UnicodeEncodeError',
 'UnicodeError',
 'UnicodeTranslateError',
 'ValueError',
 'ZeroDivisionError',
 '__IPYTHON__',
 '__debug__',
 '__doc__',
 '__import__',
 '__name__',
 '__package__',
 'abs',
 'all',
 'any',
 'apply',
 'basestring',
 'bin',
 'bool',
 'buffer',
 'bytearray',
 'bytes',
 'callable',
 'chr',
 'classmethod',
 'cmp',
 'coerce',
 'compile',
 'complex',

- 由于LEGB法则，Python最后将自动搜索这个模块，将会自动得到这个列表中所有变量名，也就是说，你能够使用这些变量名而不需要导入任何模块，因此，有两种方法引用一个内置函数：通过LEGB法则带来好处，或者手动导入\_\_builtin__模块

In [5]:
zip

<function zip>

In [6]:
import __builtin__
__builtin__.zip

<function zip>

- 由于LEGB的查找流程，会使它找到第一处变量名的地方生效，这样，在本地作用域的变量名可能会覆盖在全局作用域和内置作用域有着相同变量名的变量，而全局变量名有可能覆盖内置的变量名

In [7]:
# 内置的open函数就不会生效，但是Python对于这个问题并不会处理为警告信息
def hider():
    open = 'spam'
    open('data.txt')

- 由于名称True和False在Python2.6中是内置作用域中的变量而不是保留字，用诸如True=False的一条语句来重新为它们赋值就成为可能，不过，这条语句只是在它所出现的单个作用域中重新定义了单词True，所有其他的作用域仍然在内置作用域中查找其最初的定义

## global语句

- global语句是Python中唯一看起来有些像声明语句的语句，但是，它并不是一个类型或大小的声明，它是一个命名空间的声明，它告诉Python函数打算生成一个或多个全局变量名

- 我们对全局变量名做一个总结：全局变量是位于模块文件内部的顶层的变量名；全局变量如果是在函数内被赋值的话，必须经过声明；全局变量名在函数的内部不经过声明也可以被引用

- global允许我们修改一个模块文件的顶层的一个def之外的名称，nonlocal语句几乎和这一样，但它应用于嵌套的def的本地作用域内的名称，而不是嵌套的模块中的名称

- global语句包含了关键字global，其后跟着一个或多个由逗号分开的变量名，当在函数主体被赋值或引用时，所有列出来的变量名将被映射到整个模块的作用域内

In [8]:
X = 88
def func():
    global X
    X = 99
func()
print X

99


In [9]:
y, z = 1, 2
def all_global():
    global x
    x = y + z

## 最小化全局变量

- 在Python中使用多线程进行并行计算程序实际上是要依靠全局变量的，因为全局变量在并行线程中在不同的函数之间成为了共享内存，所以扮演了通信工具的角色

- 到目前为止，在不熟悉编程的情况下，最好尽可能地避免使用全局变量

## 其它访问全局变量的方法

- 以下两个函数的作用是等同的

In [10]:
# thismod.py
var = 99
def glob1():
    global var
    var += 1
def glob2():
    var = 0
    import thismod # import myself
    thismod.var += 1

## 作用域和嵌套函数

- 到现在为止，忽略了Python的作用域法则中的一部分（它在实际情景中很少见到），现在到了深入学习一下LEGB查找法则中E这个字母的时候了，E这一层是新内容（Python2.2增加的），它包括了任意嵌套函数内部的本地作用域

- 在默认情况下，一个赋值（X=value）创建或改变了变量名X的当前作用域；如果X在函数内部声明为全局变量，它将会创建或改变变量名X为整个模块的作用域；如果X在函数内声明为nonlocal，赋值会修改最近的嵌套函数的本地作用域中的名称X

In [11]:
X = 99
def f1():
    X = 88
    def f2():
        print X
    f2()
f1()

88


- 上面是一段合法的Python代码，def是一个简单的可执行语句，可以出现在任意其它语句能够出现的地方，包括嵌套在另一个def之中；f2是f1的本地作用域内的一个本地变量，是一个临时函数，仅在f1内部执行的过程中存在，只对f1中的代码可见

- 这种嵌套作用域查找在嵌套的函数已经返回后也是有效的，下面的例子中，f2的调用动作的运行是在f1运行后发生的，f2记住了在f1中嵌套作用域中的X，尽管f1已经不处于激活状态

In [12]:
def f1():
    X = 88
    def f2():
        print X
    return f2
action = f1()
action()

88


### 嵌套作用域和lambda

- 尽管对于def本身来说，嵌套作用域很少使用，但是当开始编写lambda表达式时，就要注意了；类比def语句，由于lambda是一个表达式，因此能够使用在def所不能使用的地方，例如列表或是字典中

In [13]:
def func():
    x = 4
    action = (lambda n: x ** n)
    return action
x = func()
print x(2)

16


- 由于lambda是表达式，所以它们自然而然地（或者更一般地）嵌套在了def中，因此，它们也就成为了后来在查找原则中增补嵌套函数作用域的最大受益者

### 作用域与带有循环变量的默认参数相比较

- 在已给出的法则中有个值得注意的案例：如果lambda或者def在函数中定义，嵌套在一个循环之中，并且嵌套的函数引用了一个上层作用域的变量，该变量被循环所改变，所有在这个循环中产生的函数将会有相同的值——在最后一次循环中完成时被引用变量的值

In [14]:
# 嵌套作用域中的变量在嵌套的函数被调用时才进行查找，所以它们记住的是同样的值（最后一次迭代中循环变量的值）
def makeActions():
    acts = []
    for i in range(5):
        acts.append(lambda x: i ** x)
    return acts
acts = makeActions()
print acts[0](2)
print acts[2](2)
print acts[4](2)

16
16
16


In [15]:
# 默认参数是在嵌套函数创建时评估的（而不是在其稍后调用时）
def makeActions():
    acts = []
    for i in range(5):
        acts.append(lambda x, i=i: i ** x) # 使用默认参数
    return acts
acts = makeActions()
print acts[0](2)
print acts[2](2)
print acts[4](2)

0
4
16


## nonlocal语句

- nonlocal允许对嵌套的函数作用域中的名称赋值，并且把这样的名称的作用域查找限制在嵌套的def；这只适用于Python3.0