# Function scope and closure
## I. scope
### I.1 基本概念
#### 1. scope和namespace
- **定义**：
  - 在python代码中使用name的时候，python在create, change,look up这个name的时候都是在对应的namespace中进行操作。<font color=blue>namespace就是python存放name的地方。</font>
  - name赋值的位置(assignment location)决定了name所在的namespace，也就决定了name的visibility scope
- **namespace的层次**：
  - 以module为界限，以function的定义为分层标准，代码结构被分成了不同的namespace layer
    - <font color=blue>**global**</font>：如果name赋值在所有的def 外面，则name是<font color=blue>**global**</font> to <font color=orange>**the entire file(module)**</font>
      - 所有的global都是相对于module而言的，指的是name定义在module的top-level，没有定义在module中的function里面。
      - 一个module file对应一个global scope
    - <font color=blue>**nonlocal**</font>：如果name定义在一个enclosing function对应的def里面，则name是<font color=blue>**nonlocal**</font> to <font color=orange>**nested functions**</font>
    - <font color=blue>**local**</font>：如果name的赋值是在function对应的def里面，则name是<font color=blue>**local**</font> to <font color=orange>**the function**</font>

#### 2. late binding
- **含义**：python为了支持dynamic typin而采用的一种变量赋值策略，也就是resolution of function, method calls and property accesses at runtime而不是compile time。也就是说，函数在运行时才会invoke，因此相应的变量才会根据当时的条件赋值。

In [1]:
class Animal:
    def speak(self):
        raise NotImplementedError("Subclasses should implement this method!")

class Dog(Animal):
    def speak(self):
        return "Woof!"

class Cat(Animal):
    def speak(self):
        return "Meow!"

def make_animal_speak(animal):
    print(animal.speak())

dog = Dog()
cat = Cat()

make_animal_speak(dog)  # speak method is resolved at runtime 
make_animal_speak(cat)  # based on the actual type of the object (Dog or Cat)

Woof!
Meow!


- **带来的问题**：late binding problem
  - <font color=red>这个问题特别容易在closure中出现</font>[closure定义见后文]
    - 因为closure中的nonlocal variable在所有nested function之间share，在同一时间点，所有nested function拿到的都是相同取值

In [2]:
# late binding problem
functions = []
for n in range(3):
    def func(x):
        return n * x
    functions.append(func)

results = [function(2) for function in functions]
print(results) 

[4, 4, 4]


In [3]:
# 解决方式:
# 直接把每次迭代时x的取值通过default value赋值，此时参数会先取走值，不用等函数call之后
functions = []
for n in range(3):
    def func(x, n=n):
        return n * x
    functions.append(func)

results = [function(2) for function in functions]
print(results) 

[0, 2, 4]


In [4]:
# 用lambda函数也有同样问题
functions = []
for n in range(3):
    functions.append(lambda x: n * x)

In [5]:
# 解决方式: 和前面一样
functions = []
for n in range(3):
    functions.append(lambda x, n=n: n * x)

results = [function(2) for function in functions]
print(results)

[0, 2, 4]


### I.2 the LEGB scope lookup rule
#### 1. 规则
- 使用name的规则是：按照四个层次从内向外找，使用找到的第一个name。如果都没有，报错。
- 这里要注意的是'E'层可能是多层嵌套，比如“函数中的函数中的函数”，那么前两个都属于'E'层。
<img src="pics/legb.png" style="width:60%;">

#### 2. 三种没有在LEGB rule中的特殊对象，他们的name规则可以视为LEGB的扩展
- **comprehension构造的临时变量**
   - 实例：<code>[expr(i) for i in iterable]</code>中的i。
   - 这个变量只在comprehension expression中有效，name reference明确。
- **exception handler的try block中使用的临时变量**
   - 该变量只在try block中有效，name reference明确。
```python
try:
    x = 5//0      # 这里的x
except ZeroDivisionError:
    print("Can't divide by zero")
   ```
- **class中定义的name**
   - class可以视为function，class和def一样会创建一个local scope(for names assigned inside the top level of it).所以可以将class中的name视为LEGB中'L'层的name。
   - 但是和function有所不同：
     - function会在每次被call的时候创建一套local name，但class不会这样。
     - 每次call class会新建一个instance，它会继承class中命名(也即赋值)的names。而LEGB规则这时候就会用来处理class中top-level的name和class中定义的method function中的name。[待详述]

## II. global names

### II.1 基本特征
- **功能**：是程序之间shared state information的方式。相比使用class和nested scope closure，global name是最简单的方法。
  - 一个很常见的用途是在用多线程处理并行执行的程序时，经常用global names作为shared memory between functions running in parallel threads。承担了communication device的角色。
- <font color=blue>**scope resolve规则：**</font>
  1. <font color=red>如果函数中要要给global name赋值，那么必须先声明namespace，后赋值。</font>
     - <font color=green>python的variable不需要声明类型，但是有一种声明，就是声明namespace</font>
  2. 如果函数中只是reference name，不赋值，在没有命名冲突的条件下，可以不声明直接使用。
     - 按照LEGB四层结构从内向外找各层namespace中的name，只要local和enclosing function层没有同名name，就可以找到global name。

In [6]:
## global name的常规用法
EXP_POW = 3
def foo(x):
    global EXP_POW        # 只能declare，不能赋值
    EXP_POW += 1          # 如果要改变值，需要declare后重赋值
    return x ** EXP_POW
foo(2), EXP_POW

(16, 4)

In [7]:
## 如果没有同名冲突，name可以定位到global name的话，使用global name可以不声明
# 但是最好不要这样，标记global name可以让代码有更好的可读性，不容易出错
Height_CAP = 250
Height_FLOOR = 80

def delete_outlier(x):
    normal_x = [i for i in x if Height_FLOOR < i < Height_CAP]
    return normal_x
x = [96, 300, 50, 128, 168]
delete_outlier(x)

[96, 128, 168]

- <font color=blue>**注意代码习惯：**</font>
  - 很多程序会有一个单独的module来放所有的global names。
  - 使用global最好加上declare。这样可以增加可读性。
  - 除非global变量本身的功能需求，否则不要轻易改变global的值。在局部位置改变global可能会影响别的位置的程序，引起混乱。<font color=red>一定不要跨module直接assignment new value改变别的module中的global name取值。</font>因为其他import该module的代码根本没法知道那个值已经改变了。
    - <font color=green>**最好各个module管理自己定义的names。**</font>
    - 如果功能上需要改变，就在定义global name的那个module里面定义一个function，专门负责设置该global name的value。这样别的程序员在看该module内容的时候看到有这么一个function，就能知道这个值可能被别的代码改过。

In [8]:
## 改变global name取值的正确方式
#  - 在imported module中，为可能改变取值的global name设置专门function
CHANGABLE_X = 100

def setX(new_v):           # 用这个函数来设置相应的name值
    global CHANGABLE_X
    CHANGABLE_X = new_v

## III. nonlocal names and closure
### III.1 基本特征
- **功能**：<font color=green>保存函数state信息，实现函数之间的communication。</font>
- **scope resolve规则**：
  - 和global name一样，nonlocal name如果只是用于name reference，也可以不声明。python会只在enclosing function中找name，用从内向外遇到的第一个该name的值。
  - 如果是name assignment，就必须先声明后使用。当E的各层中有这个name，那么就assign最近的那个。如果enclosing function的各层中没有这个name，会报错。<font color=red>这点和global name不同，如果nonlocal names在enclosing function中不存在，不能通过"先声明，再赋值"的方式在nest function scope中新建nonlocal name</font>

In [9]:
x = 'global_x'
def f1():                    # 外面这个是enclosing function
    x = 'nonlocal_x'
    def f2():                # 运行call f1才会生成name f2，refer到函数对象，f2只在f1内可见
        nonlocal x
        x *= 2
        print(x)
    f2()
f1()

nonlocal_xnonlocal_x


### III.2 工作原理：利用closure中变量存储机制实现跨函数通信
#### 1. python实现nonlocal variable reference的方式：构造closure
- **什么是closure**：<font color=green>nested function和一个容纳了nonlocal variable的extended scope一起构成了closure。</font>
  - 这里的extended scope不是外层function的enclosing scope，因为当外层function运行结束返回nested function时，它对应的enclosing scope也就随之消失了。
- **为什么要有closure**：
  - 当函数返回值是nested function时，如果nested function中使用了(refer或者assign)enclosing scope中的变量对象，那么需要在外层函数退出，从而function scope消失后保留原本属于其scope的变量。
  - 这个变量不能是nested function的local variable，因为在python的function call规则中，每次call function都会建立新的local scope，不同call的scope互不相关。而这里的nonlocal variable的目的本来就是要实现function之间的通信，所以local variable实现不了。
  - <font color=green>python的处理方式是：closure</font>

In [10]:
# nonlocal variable保留了每次nested function call后的信息变化，实现了function communication
def make_counter():
    count = 0
    def counter():
        nonlocal count
        count += 1
        return count
    return counter

counter_1 = make_counter()
print(counter_1())
print(counter_1()) # 两次call nested function后nonlocal variable的值在累加

1
2


#### 2. closure的工作方式
- python中定义的function都有一个<code>\_\_closure__</code> attribute。
  - <font color=orange>用<code>dir(func_name)</code>可以查看。</font>
- 在用def statement定义函数后，<font color=green>**每次**</font>call函数时，如果函数定义中有nested function和nonlocal variable，则python会对应每个nonlocal variable新建一个<font color=blue>**cell类型的object**</font>。再将他们合并装到一个tuple中，并将该tuple object赋值给returned nested function的<code>\_\_closure__</code> attribute。
  - <font color=orange>可以用<code>nested_func.\_\_closure__</code>来查看cell。</font>
  - cell的作用只有一个，就是作为link来让外层function和nested function都能refer到所有的nonlocal variables。
- 当外层function执行完毕退出后，它的local scope消失，但是nested function还能通过<code>\_\_closure__</code> attribute中的cell object来link到nonlocal variable。
  - 这时候的nested function和一般的function不同的地方在于，除了function本身，它的<code>\_\_closure__</code> attribute值不为None，而是tuple of cell object，因此他们可以link到的nonlocal variable.
  - <font color=deeppink>**这个<code>\_\_closure__</code> attribute值不为None的returned nested function就是closure。** 如果将cell object视为存放了nonlocal variable的environment（因为它存放了nonlocal variable的address信息），那么可以将closure理解为function+environment这一整体。</font>
- <font color=blue>之后每次call returned nested function，他们都共享同一个<code>\_\_closure__</code> attribute（也就是同一个tuple of cell object），从而实现了nonlocal variable的共享。</font>

In [11]:
def outer(x, y):
    def inner():
        return x, y
    return inner

f = outer(10, 'hello')                  
print(type(f))                 # f是函数对象
print(len(f.__closure__), type(f.__closure__[0]))  # closure属性赋值为tuple of cells
print(f.__closure__[0])        # 每个cell refer到1个nonlocal object  
print(f.__code__.co_freevars)  # 在closure属性中可以查看nonlocal variables的name

<class 'function'>
2 <class 'cell'>
<cell at 0x771b13cbb8e0: int object at 0x771b16e64210>
('x', 'y')


In [12]:
## 没有nested function时，__closure__的值是None
## 有nested function但没有nonlocal name时，__closure__的值也是None
def foo(x):
    y = x ** 2
    return y

def outer(x, y):
    def inner():
        return 10
    return inner

b = lambda x: x if x>0 else -x  # lambda函数的规则也一样

print(foo.__closure__, outer.__closure__, b.__closure__)

None None None


### III.3 典型应用
#### 1. 将closure中的nonlocal variable做为函数通信方式
- 特点：所有nested functions可以通过shared nonlocal variable来<font color=green>**分享状态，完成协作**</font>。
  1. 多个nested function共享同样的nonlocal variables
  2. 这些函数都可以读取和修改nonlocal variables的值
  3. 在这些函数使用了nonlocal variable之后，state的变化会被保留下来，所以函数共享新值

In [13]:
def create_bank_account(initial_balance):
    balance = initial_balance
    transaction_history = [] 
    
    def deposit(amount):
        nonlocal balance
        balance += amount
        transaction_history.append(f"Deposit: +${amount}")
        return f"Deposited ${amount}. New balance: ${balance}"
    
    def withdraw(amount):
        nonlocal balance
        if amount > balance:
            return "Insufficient funds"
        balance -= amount
        transaction_history.append(f"Withdrawal: -${amount}")
        return f"Withdrew ${amount}. New balance: ${balance}"
    
    def get_balance():
        return f"Current balance: ${balance}"
    
    # Return dictionary of functions that share the same closure
    return {
        "deposit": deposit,
        "withdraw": withdraw,
        "balance": get_balance
    }

# Usage example:
account_sam = create_bank_account(1000)

# These functions all share and modify the same nonlocal variables
print(account_sam["balance"]())      # Current balance: $1000
print(account_sam["deposit"](500))   # Deposited $500. New balance: $1500
print(account_sam["withdraw"](200))  # Withdrew $200. New balance: $1300
print(account_sam["withdraw"](2000)) # Insufficient funds
print(account_sam["balance"]())      # Current balance: $1300

Current balance: $1000
Deposited $500. New balance: $1500
Withdrew $200. New balance: $1300
Insufficient funds
Current balance: $1300


- share信息的方式
  1. 凡是有nonlocal variable的nested function都会构建对应的closure
  2. 不同的nested function可以按需使用不同的nonlocal variable
  3. 如果他们用了相同的nonlocal variable，那么他们的closure attribute会用同一个cell object，从而实现share and coordinate
     - 下面cell object的地址相同可以看出来

In [14]:
print("deposit closure:", account_sam["deposit"].__closure__)
print("deposit free vars:", account_sam["deposit"].__code__.co_freevars)

print("\nget_balance closure:", account_sam["balance"].__closure__)
print("get_balance free vars:", account_sam["balance"].__code__.co_freevars)

deposit closure: (<cell at 0x771b13cbb310: int object at 0x771b13e454b0>, <cell at 0x771b13cba890: list object at 0x771b13cc23c0>)
deposit free vars: ('balance', 'transaction_history')

get_balance closure: (<cell at 0x771b13cbb310: int object at 0x771b13e454b0>,)
get_balance free vars: ('balance',)


#### 2. 将closure作为function factory，nonlocal variable作为被生成函数的配置参数
- 特征：
  1. 此时使用nonlocal variable的方式是reference，而不会去做assignment。因为 这里closure的功能不是share information，而是作为配置信息用于nested function的功能设定
  2. 非常适用于创建families of related functions，每个function的行为在创建的时候就设定下来

- 简单的例子：具有不同参数的乘法计算器

In [15]:
def create_multiplier(factor):
    def multiplier(x):
        return x * factor
    return multiplier

# Create different multiplier functions
double = create_multiplier(2)
triple = create_multiplier(3)
times_ten = create_multiplier(10)

# Each function has its own closure with different 'factor' values
print(double(5))    # 10
print(triple(5))    # 15
print(times_ten(5)) # 50

# We can inspect their closures
print(double.__closure__[0].cell_contents)    # 2
print(triple.__closure__[0].cell_contents)    # 3
print(times_ten.__closure__[0].cell_contents) # 10

10
15
50
2
3
10


- 复杂的例子：creating customized formatters for different types of data

In [16]:
def create_formatter(prefix="", suffix="", separator="", precision=2):
    def format_list(data):
        # Format numbers based on closure variables
        formatted = []
        for item in data:
            if isinstance(item, (int, float)):
                formatted.append(f"{item:.{precision}f}")
            else:
                formatted.append(str(item))
                
        # Apply prefix, suffix, and separator from closure
        result = separator.join(formatted)
        if prefix:
            result = f"{prefix}{result}"
        if suffix:
            result = f"{result}{suffix}"
        return result
    
    return format_list

# Create different formatters
price_formatter = create_formatter(prefix="$", precision=2)
percentage_formatter = create_formatter(suffix="%", precision=1)
comma_list_formatter = create_formatter(separator=", ", precision=0)
bullet_list_formatter = create_formatter(prefix="• ", separator="\n• ", precision=1)

# Test data
numbers = [10.5555, 20.7777, 30.1111]

print("Prices:", price_formatter(numbers))
# $10.56, $20.78, $30.11

print("Percentages:", percentage_formatter(numbers))
# 10.6%, 20.8%, 30.1%

print("Comma List:", comma_list_formatter(numbers))
# 11, 21, 30

print("Bullet List:")
print(bullet_list_formatter(numbers))
# • 10.6, 20.8, 30.1

# We can inspect each formatter's closure
for name, formatter in [
    ("price_formatter", price_formatter),
    ("percentage_formatter", percentage_formatter),
    ("comma_list_formatter", comma_list_formatter),
    ("bullet_list_formatter", bullet_list_formatter)
]:
    print(f"\n{name} closure variables:")
    for i, var in enumerate(formatter.__code__.co_freevars):
        print(f"{var}: {formatter.__closure__[i].cell_contents}")

Prices: $10.5620.7830.11
Percentages: 10.620.830.1%
Comma List: 11, 21, 30
Bullet List:
• 10.6
• 20.8
• 30.1

price_formatter closure variables:
precision: 2
prefix: $
separator: 
suffix: 

percentage_formatter closure variables:
precision: 1
prefix: 
separator: 
suffix: %

comma_list_formatter closure variables:
precision: 0
prefix: 
separator: , 
suffix: 

bullet_list_formatter closure variables:
precision: 1
prefix: • 
separator: 
• 
suffix: 


#### 3. 要特别注意loop中的late binding problem
- 严格说这里没有closure，但for loop构造了一个enclosing scope，此时如果有nested function refer到了这个enclosing scope中的变量的话，这种情况就很像closure。<font color=red>所以经常看到说late binding problem跟closure有关，实际上讲的是loop场景</font>

In [17]:
functions = []
for num in range(3):      # 
    def my_function(x):
        return x ** num
    functions.append(my_function)

results = [function(3) for function in functions]
print(results)

[9, 9, 9]


In [18]:
# 解决方式：用function factory生成不同closure的nested function
def make_function(num):
    def my_function(x):
        return x ** num
    return my_function

# 返回的3个nested func并没有share cell
# 关键点是在于，nested function用的变量正好是外层函数的参数
# 每次外层变量被call，就新建了一套enclosing scope
functions = [make_function(number) for number in range(3)] 
results = [function(3) for function in functions]
print(results)

[1, 3, 9]


## IV. lambda
### IV.1 lambda函数应用一般规则：和普通function一样
- lambda 的scope rule，global variable和nonlocal variable的scope resolve方式和一般函数都一样
- 有一点区别是，lambda通常只会refer global和nonlocal variable，而不会modity他们。因为modify要做namespace声明，而lambda只有一条expression，没法在单行里面既做namespace声明，又做运算。

In [19]:
# 两种等价形式
def create_multiplier(factor):
    def multiplier(x):
        return x * factor
    return multiplier

def lambda_multiplier(factor):
    return lambda x: x * factor

### IV.2 lambda函数应用要注意：late binding problem
#### 1. 用于for loop或者comprehension中要注意late binding带来的计算问题

In [20]:
foos = []
for x in range(3):
    foos.append(lambda y: x * y)

# 问题：x的取值没有随for loop改变
foos[0](2), foos[1](2), foos[2](2) 

(4, 4, 4)

- **late binding**：函数定义的时候并不会bind函数体中定义的变量值，只有被call了之后，函数体中定义的变量才会bind到具体的value object上。
- 当lambda作为返回值时，其函数在返回时没有被call，所以函数体中的变量不取值
- 上例中，等到lambda函数被call了之后，他们才会取值，这时候取到的是x的当前值'2'，所以三个函数得到的计算结果一样