## 함수, 변수의 스코프(효력 범위/공간), 이름공간(Name Space)   

리멤버 : 파이썬에서 어떤 변수를 만드려면(정의함은) `'변수명 = 값'` 와 같이 `=` 의 오른 쪽 값에 왼쪽의 변수 이름(name, identifier)를 할당하는 형태로 한다 :      
>`x = 3`     
`y = 2*x - 4`    
`x, y, z = 32, 2, 3*x`   
`w = z`

#### 변수 스코프 맛보기 :

In [1]:
a = 0                  # a는 전역 변수 
def my_func():
    print(a)           
    
my_func()

0


In [2]:
a = 0                  # a는 전역 변수 
def my_func():
    a = 12             # 여기서의 a는 my_func의 지역 변수 
    print(a)           
    
my_func()
print(a)

12
0


In [3]:
a = 0
def my_func():
    print(a)         # 에러.  왜 이런 일이? 
    a = a + 1        #  a를 지역 변수로 정의. 이 위치에서 a를 지역변수로 정의한 것이 윗 줄에 영향을 주나?    
    
my_func()

UnboundLocalError: local variable 'a' referenced before assignment

***(기억할 것 : 함수내에서 지역변수는 함수 내 어디에서 정의가 되었던지 함수내 모든 곳에서 효력 (지역변수의 이름 공간은 그 함수 전체 공간). 따라서, 함수내에서 같은 이름의 지역 변수와 전역 변수를 함께 사용할 생각하면 안됨)***

In [4]:
a = 0
def my_func():
    print(a)          # 왜 이것은 괜찮지?  
    b = a + 1         # 전역 변수 a를 사용(참조)하기만 했고, 같은 이름의 지역변수 a를 만들지 않았기에     
    print(b)
    
my_func()

0
1


In [5]:
a = 0
def my_func():
    global a    # 'a' 라는 이름의 전역변수 만들 것이라고 
    print(a)
    a = a + 3   # 여기서 왼쪽의 a는 지역변수가 아니라 전역변수 a 
    print(a)
    
my_func()
a

0
3


3

## 파이썬 함수 복습 
- [점프 투 파이썬](https://wikidocs.net/24)
- [파이썬 공식 자습서](https://docs.python.org/ko/3.7/tutorial/controlflow.html#defining-functions)
- https://python-textbok.readthedocs.io/en/1.0/Functions.html
- [파이썬 함수 활용의 다양한 면모 (데코레이터 등)](https://realpython.com/courses/python-decorators-101/)


#### 입력값이 몇 개가 될지 모를 때는 어떻게 해야 할까?

In [6]:
def add_all(*args):
    print("type of args : ", type(args))
    print(args)
    sum = 0
    for i in args:
        sum += i
    return sum

print( add_all(1,3,5,7) )        

type of args :  <class 'tuple'>
(1, 3, 5, 7)
16


In [7]:
def sum_mean(op, *args):
    sum = 0
    for i in args:
        sum += i

    if op == 'sum' :
        return sum
    elif op == 'mean' :
        return (sum / len(args) )

print( sum_mean('mean', 1,3,5,7) )

4.0


(주의) `def sum_mean(op, *args)` 형태는 안됨 

#### 키워드 파라미터 `**kwargs`
#### 패턴 : `함수명(일반_패러미터, 초기값_설정_패러미터=32, *args, **kwargs)`

In [8]:
def func(op, a, b, c, d=0, *args, **kwargs) :
        print(op)
        print(a)
        print(b)
        print(c)
        print(d)
        print(args)
        # print(args[0])
        print(kwargs)
        
func('sum', 1, 2, 4, 5, 'a', 'b', 32, xx=3, zz='what')
print()
func('sum', 1, 2, 4, 'a', 'b', 32, xx=3, zz='what')
print()
func('sum', 1, 2, 4, xx=3, zz='what')

sum
1
2
4
5
('a', 'b', 32)
{'xx': 3, 'zz': 'what'}

sum
1
2
4
a
('b', 32)
{'xx': 3, 'zz': 'what'}

sum
1
2
4
0
()
{'xx': 3, 'zz': 'what'}


------------------------------
### 파이썬 변수, 함수, 클래스, 객체의 Name Space 및 Scoping 규칙 : 
- 프로그래밍을 하다 보면 변수, 함수, 클래스, 객체들을 무수히 만들게 된다. 이런 것들은 이름을 갖게 된다 이름들은 객체들을 가르키는(reference 하는) 것임을 기억.   
- 가령, 우리나라에 `김철수` 라는 사람이 100명 있다고 하자. 이 백 명의 김철수들은 모두 고유의 객체(사람)들이다. 
- 파이썬 프로그래밍은 객체들이 일을 하는 것이지 객체 이름이 일을 하는 것이 아님.  변수 이름 또는 함수들의 `이름` 들은 이런 객체를 쉽게 부르기 위함이다. 마치 사람들이 이름이 있듯이. 사람 세상에서도 동명 이인은 가끔씩 문제를 일으킨다.  ('김철수'가 바로 내가 아는 그 김철수 맞나??? ) 
- 파이썬 프로그램에서 100개의 객체가 "김철수" 라는 이름을 쓴다고 생각해 보자.  100개 중 어떤 것은 정수 객체이고, 또 어떤 것은 "사람" 타입 객체일 수도 있다.  이름만 갖고 이 이름이 어떤 객체를 가르키는 지 모르게 됨.  혼자 프로그램 짜도 혼동되는데 여러명이 프로그램 짜면 100% 이런 `이름 충돌 (name clashing/collision)` 문제가 생김.  이렇게 되면 프로그램 안됨.    
- 그래서 프로그래밍언어에서는 `네임스페이스`라는 개념을 도입하여, 특정한 하나의 이름이 효력을 미치는 범위를 제한. 어떤 함수내에서 정의된 이름은 바로 그 함수 내에서만 효력이 있고, 함수 밖에서 정의한 이름은 모듈 내 전체에서 효력을 지니고.  이렇게 하여 같은 이름이라도 그 이름이 소속된 `네임스페이스`가 다르면 다른 객체를 가르키는 것이 가능하여 충돌을 막도록 한다.  
   
#### - 다시 상기 : 파이썬에서 변수를 정의함은 변수를 생성함이고 이는 `'='` 을 이용해 오른 쪽의 객체에 왼쪽의 이름을 할당하면서 이루어진다. 

- *즉, 이름의 `scope`를 지원하기 위해 `네임스페이스`가 필요하다.*   
- **** 파이썬은 `lexical scoping` : 어떤 변수의 scope는 그 변수의 프로그램내 위치에 따라 결정됨 ****
     
    
- 파이썬도 `네임스페이스` 구조를 사용하여 함수, 클래스, 모듈에서 사용한 이름이 서로 간섭하지 않게하여 이름 충돌에 따른 혼란을 피하게 한다.   
- 파이썬 프로그램이 돌다가 어떤 이름이 나올 때 그 이름이 가르키는 객체가 무엇이지 찾을 때 (즉, 이름의 ***scope***) 보는 공간의 범위가 `네임스페이스`.  어떤 객체의 `네임스페이스`는 하나가 아니라 layer들로 중첩된 구조.  가장 가까운 공간에서 우선 찾아 보고, 없으면 한 단계 확장된 공간에서, 없으면 더 확장된 공간에서 ...
- 현실세계에서도 `네임스페이스` 개념은 널리 쓰인다.  주소체계가 그 중 하나다.  우리나라에 "용수리" 가 모두 13 곳이 있다 (https://ko.wikipedia.org/wiki/%EC%9A%A9%EC%88%98%EB%A6%AC). "용수리에 갔다 왔어" 할 때 어떤 용수리를 말하는 것일까?  그 것은 그 말을 하는 사람이 암묵적으로 아는 "용수리"라는 이름의 `네임스페이스`에 달렸다. 그 사람이 부산 사람이면 부산의 용수리일 가능성이 많고...  프로그램에서 이렇게 암묵적으로 이름 활용이 되어서는 안된다.  물론  "부산광역시 기장군 정관읍 용수리", "경기도 광주시 초월읍 용수리" 같이 주소 전체를 쓰면 혼란이 없겠지만 이래서는 이름이 길어지고 하는 등의 문제가 있다. 따라서 프로그래밍 언어에서는 `"확실한 규칙"`을 만들어 특정 이름이 나오는 위치에 따라 그 이름이 효력을 갖는 범위를 명확히 하여 이름 충돌을 피하도록 한다. 
    
     
- Just about everything related to names, including scope classification, happens at `assignment time` in Python. As we’ve seen, names in Python spring into existence when
they are first assigned values, and they must be assigned before they are used. Because
names are not declared ahead of time, Python uses the `location of the assignment` of a
name to associate it with (i.e., bind it to) a particular namespace. In other words, the
place where you assign a name in your source code determines the namespace it will
live in, and hence its scope of visibility.


#### 파이선의 네임스페이스는 크게 세 가지로 분류된다.

    1. 전역(global) 네임 스페이스 : 모듈별로 존재하며, 모듈 전체에 통용되는 이름을 사용한다 
      - (`globals()` 로 확인 )
    2. 지역(local) 네임 스페이스 : 함수 및 메소드 별로 존재하며, 함수 내의 지역 변수들이 소속된다 
      - (`locals()` 로 확인)
    3. 빌트인(built-in) 네임 스페이스 : 기본 내장 함수 및 기본 예외들의 이름을 저장하는 곳



### 스코우프 설정 규칙 
- Each module is a global scope — that is, a namespace in which variables created (assigned) at the top level of the module file live.
- The global scope spans a single file only. 파이썬에서 어떤 변수의 스코우프가 `global`이라 함은 그 변수가 정의된 해당 파일(모듈)에서만 통한다는 것을 명심.  파이썬에는 프로그램 전체에 걸쳐 통하는 진짜 `전역` 이름은 없다.   
- By default, any names assigned inside a function definition are put in the local scope. 함수내에서 정의된 (즉, `=`의 왼쪽에 있는 이름) 그 어떤 이름도 기본적으로 그 함수내에서만 통하는 local scope (즉 함수내에서 정의된 모든 변수명과 argument명은 물론이고, `import`된 모듈명, 함수내에서 `def`로 만든 inner 함수명 등도 모두 local scope). 
- 함수내에서 정의된 이름이 아닌 다른 모든 이름은 global이던가 또는 파이썬이 기본적으로 제공하는 `built-ins` 스코우프  
- https://www.oreilly.com/library/view/learning-python/1565924649/ch04s03.html

### 이름의 참조 순서 (이름을 만드는 것이 아니라,  즉 `'='` 의 오른쪽에 이름이 있을 경우)  : 
1. 이름이 위치한 현재 함수의 네임스페이스에서 로컬 변수 이름을 찾는다.  만약 있으면 그 것을 사용
2. 없으면, 바로 상위 레이어의 네임스페이스에서 이름을 찾는다.  즉, 만약 이름이 중첩된 함수에 있었다면 그 함수를 감싸고 있는 바로 위 함수의 네임스페이스에서 찾는다. 만약 있으면 그 것을 사용 
3. 이런 식으로 이름을 찾을 때까지 하나 하나 상위 레이어의 네임스페이스를 찾음.
4. 결국에는 모듈의 global namespace에 까지 가게된다.  만약 여기서도 없으면 built-in 네임스페이스에서 이름을 찾는다.  여기에서도 없으면 `NameError` 발생 

###  좋은 프로그래밍 
- 전역변수는 가능한 사용 안하기.  만약 꼭 필요하면 한군데 모아 사용하기.  
- 함수 안에서 전역변수를 직접 참조 않기.  직접 전역 변수 참조하지 않고, 인자값으로 받아 사용하자.  
- 함수 안에서 전역변수 값 직접 변경 않기.  `global` 이 없다고 생각하자.  함수가 전역 변수를 업데이트하게 하고 싶으면 함수의 리턴값으로 받아 하자.  참고로 파이썬의 리턴은 tuple이고 그 안에 온 갖 것을 집어 넣어 리턴할 수 있다. 


#### (주의) : 함수내에서 전달받은 mutable 객체의  *in-place* 변환은 이름의 local scope 룰에 적용되지 않음

In [13]:
lst1 = ['a', 'b', 'c']
lst2 = [1, 2, 3]
print(id(lst1))
print(id(lst2))
         
def func() :
    lst1 = lst2       # lst1은 이 때 지역 변수.  lst1이 오른쪽의 전역변수 lst2가 참조하는 것과 같은 것을 가르킴   
    print(id(lst1), "  ", lst1)
    lst1 = lst1 + ['d', 'f']    # 새로운 리스트가 만들어지고, 이 새로운 리스트를 지역변수 lst1이 가르킴 
    print(id(lst1), "  ", lst1)
    # local space의 내용을 보려면 (딕셔너리로 됨) : 
    print("Identifiers and its values in local name space : ", locals())  #
    
func()

77815624
77816840
77816840    [1, 2, 3]
88794696    [1, 2, 3, 'd', 'f']
Identifiers and its values in local name space :  {'lst1': [1, 2, 3, 'd', 'f']}


In [14]:
print("global variable 'lst1' : ", lst1)   # 전역변수 lst1은 그대로 임 

global variable 'lst1' :  ['a', 'b', 'c']


In [15]:
lst1 = ['a', 'b', 'c']
lst2 = [1, 2, 3]
print(id(lst1))
print(id(lst2))
         
def func() :
    lst2.extend(('d', 'f')) # 함수 내에서 lst2를 직접 (in-place) 변환. lst2 변수가 새로 생긴 것 아님 
    print(id(lst2), "  ", lst2)
    print("locals : ", locals())   # local namespace에 변수가 없음 
    
func()

78414472
88557384
88557384    [1, 2, 3, 'd', 'f']
locals :  {}


#### Name Space는 딕셔너리로 만들어져 있음을 알 수 있다.

In [16]:
locals()   # 이 것은 현재 지역 네임스페이스, 즉 파이썬 인터액티브 모듈의 top-level의 name space

{'__name__': '__main__',
 '__doc__': 'Automatically created module for IPython interactive environment',
 '__package__': None,
 '__loader__': None,
 '__spec__': None,
 '__builtin__': <module 'builtins' (built-in)>,
 '__builtins__': <module 'builtins' (built-in)>,
 '_ih': ['',
  'a = 0                  # a는 전역 변수 \ndef my_func():\n    print(a)           \n    \nmy_func()',
  'a = 0                  # a는 전역 변수 \ndef my_func():\n    a = 12             # 여기서의 a는 my_func의 지역 변수 \n    print(a)           \n    \nmy_func()\nprint(a)',
  'a = 0\ndef my_func():\n    print(a)         # 에러.  왜 이런 일이? \n    a = a + 1        #  a를 지역 변수로 정의. 여기서 a를 지역변수로 정의한 것이 윗 줄에 영향을 주나?    \n    \nmy_func()',
  'a = 0\ndef my_func():\n    print(a)          # 왜 이것은 괜찮지?  \n    b = a + 1         # 전역 변수 a를 사용(참조)하기만 했고, 같은 이름의 지역변수 a를 만들지 않았기에     \n    print(b)\n    \nmy_func()',
  "a = 0\ndef my_func():\n    global a    # 'a' 라는 이름의 전역변수 만들 것이라고 \n    print(a)\n    a = a + 3   # 여기서 왼쪽의 a는 지역변수가 아니라 전역변수 a \n   

In [17]:
if __name__ == "__main__" :   
    print('OK. It is not imported')

OK. It is not imported


In [18]:
print(__doc__)

Automatically created module for IPython interactive environment


In [19]:
import pandas
pandas.__name__       

'pandas'

pandas 모듈을 import할 때 (즉, pandas 모듈이 실행될 떄) 파이썬이 자동적으로 pandas 네임스페이스에  `__name__` 이라는 global 변수 (즉, 모듈 레벨 변수)를 만들고 이 값을 `pandas` 로 함 

In [20]:
print(pandas.__doc__)


pandas - a powerful data analysis and manipulation library for Python

**pandas** is a Python package providing fast, flexible, and expressive data
structures designed to make working with "relational" or "labeled" data both
easy and intuitive. It aims to be the fundamental high-level building block for
doing practical, **real world** data analysis in Python. Additionally, it has
the broader goal of becoming **the most powerful and flexible open source data
analysis / manipulation tool available in any language**. It is already well on
its way toward this goal.

Main Features
-------------
Here are just a few of the things that pandas does well:

  - Easy handling of missing data in floating point as well as non-floating
    point data.
  - Size mutability: columns can be inserted and deleted from DataFrame and
    higher dimensional objects
  - Automatic and explicit data alignment: objects can be explicitly aligned
    to a set of labels, or the user can simply ignore the labels and

다음 시간에 `__xx__` 형태의 특별한 identifier와 함수들을 봄 

-----------------------------------------------------

### [Sebastian Raschka](http://www.sebastianraschka.com)  의 간단한 예
####   `A beginner's guide to Python's namespaces, scope resolution, and the LEGB rule`

- [Link to the containing GitHub Repository](https://github.com/rasbt/python_reference)
- [Link to this IPython Notebook on GitHub](https://github.com/rasbt/python_reference/blob/master/tutorials/scope_resolution_legb_rule.ipynb)


This is a short tutorial about Python's namespaces and the scope resolution for variable names using the LEGB-rule. The following sections will provide short example code blocks that should illustrate the problem followed by short explanations. You can simply read this tutorial from start to end, but I'd like to encourage you to execute the code snippets - you can either copy & paste them, or for your convenience, simply [download this IPython notebook](https://raw.githubusercontent.com/rasbt/python_reference/master/tutorials/scope_resolution_legb_rule.ipynb).

## Sections  



- [Introduction to namespaces and scopes](#introduction)  
- [1. LG - Local and Global scopes](#section_1)  
- [2. LEG - Local, Enclosed, and Global scope](#section_2)  
- [3. LEGB - Local, Enclosed, Global, Built-in](#section_3)  
- [Self-assessment exercise](#assessment)
- [Conclusion](#conclusion)  
- [Solutions](#solutions)
- [Warning: For-loop variables "leaking" into the global namespace](#for_loop)

## Objectives
- Namespaces and scopes - where does Python look for variable names?
- Can we define/reuse variable names for multiple objects at the same time?
- In which order does Python search different namespaces for variable names?

## Introduction to namespaces and scopes

### Namespaces

Roughly speaking, namespaces are just containers for `mapping names to objects`. As you might have already heard, everything in Python - literals, lists, dictionaries, functions, classes, etc. - is an object.  
Such a "name-to-object" mapping allows us to access an object by a name that we've assigned to it. E.g., if we make a simple string assignment via `a_string = "Hello string"`, we created a reference to the `"Hello string"` object, and henceforth we can access via its variable name `a_string`.

We can picture a namespace as a Python dictionary structure, where the dictionary keys represent the names and the dictionary values the object itself (and this is also how namespaces are currently implemented in Python), e.g., 

<pre>a_namespace = {'name_a':object_1, 'name_b':object_2, ...}</pre>  




Now, the tricky part is that we have multiple independent namespaces in Python, and *names can be reused* for different namespaces (only the objects are unique, for example:

<pre>a_namespace = {'name_a':object_1, 'name_b':object_2, ...}
b_namespace = {'name_a':object_3, 'name_b':object_4, ...}</pre>

For example, everytime we call a `for-loop` or define a function, it will create its own namespace. Namespaces also have different levels of hierarchy (the so-called "scope"), which we will discuss in more detail in the next section.

### Scope

In the section above, we have learned that namespaces can exist independently from each other and that they are structured in a certain hierarchy, which brings us to the concept of "scope". The "scope" in Python defines the "hierarchy level" in which we search namespaces for certain "name-to-object" mappings.  
For example, let us consider the following code:

In [21]:
i = 1

def foo():
    i = 5
    print(i, 'in foo()')

print(i, 'global')

foo()

1 global
5 in foo()


Here, we just defined the variable name `i` twice, once on the `foo` function.

- `foo_namespace = {'i':object_3, ...}`  
- `global_namespace = {'i':object_1, 'name_b':object_2, ...}`

So, how does Python know which namespace it has to search if we want to print the value of the variable `i`? This is where Python's LEGB-rule comes into play, which we will discuss in the next section.

### Tip:
If we want to print out the dictionary mapping of the global and local variables, we can use the
the functions `globals()` and `locals()`

In [22]:
#print(globals()) # prints global namespace
#print(locals()) # prints local namespace

glob = 1

def foo():
    loc = 5
    print('loc in foo():', 'loc' in locals())

foo()
print('loc in global:', 'loc' in globals())    
print('glob in global:', 'foo' in globals())

loc in foo(): True
loc in global: False
glob in global: True


### Scope resolution for variable names via the LEGB rule.

We have seen that multiple namespaces can exist independently from each other and that they can contain the same variable names on different hierachy levels. The "scope" defines on which hierarchy level Python searches for a particular "variable name" for its associated object. Now, the next question is: "In which order does Python search the different levels of namespaces before it finds the name-to-object' mapping?"  
To answer is: It uses the LEGB-rule, which stands for

**Local -> Enclosed -> Global -> Built-in**, 

where the arrows should denote the direction of the namespace-hierarchy search order.  

- *Local* can be inside a function or class method, for example.  
- *Enclosed* can be its `enclosing` function, e.g., if a function is wrapped inside another function.  
- *Global* refers to the uppermost level of the executing script itself, and  
- *Built-in* are special names that Python reserves for itself.  

So, if a particular name:object mapping cannot be found in the local namespaces, the namespaces of the enclosed scope are being searched next. If the search in the enclosed scope is unsuccessful, too, Python moves on to the global namespace, and eventually, it will search the built-in namespace (side note: if a name cannot found in any of the namespaces, a *NameError* will is raised).

**Note**:  
Namespaces can also be further nested, for example if we import modules, or if we are defining new classes. In those cases we have to use prefixes to access those nested namespaces. Let me illustrate this concept in the following code block:

In [23]:
import numpy
import math
import scipy

print(math.pi, 'from the math module')
print(numpy.pi, 'from the numpy package')
print(scipy.pi, 'from the scipy package')

3.141592653589793 from the math module
3.141592653589793 from the numpy package
3.141592653589793 from the scipy package


(This is also why we have to be careful if we import modules via "`from a_module import *`", since it loads the variable names into the global namespace and could potentially overwrite already existing variable names)


![LEGB figure](https://raw.githubusercontent.com/rasbt/python_reference/master/Images/scope_resolution_1.png)


## 1. LG - Local and Global scopes

**Example 1.1**  
As a warm-up exercise, let us first forget about the enclosed (E) and built-in (B) scopes in the LEGB rule and only take a look at LG - the local and global scopes.  
What does the following code print?

In [24]:
a_var = 'global variable'

def a_func():
    print(a_var, '[ a_var inside a_func() ]')

a_func()
print(a_var, '[ a_var outside a_func() ]')

global variable [ a_var inside a_func() ]
global variable [ a_var outside a_func() ]


**a)**
<pre>raises an error</pre>

**b)** 
<pre>
global value [ a_var outside a_func() ]</pre>

**c)** 
<pre>global value [ a_var inside a_func() ]  
global value [ a_var outside a_func() ]</pre>




[[go to solution](#solutions)]

### Here is why:

We call `a_func()` first, which is supposed to print the value of `a_var`. According to the LEGB rule, the function will first look in its own local scope (L) if `a_var` is defined there. Since `a_func()` does not define its own `a_var`, it will look one-level above in the global scope (G) in which `a_var` has been defined previously.
<br>
<br>

**Example 1.2**  
Now, let us define the variable `a_var` in the global and the local scope.  
Can you guess what the following code will produce?

In [25]:
a_var = 'global value'

def a_func():
    a_var = 'local value'
    print(a_var, '[ a_var inside a_func() ]')

a_func()
print(a_var, '[ a_var outside a_func() ]')

local value [ a_var inside a_func() ]
global value [ a_var outside a_func() ]


**a)**
<pre>raises an error</pre>

**b)** 
<pre>local value [ a_var inside a_func() ]
global value [ a_var outside a_func() ]</pre>

**c)** 
<pre>global value [ a_var inside a_func() ]  
global value [ a_var outside a_func() ]</pre>


[[go to solution](#solutions)]

### Here is why:

When we call `a_func()`, it will first look in its local scope (L) for `a_var`, since `a_var` is defined in the local scope of `a_func`, its assigned value `local variable` is printed. Note that this doesn't affect the global variable, which is in a different scope.

<br>
However, it is also possible to modify the global by, e.g., re-assigning a new value to it if we use the global keyword as the following example will illustrate:

In [26]:
a_var = 'global value'

def a_func():
    global a_var
    a_var = 'local value'
    print(a_var, '[ a_var inside a_func() ]')

print(a_var, '[ a_var outside a_func() ]')
a_func()
print(a_var, '[ a_var outside a_func() ]')

global value [ a_var outside a_func() ]
local value [ a_var inside a_func() ]
local value [ a_var outside a_func() ]


But we have to be careful about the order: it is easy to raise an `UnboundLocalError` if we don't explicitly tell Python that we want to use the global scope and try to modify a variable's value (remember, the right side of an assignment operation is executed first):

In [27]:
a_var = 1

def a_func():
    a_var = a_var + 1
    print(a_var, '[ a_var inside a_func() ]')

print(a_var, '[ a_var outside a_func() ]')
a_func()

1 [ a_var outside a_func() ]


UnboundLocalError: local variable 'a_var' referenced before assignment

<br>
<br>

<a name="section_2"></a>
<br>
<br>

## 2. LEG - Local, Enclosed, and Global scope



Now, let us introduce the concept of the enclosed (E) scope. Following the order "Local -> Enclosed -> Global", can you guess what the following code will print?

**Example 2.1**

In [28]:
a_var = 'global value'

def outer():
    a_var = 'enclosed value'
    
    def inner():
        a_var = 'local value'
        print(a_var)
    
    inner()

outer()

local value


**a)**
<pre>global value</pre>

**b)** 
<pre>enclosed value</pre>

**c)** 
<pre>local value</pre>

[[go to solution](#solutions)]

### Here is why:

Let us quickly recapitulate what we just did: We called `outer()`, which defined the variable `a_var` locally (next to an existing `a_var` in the global scope). Next, the `outer()` function called `inner()`, which in turn defined a variable with of name `a_var` as well. The `print()` function inside `inner()` searched in the local scope first (L->E) before it went up in the scope hierarchy, and therefore it printed the value that was assigned in the local scope.

Similar to the concept of the `global` keyword, which we have seen in the section above, we can use the keyword `nonlocal` inside the inner function to explicitly access a variable from the outer (enclosed) scope in order to modify its value.  
Note that the `nonlocal` keyword was added in Python 3.x and is not implemented in Python 2.x (yet).

In [29]:
a_var = 'global value'

def outer():
       a_var = 'local value'
       print('outer before:', a_var)
       def inner():
           nonlocal a_var
           a_var = 'inner value'
           print('in inner():', a_var)
       inner()
       print("outer after:", a_var)
        
outer()

outer before: local value
in inner(): inner value
outer after: inner value


<a name="section_3"></a>
<br>
<br>

## 3. LEGB - Local, Enclosed, Global, Built-in

To wrap up the LEGB rule, let us come to the built-in scope. Here, we will define our "own" length-funcion, which happens to bear the same name as the in-built `len()` function. What outcome do you excpect if we'd execute the following code?

**Example 3**

In [30]:
a_var = 'global variable'

def len(in_var):
    print('called my len() function')
    l = 0
    for i in in_var:
        l += 1
    return l

def a_func(in_var):
    len_in_var = len(in_var)
    print('Input variable is of length', len_in_var)

a_func('Hello, World!')

called my len() function
Input variable is of length 13


**a)**
<pre>raises an error (conflict with in-built `len()` function)</pre>

**b)** 
<pre>called my len() function
Input variable is of length 13</pre>

**c)** 
<pre>Input variable is of length 13</pre>

[[go to solution](#solutions)]

### Here is why:

Since the exact same names can be used to map names to different objects - as long as the names are in different name spaces - there is no problem of reusing the name `len` to define our own length function (this is just for demonstration pruposes, it is NOT recommended). As we go up in Python's L -> E -> G -> B hierarchy, the function `a_func()` finds `len()` already in the global scope (G) first before it attempts to search the built-in (B) namespace.

<a name ="assessment"></a>
<br>
<br>

# Self-assessment exercise

Now, after we went through a couple of exercises, let us quickly check where we are. So, one more time: What would the following code print out?

In [31]:
a = 'global'

def outer():
    
    def len(in_var):
        print('called my len() function: ', end="")
        l = 0
        for i in in_var:
            l += 1
        return l
    
    a = 'local'
    
    def inner():
        global len
        nonlocal a
        a += ' variable'
    inner()
    print('a is', a)
    print(len(a))


outer()

print(len(a))
print('a is', a)

a is local variable
called my len() function: 14
called my len() function
6
a is global


<a name="conclusion"
<br>
<br>

[[go to solution](#solutions)]

# Conclusion

I hope this short tutorial was helpful to understand the basic concept of Python's scope resolution order using the LEGB rule. I want to encourage you (as a little self-assessment exercise) to look at the code snippets again tomorrow and check if you can correctly predict all their outcomes.

#### A rule of thumb

In practice, **it is usually a bad idea to modify global variables inside the function scope**, since it often be the cause of confusion and weird errors that are hard to debug.  
If you want to modify a global variable via a function, it is recommended to pass it as an argument and reassign the return-value.  
For example:

In [32]:
a_var = 2

def a_func(some_var):
    return 2**3

a_var = a_func(a_var)
print(a_var)

8


<a name = "solutions">
<br>
<br>

## Solutions

In order to prevent you from unintentional spoilers, I have written the solutions in binary format. In order to display the character representation, you just need to execute the following lines of code:

In [33]:
print('Example 1.1:', chr(int('01100011',2)))

Example 1.1: c


In [34]:
print('Example 1.2:', chr(int('01100010',2)))

Example 1.2: b


In [35]:
print('Example 2.1:', chr(int('01100011',2)))

Example 2.1: c


In [36]:
print('Example 3.1:', chr(int('01100010',2)))

Example 3.1: b


In [37]:
# Execute to run the self-assessment solution

sol = "000010100110111101110101011101000110010101110010001010"\
"0000101001001110100000101000001010011000010010000001101001011100110"\
"0100000011011000110111101100011011000010110110000100000011101100110"\
"0001011100100110100101100001011000100110110001100101000010100110001"\
"1011000010110110001101100011001010110010000100000011011010111100100"\
"1000000110110001100101011011100010100000101001001000000110011001110"\
"1010110111001100011011101000110100101101111011011100011101000100000"\
"0011000100110100000010100000101001100111011011000110111101100010011"\
"0000101101100001110100000101000001010001101100000101001100001001000"\
"0001101001011100110010000001100111011011000110111101100010011000010"\
"1101100"

sol_str =''.join(chr(int(sol[i:i+8], 2)) for i in range(0, len(sol), 8))
for line in sol_str.split('\n'):
    print(line)

called my len() function

outer():

a is local variable
called my len() function: 14

global:

6
a is global


<br>
<br>
<a name="for_loop"></a>

## Warning: For-loop variables "leaking" into the global namespace

In contrast to some other programming languages, `for-loops` will use the scope they exist in and leave their defined loop-variable behind.


In [38]:
for a in range(5):
    if a == 4:
        print(a, '-> a in for-loop')
print(a, '-> a in global')

4 -> a in for-loop
4 -> a in global


**This also applies if we explicitly defined the `for-loop` variable in the global namespace before!** In this case it will rebind the existing variable:

In [39]:
b = 1
for b in range(5):
    if b == 4:
        print(b, '-> b in for-loop')
print(b, '-> b in global')

4 -> b in for-loop
4 -> b in global


However, in **Python 3.x**, we can use closures to prevent the for-loop variable to cut into the global namespace. Here is an example (exectuted in Python 3.4):

In [40]:
i = 1
print([i for i in range(5)])
print(i, '-> i in global')

[0, 1, 2, 3, 4]
1 -> i in global


Why did I mention "Python 3.x"? Well, as it happens, the same code executed in Python 2.x would print:

<pre>
4 -> i in global
<pre>

This goes back to a change that was made in Python 3.x and is described in [What’s New In Python 3.0](https://docs.python.org/3/whatsnew/3.0.html) as follows:

"List comprehensions no longer support the syntactic form `[... for var in item1, item2, ...]`. Use `[... for var in (item1, item2, ...)]` instead. Also note that list comprehensions have different semantics: they are closer to syntactic sugar for a generator expression inside a `list()` constructor, and in particular the loop control variables are no longer leaked into the surrounding scope."