## Item 1: Know which Version of Python You're Using

우선 아주 간단한 팁으로 시작합니다. 사용하고 있는 Python 버전을 확인하라는 것인데요. 


In [None]:
import sys
print(sys.version_info)

In [None]:
print(sys.version)

위와 같은 명령으로 사용중인 Python 버전을 확인할 수 있습니다.   
또한 가능한 Python3를 사용하라는 충고가 있습니다.

## Item 2: Follow the PEP 8 Style Guide

PEP(Python Enhancement Proposal)에는 파이썬에 대한 개선 제안, 구조에 대한 디자인 등 다양한 문서가 포함되어 있는데요. 그중에서도 8번 문서(<a href="https://www.python.org/dev/peps/pep-0008/">PEP8</a>)에는 코딩 스타일 가이드를 담고 있습니다. 


.

## Item 14 : Prefer Exceptions to Returning None

함수 구현할 때 어떤 특이상태를 표현하기 위해 None을 return하도록 만들곤 한다.      
그런데 이런 방식은 return 값에 대한 상태체크시 (잘 인지하지 못하는) 에러를 유발하곤 한다.     
예를들어 아래 코드는 0으로 나누는 경우를 체크하려 하지만 분자가 0인 경우에도 'Invalid inputs'를 출력한다.      
(if 문과 관련하여 아래 ※ if if if... (Item 14)를 참고)

In [57]:
def divide(a, b):
    try:
        return a / b
    except ZeroDivisionError:
        return None

In [58]:
x, y = 0, 5
result = divide(x, y)
if not result:
    print('Invalid inputs')
else:
    print(result)

Invalid inputs


In [59]:
x, y = 1, 0
result = divide(x, y)
if result is None:
    print('Invalid inputs')
else:
    print(result)

Invalid inputs


이에 대한 첫번째 대안으로 이상 상태가 발생했는지 아닌지를 표현하는 flag를 원래 반환하려는 값과 함께 tuple로 반환하는 것이다.

In [60]:
def divide(a, b):
    try:
        return True, a / b
    except ZeroDivisionError:
        return False, None

In [61]:
x, y = 1, 0
success, result = divide(x, y)
if not success:
    print('Invalid inputs')
else:
    print(result)

Invalid inputs


In [62]:
x, y = 0, 5
success, result = divide(x, y)
if not success:
    print('Invalid inputs')
else:
    print(result)

0.0


(보다 나은) 두번째 대안으로 함수에서 에러가 발생하면 그냥 에러를 raise해서 호출한쪽에서 에러를 처리하게 하는 것이다. 

In [63]:
def divide(a, b):
    try:
        return a / b
    except ZeroDivisionError as e:
        raise ValueError('Invalid inputs') from e

In [65]:
x, y = 1, 0
try:
    result = divide(x, y)
except ValueError:
    print('Invalid inputs')
else:
    print('Result is %.1f' %result)

Invalid inputs


In [66]:
x, y = 0, 5
try:
    result = divide(x, y)
except ValueError:
    print('Invalid inputs')
else:
    print('Result is %.1f' %result)

Result is 0.0


## Item 15 : Know How Closures Interact with Variable Scope

주어진 숫자들을 정렬하되, 특별한 그룹에 속하는 숫자들은 그렇지 않은 숫자들보다 우선하도록 정렬하는 함수를 만들고 싶다.
예를들어 정렬할 숫자로 8, 3, 1, 2, 5, 4, 7, 6가 주어지고, 특별한 그룹으로 2, 3, 5, 7가 주어지는 경우 아래와 같은 결과를 얻고 싶다.    
2, 3, 5, 7, 1, 4, 6, 8   
이런 함수를 아래와 같이 작성해볼 수 있다.

In [78]:
def sort_priority(values, group):
    def helper(x):
        if x in group:
            return (0, x)
        return (1, x)
    values.sort(key=helper)

In [79]:
numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
sort_priority(numbers, group)
print(numbers)

[2, 3, 5, 7, 1, 4, 6, 8]


위 함수 정의에서 살펴볼 것은 아래 3가지이다.
- 위 helper 함수는 closure이다. (helper 함수는 local scope 밖의 변수인 group에 접근)
- Python에서 함수는 first class object이다. (함수를 인자로 전달하거나, 함수의 결과로 반환하거나, 변수에 할당할 수 있다.)
- tuple간의 대소 비교는 0번째 원소부터 순차적으로 진행된다. (아래 코드 참고)

In [80]:
# tuple의 비교 연산은 0번째 원소부터 진행됨
print((1, 2, 3) > (1, 2, 4))
print((1, 2, 3) > (2, 2, 3))

False
False


숫자들을 전달한 후 group에 속하는 숫자들이 등장 했는지 확인하기 위해 아래와 같이 found 함수를 추가해볼 수 있다.

In [81]:
def sort_priority2(values, group):
    found = False
    def helper(x):
        if x in group:
            found = True
            return (0, x)
        return (1, x)
    values.sort(key=helper)
    return found

In [82]:
numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
is_found = sort_priority2(numbers, group)
print(numbers, ',', is_found)

[2, 3, 5, 7, 1, 4, 6, 8] , False


그런데 분명 numbers의 숫자들 중 group에 속하는 값이 있음에도 False가 출력되고 있다. 이는 변수를 읽을 때와 쓸 때 scope을 판단하는 기준이 달라서 종종 범하게 되는 문제이다.

변수를 읽을 때에는 1. 현재 함수의 scope, 2. 함수 밖의 scope, 3. 해당 코드가 포함된 모듈, 4. built-in scope 을 차례로 찾는다.    
반면 변수를 쓸 때에는 현재 scope에 선언된 변수가 있다면 그것에 기록할 것이고, 만약 없다면 현재 scope에 새로운 변수를 선언고 기록한다. 즉 변수를 쓸 때에는 현재 scope밖을 살피지 않는다. 또한 주의할 점은 변수를 읽는 것과 쓰는 것이 한 scope안에 함께 있다면 그 변수는 local 변수로 간주되며, 이때 만약 변수를 읽는 것이 먼저 등장한다면 (변수 할당 전에 변수 값에 접근하므로) 에러가 발생한다.

위 문제를 해결하려면 어떻게 해야할까?

해결책은 두가지인데 우선 첫번째는 Python3에서 추가된 nonlocal 키워드를 사용하는 것이다.      
즉 local scope에서 해당 변수는 local 변수가 아니다라는 것을 명시하는 것으로서,       
enclosing scope(local scope 바로 밖)에 선언된 해당 변수를 찾아 사용하게 된다.

In [83]:
def sort_priority3(values, group):
    found = False
    def helper(x):
        nonlocal found
        if x in group:
            found = True
            return (0, x)
        return (1, x)
    values.sort(key=helper)
    return found

In [84]:
numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
is_found = sort_priority3(numbers, group)
print(numbers, ',', is_found)

[2, 3, 5, 7, 1, 4, 6, 8] , True


두번째 해결책은 scope 밖에 있는 변수를 list, dictionary, set혹은 직접 정의한 class와 같은 mutable type을 사용하고, 이 변수의 멤버 함수를 이용하여 값을 읽거나 쓰는 것이다. (found[0] = True는 사실 found.`__setitem__`(True) 로 동작한다.) 

In [85]:
def sort_priority4(values, group):
    found = [None]
    def helper(x):
        if x in group:
            found[0] = True
            return (0, x)
        return (1, x)
    values.sort(key=helper)
    return found[0]

In [86]:
numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
is_found = sort_priority4(numbers, group)
print(numbers, ',', is_found)

[2, 3, 5, 7, 1, 4, 6, 8] , True


그런데 그런데 그런데...

아주 단순한 경우가 아니면 가능한한 nonlocal를 사용하지 않는 것을 추천한다. 구조가 복잡해지면 어떤 변수를 참고하고 있는 것인지 찾기가 어려워지기 때문이다. 부득이 복잡한 구조에서 nonlocal 과 같은 변수 사용이 필요하다면 아래와 같이 inner function을 class로, nonlocal 변수를 클래스의 멤버 변수로 바꾸면 가독성을 높일 수 있다.

In [87]:
class Sorter(object):
    def __init__(self, group):
        self.group = group
        self.found = False
    
    def __call__(self, x):
        if x in self.group:
            self.found = True
            return (0, x)
        return (1, x)

In [88]:
numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
sorter = Sorter(group)
numbers.sort(key=sorter)
print(numbers, ',', sorter.found)

[2, 3, 5, 7, 1, 4, 6, 8] , True


---

## if if if ...

아래와 같이 x값을 테스트 하는 함수가 있고

In [None]:
def test_if(x):
    if x:
        print('O', end='')
    else:
        print('X', end='')
    
    if x is True:
        print('O', end='')
    else:
        print('X', end='')
        
    if x == True:
        print('O', end='')
    else:
        print('X', end='')

x가 ﻿2, 1, 0, -1, -2, None, '', True 인 각각의 경우 출력값은?

In [22]:
test_if(2)

OXX

In [23]:
test_if(1)

OXO

In [24]:
test_if(0)

XXX

In [25]:
test_if(-1)

OXX

In [26]:
test_if(-2)

OXX

In [27]:
test_if(None)

XXX

In [28]:
test_if('')

XXX

In [29]:
test_if(True)

OOO

- `if x:`는 x가 0, None, ''이 아니면 True.    
- `if x is True`는 x가 True일때만 True.    
- `if x == True`는 x가 1이나 True이면 True.

## Metaclass

.

## Decorator

Decorator는 어떤 함수를 입력으로 받아 이 함수에 전/후 처리를 더하거나 전혀 새로운 함수를 반환하는 '호출 가능한 어떤 것'(callable)을 말한다. 이 callable은 함수(decorator 함수) 형태로 정의되고, 대상 함수 정의앞에 @{decorator 함수}를 명시하는 형태로 사용된다.

아래 코드에서 decorator 함수의 이름은 deco이고, 대상함수명은 'target'이며 이 함수 정의 앞에 '@deco'를 명시하고 있다. 즉 target 함수는 deco 함수의 인자로 입력되고 inner라는 새로운 함수로 바뀌고 있다.

In [35]:
def deco(func):
    print('Decorating func:', func)
    
    def inner():
        print('Inner function')
        
    return inner

@deco
def target():
    print('Running target()')

decorated_target = target

Decorating func: <function target at 0x000001C90812A840>


In [38]:
decorated_target()

Inner function


사실 위 코드는 아래 코드와 같으며, 함수를 decorator 함수로 양념/포장/데코하는 것이다.

In [39]:
def deco(func):
    print('Decorating func:', func)
    
    def inner():
        print('Inner function')
        
    return inner

def target():
    print('Running target()')

decorated_target = deco(target)

Decorating func: <function target at 0x000001C9080FABF8>


In [40]:
decorated_target()

Inner function


위와 같이 명시적으로 함수를 인자로 하는 함수를 호출하는 것과 Decorator의 다른점은 decorator를 사용할 경우 decorator 함수 내부에서의 처리는 타겟 하수가 정의된 시점(import 시점, loading 시점)이라는 것이다. 물론 대상 함수(위 예에서는 target함수)가 실행되는 시점은 그 함수가 호출되는 시점(runtime)이다.

실제 구현에서는 decorator 함수와 대상 함수가 다른 모듈에서 정의되는 경우가 많으며, 입력받은 함수와 전혀 다른 함수를 반환하는 경우가 대부분이다. 물론 입력 받은 함수와 동일한 함수를 반환하는 경우도 있으나 이런 것은 보통 웹 프레임웍에서 URL 패턴을 등록하는 것과 같이 특정 목적의 함수들을 관리하려 할 때 사용된다.

## Closures

Closure는 자신이 정의하지 않은 nonglobal 변수를 포함하는 함수를 말한다. (a closure is a function that retains the bindings of the free variables that exist when the function is defined, so that they can be used later when the function is invoked and the defining scope is no longer available... / Fluent Python, p201)

예를들어 아래 'printer'는 inner_printer에서 정의하지 않은 (outer_printer의 local)변수 x를 포함하고 있으며, 호출시에는 y값만 인자로 전달한다. 

변수 x는 outer_printer의 scope에 존재하므로 'return inner_printer' 이후 이 scope은 존재하지 않고 x도 사라지는 것처럼 보이지만, 이 변수는 inner_printer에서 **사용**(읽기)되면서 이 함수 정의에 포함되어 전달된다.

주의할점은 **사용**이 읽기가 아니라 쓰기일 경우 그 의미가 크게 달라지는데.. 이 부분은 나중에 설명하기로 한다.

In [114]:
def outer_printer(x):
    def inner_printer(y):
        print('closure variable:', x)
        print('local variable  :', y)
        
    return inner_printer

In [115]:
printer = outer_printer(x=100)

In [116]:
printer(y=200)

closure variable: 100
local variable  : 200


closure는 함수의 `__closure__`변수를 통해 접근할 수 있다.

In [117]:
print(printer.__closure__)
print(printer.__closure__[0].cell_contents)

(<cell at 0x000001C90810BB28: int object at 0x0000000056B9F630>,)
100


또한 `__code__.co_freevars`를 통해 closure 변수의 이름을 확인할 수 있다.

In [118]:
printer.__code__.co_freevars

('x',)

참고로 함수의 local 변수는 아래와 같이 `__code__.co_varnames`로 확인할 수 있다.

In [121]:
printer.__code__.co_varnames

('y',)

참고로2 앞서 예제 코드는 아래와 같이 구현할수도 있다.

In [125]:
class OuterPrinter:
    def __init__(self, x):
        self.x = x
        
    def __call__(self, y):
        print('closure variable:', self.x)
        print('local variable  :', y)

In [126]:
printer = OuterPrinter(x=100)

In [127]:
printer(200)

closure variable: 100
local variable  : 200


참고 페이지 : https://www.programiz.com/python-programming/closure

## Variable Scope rule

아래 함수 f1에서 선언된 지역변수 a는 성공적으로 그 값이 출력된다. 그리고 변수 b는 선언되어 있지 않으므로 에러가 발생된다.

In [1]:
def f1(a):
    print(a)
    print(b)

f1(3)

3


NameError: name 'b' is not defined

아래와 같이 함수 f1 밖에서 (전역변수) b를 선언하고, 다시 실행하면 b가 정상적으로 출력된다.

즉 변수를 읽을 때에는 우선 현재 **함수의 범위(scope)**를 찾고 없으면 차례로 **함수 밖의 범위**, **해당 코드가 포함된 모듈(=global scope)**, **built-in 범위**에서 해당 이름의 변수를 찾는다.

In [2]:
b = 6
f1(3)

3
6


---

그런데 아래 코드를 보면    
함수 f1에서는 변수 b를 읽으려 하고    
함수 f2에서는 변수 b에 값을 할당하려 하고 있다.

3이 출력된 것으로 보아 (지역)변수 a를 읽는데에는 문제가 없었으나, 변수 b를 print하려 할 때 문제가 발생한다.     
왜 에러가 발생한 걸까?

그 이유는 함수 f2가 컴파일될 때 함수내 변수들의 성격을 미리 정의하는데, 변수 b는 'b = 9'와 같이 할당이 일어나기 때문에 **지역 변수**로 결정된다. 이후 실행과정에서 'print(b)'에서 변수 b값을 읽어와야 하는데, 지역변수 b는 아직 값이 할당되지 않았기 때문에 에러가 발생한다.

물론 할당하는 것 조차 함수 밖의 범위들을 찾아보고 같은 이름의 변수가 있다면 그 변수값을 수정하도록 할 수 있으나 알수 없는 범위의 변수가 수정되는 것을 막기 위한 Python의 설계적 선택이라 할 수 있다.(javascript에서는 지역변수가 없을 경우 외부 범위의 변수를 수정한다.)

즉 변수 할당에서는 함수 내 범위의 변수에만 적용된다.

In [21]:
b = 6
def f2(a):
    print(a)
    print(b)
    b = 9

In [22]:
f2(3)

3


UnboundLocalError: local variable 'b' referenced before assignment

물론 종종 변수 밖의 변수값을 수정할 필요가 있을 수 있다. 이때 사용하는 것이 global 키워드이다.   
(혹은 global 키워드 없이 list같은 mutable 변수를 이용하는 방법도 있다.)

In [18]:
b = 6
def f3(a):
    global b
    print(a)
    print(b)
    b = 9

In [19]:
f3(3)

3
6


In [20]:
b

9

## Item 16: Consider Generators Instead of Returning Lists

어떤 목록을 반환하는 함수를 만들 때 list를 반환하기보다는 generator를 사용하는 방법이 더 좋을 수 있다.     
예를들어 어떤 문장에서 단어가 시작되는 index들 알고자 한다고 해보자.    
우선 간단하게는 아래와 같이 index들을 list 형태로 반환하는 형식으로 구현할 수 있다.   

In [28]:
def index_words(text):
    result = []
    if text:
        result.append(0)
    for index, letter in enumerate(text):
        if letter == ' ':
            result.append(index + 1)
    return result

In [31]:
result = index_words('Four score and seven years ago')
print(result)

[0, 5, 11, 15, 21, 27]


그런데 위와 같은 방식의 함수 구현은 몇가지 문제점을 갖고 있다.

첫번째 문제는 코드 가독성이 떨어지고 지저분하다는 것이다. 빈칸이 보이면 index+1을 전달하는 것이 핵심인데, 위 코드에서는 result list에 append하는 등의 작업이 더 부각되어 보인다.     
이런 방식의 구현보다는 아래와 같이 generator를 사용하는 권장한다. (generator는 yield를 이용해 결과를 반환하는 함수를 의미함)

In [32]:
def index_words_iter(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index + 1

In [33]:
result = index_words('Four score and seven years ago')
print(result)

[0, 5, 11, 15, 21, 27]


두번재 문제는 list 반환으로 구현할 경우 반환할 list의 크기에 따라 out of memory가 발생할 수 있다는 점이다.    
반면 generator를 사용할 경우 한번 반환(yield)하는 값의 크기만큼의 메모리로 충분하다.    
예를들어 파일을 읽어 단어가 시작되는 index들을 알고자 한다면 아래와 같이 generator를 이용해 구현할 수 있다.

In [1]:
import os

In [2]:
os.getcwd()

'D:\\_PlayGround\\Github\\pg\\dev_python_data_eng'

In [36]:
def index_file(handle):
    offset = 0
    for line in handle:
        if line:
            yield offset  # Starting index of line
        for letter in line:
            offset += 1
            if letter == ' ':
                yield offset

In [37]:
from itertools import islice

file_path = './data/data.txt'
with open(file_path, 'r') as f:
    it = index_file(f)
    results = islice(it, 0, 10)
    print(list(results))

[0, 4, 5, 15, 27, 30, 34, 43, 44, 45]


## Iterables, Iterators, and Generators

- Iterator, Iterable, Generator를 비유하여 설명하면 Iterator는 사서, Iterable은 책꽃이, Generator는 작가라고 할 수 있다.

---

- 간단한 예로 아래 list_fibo는 Sequence type 중 하나인 list 개체로서 피보나치 수 몇개를 담고 있는 iterable이다.

In [37]:
list_fibo = [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

- 아래 it_fibo는 iterator로서 list_fibo의 원소들을 차례대로 접근할 수 있도록 해 준다.

In [38]:
it_fibo = iter(list_fibo)

- 아래 gen_fibo 함수는 generator로서, 호출하면 generator object(iterator)를 반환한다. 아래 변수 g는 iterator이다.

In [39]:
def gen_fibo(length=None):
    cnt = 1
    x, y = 0, 1
    while length is None or cnt <= length:
        yield x
        x, y = y, x + y
        cnt += 1

In [40]:
g = gen_fibo(3)

- iterator를 입력으로 next 함수를 호출하면 iterator가 가리키고 있는 데이터에 순차적으로 접근할 수 있다.
- iterator가 소진되어 더 이상 내어줄 데이터가 없으면 'StopIteration' 에러가 발생한다.

In [41]:
next(g)

0

In [42]:
next(g)

1

In [43]:
next(g)

1

In [44]:
next(g)

StopIteration: 

###### Iterable

- iterator를 반환하는 `__iter__()` 함수가 구현되어 있다면 iterable이다.

- 어떤 개체x가 iterable인지 확인하는 가장 좋은 방법은 iter(x)를 호출해보는 것이다. 만약 x가 iterable이라면 iterator가 반환될 것이고 그렇지 않다면 TypeError(C object is not iterable)가 발생할 것이다. (물론 isinstance(x, abc.Iterable)을 사용해도 되지만 이럴 경우 `__init__`는 없고 `__getitem__`만 구현된 경우 iterable이 아니라고 판단한다.)

- (파이썬의) 모든 Collection type과 Sqeuence type은 Iterable이다.
 - built-in Collection type은 set, dict이 있다.(Collection 모듈에도 몇개가 있다.)
 - built-in Sequence type은 list, tuple, range, str, bytes 등이 있다.

- `__getitem__`이 구현되어 있다면 sequence로 취급받는다. 즉 `__getitem__`이 구현되어 iterable이다.(다만 index 0부터 접근 가능해야함)

- iter() 함수는 우선 그 개체에 `__init__`함수가 있는지 확인한다. (구현되어 있다면 `__init__`함수를 호출하여 iterator를 반환한다.). 만약 `__init__`함수가 없다면 `__getitem__`함수가 있는지 확인하고, `__getitem__`함수가 있다면 이를 이용해 iterator를 생성한다.(이때 index 0부터 접근한다. 따라서  `__getitem__`함수만으로 iterator로서 동작하려면 index 0부터 데이터 접근/생성이 가능하도록 구현해야 한다.)

- Iterator은 `__iter__`함수가 있으므로 Iterable이지만, Iterable은 `__next__`함수가 없으므로 Iterator가 아니다.

###### Iterator

- 다음 값을 반환하는 인자 없는 `__next__()` 함수와      
개체 자신을 반환하는 `__iter__()` 함수가 구현된 개체는 iterator이다.

- 어떤 개체x가 iterator인지 확인하는 가장 좋은 방법은 isinstance(x, abc.Iterator)를 호출하는 것이다. (이걸 호출하면 `__next__()`함수와 `__iter__` 함수가 구현되어 있는지 확인한다.)

- (파이썬의) 모든 Generator는 Iterator이다.

- 일반적으로 파이썬 커뮤니티에서는 Generator와 Iterator를 같은 것으로 취급한다.

###### Generator

- 함수 안에 yield 키워드가 포함되어 있다면 generator이다.

- generator는 iterator이다.

- GoF의 책에서는 iterator를 collection이나 sequence와 같이 어딘가에 존재하는 데이터에 대한 '손잡이'라고 말하지만, generator는 (저장되어 있지 않던) 데이터를 생성할수도 있는 iterator라 할 수 있다.

---

어떤 문장을 주면 문장에 포함된 단어들에 순차적으로 접근할 수 있도록 하는 클래스를 만들고 이를 점차 개선해 보도록 하자.

###### Example 14-1. Sentence Take #1 : A Sequence of Words

아래와 같이 `__getitem__`함수를 통해 self.words에 순차적으로 접근하도록 구현해볼 수 있다.

In [212]:
import re
import reprlib
RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)

    def __getitem__(self, index):
        return self.words[index]

    def __len__(self):
        return len(self.words)

    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)

Sentence 개체 s를 하나 생성한다.

In [213]:
s = Sentence('"The time has come," the Walrus said,')

In [214]:
s

Sentence('"The time ha... Walrus said,')

`__getitem__`함수가 있으므로 Sentence는 sequence로서 index로 각 데이터 원소에 접근할 수 있다.

In [215]:
s[2]

'has'

sequence는 범위를 벗어나는 index값으로 접근하는 경우 IndexError를 발생시킨다.

In [216]:
s[100]

IndexError: list index out of range

또한 `__getitem__`함수가 있으므로 iterator로 동작한다.     
만약 iterator가 아니라면 iter(s)를 호출하면 TypeError(C object is not iterable)가 발생할 것이다.

In [145]:
it = iter(s)

아래 테스트를 통해 it이 iterator임을 확인 할 수 있다.

In [146]:
from collections.abc import Iterable, Iterator

isinstance(it, Iterator)

True

만약 파이썬에 for문이 없었다면 아래 (첫번째 코드)for 문을 (두번째 코드)while 문으로 구현했을지도 모른다.      


즉 for문 내부적으로 in 이하의 어떤 개체를 인자로 iter()함수를 호출해  iterator를 획득하고    
이 iterator를 이용해 데이터에 접근하고, iterator가 소진되면 발생하는 StopIteration에러를 처리한다.

In [152]:
for word in s:
    print(word)

The
time
has
come
the
Walrus
said


In [94]:
it = iter(s)
while True:
    try:
        print(next(it))
    except StopIteration:
        del it
        break

The
time
has
come
the
Walrus
said


###### Example 14-4. Sentence Take #2 : A Classic Iterator

다음으로 GoF 책의 Iterator 디자인 패턴을 그대로 반영하여 Sentence 클래스를 만들어보자. 물론 이는 전혀 파이썬스럽지 않은 구현이지만, 리팩토링을 통해 점차 개선해 갈 것이다.

아래와 같이 Sentence 클래스에는 iterator를 반환하는 `__iter__()`함수가 있으므로 iterable이다.    
또한 SentenceIterator 클래스는 다음 데이터를 반환하는 `__next__()`함수가 있고, 자기 자신을 반환하는 `__iter__()`함수가 있으므로 iterator이다.

In [102]:
import re
import reprlib
RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)

    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)

    def __iter__(self):
        return SentenceIterator(self.words)


class SentenceIterator:
    def __init__(self, words):
        self.words = words
        self.index = 0
    
    def __next__(self):
        try:
            word = self.words[self.index]
        except IndexError:
            raise StopIteration()
        self.index += 1
        return word

    def __iter__(self):
        return self

In [133]:
s = Sentence('"The time has come," the Walrus said,')  # s : iterable instance

iter(s)가 TypeError를 발생시키지 않으므로 s는 iterable임을 알 수 있다.

In [136]:
it = iter(s)  # it : iterator

아래 테스트를 통해 it이 iterator임을 확인 할 수 있다.

In [137]:
from collections.abc import Iterable, Iterator

isinstance(it, Iterator)

True

'Sentence 클래스에 `__next__()`함수를 추가하여 그 자체로서 Iterator로서 동작하도록 하면 더 간단하지 않은가?'라고 생각할수도 있다. 하지만 하나의 데이터 원본을 서로 독립적인 iterator로 접근할 수 있도록 하려면 Iterable(Sentence)과 Iterator(SentenceIterator)를 분리하는 것이 좋다.

따라서 iterable에는 `__iter__()`함수를 구현하되 `__next__()`함수는 포함시키면 안 되고      
iterator에는 자기 자신을 반환하는 `__iter__()`함수와 다음 원소를 반환하는 `__next__()`함수를 구현해야 한다.

###### Example 14-5. Sentence Take #3 : A Generator Function

generator 함수를 이용해 파이썬스러운 방식으로 **Take #2**를 개선해볼 수 있다.

아래 `__iter__()` 함수는 yield  키워드를 포함하므로 generator 함수로서 호출시 'generator 개체'(iterator)를 반환한다.

In [204]:
import re
import reprlib
RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)

    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)
    
    def __iter__(self):
        for word in self.words:
            yield word
        return

In [164]:
s = Sentence('"The time has come," the Walrus said,')  # s : iterable instance

In [165]:
it = iter(s)  # it : iterator, generator object

In [166]:
it

<generator object Sentence.__iter__ at 0x00000157252FD048>

In [167]:
list(it)

['The', 'time', 'has', 'come', 'the', 'Walrus', 'said']

###### Example 14-7. Sentence Take #4 : A Lazy Implementation

그런데 **Take #3**까지의 구현에서는 입력 데이터 text를 이용해 self.words를 한꺼번에 생성한다. 만약 입력되는 text의 크기가 매우 크다면 문제가 발생할 수 있다. RE_WORD.findall 함수로 단어들을 담은 list를 한꺼번에 생성하는 대신 RE_WORD.finditer 함수를 이용해 요청할 때마다 한 단어식 반환하도록 할 수 있다. (전자의 방식을 eager하다고, 후자의 방식을 lazy하다고 표현한다.)

In [168]:
import re
import reprlib
RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
        
    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)
    
    def __iter__(self):
        for match in RE_WORD.finditer(self.text):
            yield match.group()

###### Example 14-9. Sentence Take #5 : A Generator Expression

generator expression을 이용해 **Take #4**를 좀 더 간략하게 만들어볼 수 있다. generator expression은 list comprehension의 lazy한 버전이라 생각할 수 있으며, list comprehension이 list를 반환한다면 generator expression은 generator를 반환한다.

In [207]:
x1 = [x + 10 for x in range(5)]  # list comprehension
x1  # x1 : list

[10, 11, 12, 13, 14]

In [208]:
x2 = (x + 10 for x in range(5))  # generator expression
x2  # x2 : generator object(iterator)

<generator object <genexpr> at 0x00000157253B1EB8>

In [209]:
list(x2)

[10, 11, 12, 13, 14]

아래와 같이 **Take #4** `__iter__`함수의 for문을 generator expression으로 바꿀 수 있으며,    
`__iter__`함수는 더 이상 generator가 아니지만, 호출 결과 generator object(iterator)를 반환한다.

In [210]:
import re
import reprlib
RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text

    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)
    
    def __iter__(self):
        return (match.group() for match in RE_WORD.finditer(self.text))

다만 list comprehension과 마찬가지로 generator expression 또한 남용할 경우 코드 가독성이 떨어지므로, 대략 2줄 이상 길어지는 generator expression는 generator 함수로 구현하는 것이 좋다.


# Coroutines

### [1]. yield

yield는 Python 2.5에 포함된 키워드로서, Python 3.3에서 yield from, Python 3.5에서 await/async 이 차례로 추가되었다.

generator는 그 정의안에 yield 키워드를 포함하는 함수로서 호출 결과는 generator object이면서 iterator이다.    
이 iterator는 yield 키워드 오른쪽의 값을 넘겨준다.

예를들어 아래 코드에서 simple_generator는 generator로서 그 정의에 yield 키워드가 포함되어 있고, 변수 start를 넘겨주도록 정의되어 있다.   
또한 'simple_generator(5)'의 호출 결과는 generator object이고 변수 start의 값을 iteration한다.

In [22]:
def simple_generator(end=10):
    start = 0
    while start < end:
        print('before yield, start:', start)
        yield start
        print(' after yield, start:', start)
        start += 1

In [23]:
my_gene = simple_generator(5)
print(my_gene)

<generator object simple_generator at 0x00000230861F80F8>


In [24]:
next(my_gene)

before yield, start: 0


0

In [25]:
print(list(my_gene))

 after yield, start: 0
before yield, start: 1
 after yield, start: 1
before yield, start: 2
 after yield, start: 2
before yield, start: 3
 after yield, start: 3
before yield, start: 4
 after yield, start: 4
[1, 2, 3, 4]


coroutine function은 yield를 포함하는 함수로서 그 호출 결과가 generator object라는 점은 generator와 동일하지만   
coroutine function에서는 yield 키워드가 'datum = yield '와 같이 어떤 표현 오른쪽에 위치한다.      
(이렇게 generator object를 앞으로 coroutine object라 부를 것이다..)  

my_coro이란 이름의 coroutine object를 생성했다.    
이를 사용하는 방식은 coroutine object에 .send(datum) 함수를 호출하는 것인데,     
이렇게 하면 datum값을 coroutine object로 전달하는 동시에 제어권을 'coroutine object를 호출하는 쪽'에서 'coroutine object'로 넘긴다.

In [114]:
def simple_coroutine():
    i = 1
    while True:
        print(' Inside of the coro object - before yield')
        x = yield
        print(' Inside of the coro object - after yield, x:', x, ' called {} times'.format(i))
        i += 1

my_coro = simple_coroutine()
my_coro

<generator object simple_coroutine at 0x00000230862BCD58>

In [115]:
my_coro = simple_coroutine()
my_coro

print('Outside of the coro object')
next(my_coro)
my_coro.send(1)

Outside of the coro object
 Inside of the coro object - before yield
 Inside of the coro object - after yield, x: 1  called 1 times
 Inside of the coro object - before yield


coroutine object를 생성한 후 바로 .send(...)를 호출하면 아래와 같이 TypeError가 발생하는데,          
이는 coroutine object를 생성한 직후에는 실행흐름이 yield 키워드까지 진행되지 않아 값을 받을 준비를 하고 있지 않기 때문이다.          
따라서 coroutine object를 생성한 후 처음 send를 호출하기 전에 next('coroutine object')를 호출하여 yield 키워드가 값을 받을 준비를 하고 있도록 해야 한다.      
next를 한번 호출하거나 None을 send하는 방식으로 ('coroutine object'.send(None)) 이런 사전 준비를 할 수 있으며 이를 "priming"이라 한다.

In [116]:
my_coro = simple_coroutine()

print('Outside of the coro object')
my_coro.send(1)

Outside of the coro object


TypeError: can't send non-None value to a just-started generator

In [117]:
my_coro = simple_coroutine()

next(my_coro)
print('Outside of the coro object')
my_coro.send(1)

 Inside of the coro object - before yield
Outside of the coro object
 Inside of the coro object - after yield, x: 1  called 1 times
 Inside of the coro object - before yield


In [118]:
my_coro = simple_coroutine()

my_coro.send(None)
print('Outside of the coro object')
my_coro.send(1)

 Inside of the coro object - before yield
Outside of the coro object
 Inside of the coro object - after yield, x: 1  called 1 times
 Inside of the coro object - before yield


'coroutine object'.send(datum) 과 같이 'coroutine object를 호출하는 쪽'에서 'coroutine object'로 값을 넘겨줄 수 있을 뿐만 아니라       
'coroutine object'에서 'coroutine object를 호출하는 쪽'으로 넘겨받을 값을 yield 키워드 오른쪽에 지정할수도 있다.    
yield 키워드 오른쪽에 값을 지정하지 않을 경우 암묵적으로 None이 반환된다.

아래 코드의 실행 과정은 다음과 같다.
1. (6)  : coroutine object를 생성, coroutine object의 실행은 (1)까지 진행된다.
2. (7)  : priming, (3)에서 yield를 만나 `i*100`을 caller()에 넘겨주고 caller()가 send를 하출하기를 기다린다.
3. (8)  : send, 1을 send했고 (3)에서 yield 키워드는 이 값을 받아 x에 할당하고, (4), (5), (2)가 차례대로 실행되고 `i*100`을 caller()에 넘겨주고 caller()가 send를 호출하기를 기다린다.
4. (9)  : coroutine object가 전달해준 `i*100` 확인
5. (10) : send, 2를 send했고 (3)에서 yield 키워드는 이 값을 받아 x에 할당하고, (4), (5), (2)가 차례대로 실행되고 `i*100`을 caller()에 넘겨주고 caller()가 send를 호출하기를 기다린다.
6. (11)  : coroutine object가 전달해준 `i*100` 확인

In [119]:
def simple_coroutine():  # (1)
    i = 1
    while True:
        print(' Inside of the coro object - before yield')  # (2)
        x = yield i*100  # (3)
        print(' Inside of the coro object - after yield, x:', x, ' called {} times'.format(i))  # (4)
        i += 1  # (5)

def caller():
    my_coro = simple_coroutine()  # (6)

    next(my_coro)  # (7)
    reply = my_coro.send(1) # (8)
    print(reply)  # (9)

    reply = my_coro.send(2)  # (10)
    print(reply)  # (11)
    
caller()

 Inside of the coro object - before yield
 Inside of the coro object - after yield, x: 1  called 1 times
 Inside of the coro object - before yield
200
 Inside of the coro object - after yield, x: 2  called 2 times
 Inside of the coro object - before yield
300


물론 coroutine function에서도 yield 오른쪽에 변수를 두고 이 값을 넘겨받을 수 있으나 생략가능하며 그 경우 None을 넘겨준다. 

이처럼 coroutine object에 데이터를 주고받는 기능이 있긴 하지만,   
실제 coroutine function은 coroutine object를 호출하는 쪽과 coroutine object사이에 제어권을 주고 받도록 해 주는 방식으로 멀티테스킹을 구현하는데 사용된다.

아래와 같이 yield 다음에 변수가 없을 때 None이 반환됨을 확인할 수 있다.

In [8]:
def simple_coroutine():
    print('before yield')
    x = yield
    print(' after yield, x:', x)
''
my_coro = simple_coroutine()
my_coro

first_yielded_value = next(my_coro)  # priming
print(first_yielded_value is None)
print(next(my_coro))

before yield
True
 after yield, x: None


StopIteration: 

아래와 같이 coroutine object에서 값을 반환 받는 예를 살펴보자. 이동평균 계산을 끝내려면 코루틴 개체에 None을 보내면 되는데, 그 반환 값은 StopIteration exception의 value를 통해 전달된다. 이는 대단히 어색한? 방식이라 할 수 있다. 누군가가 대신 StopIteration을 catch해 주고 value 값만 반환해준다면 좋을텐데, 이런 바램?이 반영된 것이 PEP380으로 소개된 **yield from** 이다. 사실 for-loop도 in 뒤에 주어진 iterable의 종료될때 발생하는 StopIteration을 내부적으로 catch해 주며 'yield from'도 비슷한 편의성을 제공한다고 할 수 있다.

In [21]:
from collections import namedtuple

Result = namedtuple('Result', 'count average')

def averager():
    total = 0.0
    count = 0
    average = None
    while True:
        term = yield
        if term is None:
            break
        total += term
        count += 1
        average = total/count
    return Result(count, average)


coro_avg = averager()
next(coro_avg)
coro_avg.send(10)
coro_avg.send(30)
coro_avg.send(6.5)

try:
    coro_avg.send(None)
except StopIteration as exc:
    result = exc.value
    
print(result)

Result(count=3, average=15.5)


### [2]. yield from

- Python 3.3에서 추가된 'yield from'는 타 언어의 await과 같은 기능을 하는 것이다.(Python 3.5에서 await, async 키워드가 추가됨)

- 아래 코드에서 알 수 있는 것처럼 grouper 함수는 main 함수와 average 함수 사이에 데이터/컨트롤을 주고받는 채널 역할을 한다. 

- PEP380에 따르면 main 함수를 'caller'   
, grouper 함수를 delegating generator   
, averager 함수를 subgenerator라 부른다.

- 이때 delegating generator는 'yield from'을 포함하는 함수이며   
, subgenerator는 delegating generator의 'yield from' 키워드 다음에 등장하는 함수이며   
, caller는 delegating generator를 호출하는 함수이다. 

- 아래 코드에서 특이한 점은 'yield from' 뒤에 등장하는 iterator는 자동으로 priming되지만 'yield from'을 포함하는 함수(delegating generator)는 priming을 해줘야만 한다.
- 또한 'IMPORTANT!!!'라는 주석이 달린 라인(`group.send(None)`)이 없을 경우 averager함수는 break로 빠져나가지 못하게 되고 결과값을 받을 수 없게 된다. 혹은 이 라인이 `for key, values in data.items():` 범위 바로 밖에 위치한다면 `data`의 모든 값에 대한 평균을 구하게 된다.

![1.PNG](attachment:1.PNG)

In [26]:
from collections import namedtuple

Result = namedtuple('Result', 'count average')

# subgenerator
def averager():
    total = 0.0
    count = 0
    average = None
    while True:
        term = yield
        if term is None:
            break
        total += term
        count += 1
        average = total / count
    return Result(count, average)

# delegating generator
def grouper(results, key):
    while True:
        results[key] = yield from averager()

# caller
def main(data):
    results = {}
    for key, values in data.items():
        group = grouper(results, key)
        next(group)
        for value in values:
            group.send(value)
        group.send(None)  # IMPORTANT!!!
        
    print(results)

data = {
    'girls;kg':[40.9, 38.5, 44.3, 42.2, 45.2, 41.7, 44.5, 38.0, 40.6, 44.5],
    'girls;m':[1.6, 1.51, 1.4, 1.3, 1.41, 1.39, 1.33, 1.46, 1.45, 1.43],
    'boys;kg':[39.0, 40.8, 43.2, 40.8, 43.1, 38.6, 41.4, 40.6, 36.3],
    'boys;m':[1.38, 1.5, 1.32, 1.25, 1.37, 1.48, 1.25, 1.49, 1.46],
}

main(data)

{'girls;kg': Result(count=10, average=42.040000000000006), 'girls;m': Result(count=10, average=1.4279999999999997), 'boys;kg': Result(count=9, average=40.422222222222224), 'boys;m': Result(count=9, average=1.3888888888888888)}


### [3]. async/await

async/await 키워드는 PEP492로 제안되어 Python 3.5에 추가되었다. 사실 앞으로 설명할 'async' 키워드를 이용해 생성한 coroutine function은 앞서 설명했던 'yield from'을 이용한 coroutine과 기능/목적이 많이 다르다. 이 둘을 구분하기 위해 'yield from'을 이용한 coroutine function은 'generator-based coroutine function'이라 부르겠다.

In [1]:
from collections import namedtuple
import asyncio

Result = namedtuple('Result', 'key count average')


async def averager(key, values):
    count = len(values)
    average = sum(values) / count
    await asyncio.sleep(3.0)
    return Result(key, count, average)

data = {
    'girls;kg':[40.9, 38.5, 44.3, 42.2, 45.2, 41.7, 44.5, 38.0, 40.6, 44.5],
    'girls;m':[1.6, 1.51, 1.4, 1.3, 1.41, 1.39, 1.33, 1.46, 1.45, 1.43],
    'boys;kg':[39.0, 40.8, 43.2, 40.8, 43.1, 38.6, 41.4, 40.6, 36.3],
    'boys;m':[1.38, 1.5, 1.32, 1.25, 1.37, 1.48, 1.25, 1.49, 1.46],
}

async def main():
    results = {}
    tasks = []
    for key, values in data.items():
        task = asyncio.ensure_future(averager(key, values))
        tasks.append(task)
        
    for f in asyncio.as_completed(tasks):
        print(f)
        x = await f
        print(x)

loop = asyncio.get_event_loop()
loop.run_until_complete(main())
loop.close()


<generator object as_completed.<locals>._wait_for_one at 0x000002C836D3BEB8>
Result(key='girls;kg', count=10, average=42.040000000000006)
<generator object as_completed.<locals>._wait_for_one at 0x000002C836D3BF10>
Result(key='boys;kg', count=9, average=40.422222222222224)
<generator object as_completed.<locals>._wait_for_one at 0x000002C836D3BEB8>
Result(key='girls;m', count=10, average=1.4279999999999997)
<generator object as_completed.<locals>._wait_for_one at 0x000002C836D3BF10>
Result(key='boys;m', count=9, average=1.3888888888888888)


@@@ 이어서 '비동기 처리를 쓰는 코드는 다음과 같은 식으로 구성한다.'

###### asyncio and more

> 참고 자료
 - 18.5.3. Tasks and coroutines, https://docs.python.org/3/library/asyncio-task.html
 - 파이썬의 새로운 병렬처리 API – Concurrent.futures, https://soooprmx.com/archives/5669
 - 단일 스레드 기반의 Nonblocking 비동기 코루틴 완전 정복, https://soooprmx.com/archives/6882
 - PEP380, https://www.python.org/dev/peps/pep-0380/
 - PEP492, https://www.python.org/dev/peps/pep-0492/

- Future <- Task??


- asyncio.ensure_future: Task 
- asyncio.as_completed: Future instance들로 구성된 iterator를 받아 ..?
- asyncio.sleep
- asyncio.get_event_loop


- AbstractEventLoop.run_until_complete
- AbstractEventLoop.close

In [1]:
import asyncio
import random


async def lazy_greet(msg, delay=1):
    print(msg, "will be displayed in", delay, "seconds")
    await asyncio.sleep(delay)
    return msg.upper()


async def main():
    messages = ['hello', 'world', 'apple', 'banana', 'cherry']
    fts = [asyncio.ensure_future(lazy_greet(m, random.randrange(1, 5)))
           for m in messages]
    for f in asyncio.as_completed(fts):
        # x = await f
        print(f, type(f))


loop = asyncio.get_event_loop()
loop.run_until_complete(main())
loop.close()

<generator object as_completed.<locals>._wait_for_one at 0x0000016F5F747FC0> <class 'generator'>
<generator object as_completed.<locals>._wait_for_one at 0x0000016F5F75E048> <class 'generator'>
<generator object as_completed.<locals>._wait_for_one at 0x0000016F5F747FC0> <class 'generator'>
<generator object as_completed.<locals>._wait_for_one at 0x0000016F5F75E048> <class 'generator'>
<generator object as_completed.<locals>._wait_for_one at 0x0000016F5F747FC0> <class 'generator'>
hello will be displayed in 2 seconds
world will be displayed in 4 seconds
apple will be displayed in 2 seconds
banana will be displayed in 4 seconds
cherry will be displayed in 3 seconds


In [1]:
import asyncio

async def slow_operation(future):
    print(0)
    await asyncio.sleep(5)
    print(1)
    future.set_result('Future is done!')
    print(2)
    

loop = asyncio.get_event_loop()

In [2]:
future = asyncio.Future(); future

<Future pending>

In [3]:
asyncio.ensure_future(slow_operation(future))

<Task pending coro=<slow_operation() running at <ipython-input-1-6dce289e0880>:3>>

In [4]:
loop.run_until_complete(future)

0
1
2


'Future is done!'

In [5]:
print(future.result())

Future is done!


In [1]:
loop.close()

<Task pending coro=<slow_operation() running at <ipython-input-1-cb5450d36ccb>:3>>

# Concurrency with Futures (c16)

###### Sequential download example

In [3]:
import os
import time
import sys

import requests

POP20_CC = ('CN IN US ID BR PK NG BD RU JP '
           'MX PH VN ET EG DE IR TR CD FR').split()

BASE_URL = 'http://flupy.org/data/flags'

DEST_DIR = 'Test/'

def save_flag(img, filename):
    """
    Save image as file
    
    :param img: byte sequence of image
    :param filename: target file name, dir path is given as BASE_URL
    """
    path = os.path.join(DEST_DIR, filename)
    with open(path, 'wb') as fp:
        fp.write(img)
        
def get_flag(cc):
    """
    Give country code, build URL and download image as byte sequence.
    
    :param cc: country code
    """
    url = '{}/{cc}/{cc}.gif'.format(BASE_URL, cc=cc.lower())
    resp = requests.get(url)
    return resp.content

def show(text):
    """
    Display country code in one line
    """
    print(text, end=' ')
    sys.stdout.flush()

def download_many(cc_list):
    """
    Given list of country code, download and save flag image of each country.
    """
    for cc in sorted(cc_list):
        image = get_flag(cc)
        show(cc)
        save_flag(image, cc.lower() + '.gif')
        
    return len(cc_list)

def main(download_many):
    t0 = time.time()
    count = download_many(POP20_CC)
    elapsed = time.time() - t0
    msg = '\n{} flags downloaded in {:.2f}s'
    print(msg.format(count, elapsed))
    
if __name__ == '__main__':
    main(download_many)

BD BR CD CN DE EG ET FR ID IN IR JP MX NG PH PK RU TR US VN 
20 flags downloaded in 2.27s


###### Threaded version - using ThreadPoolExecutor.map

In [4]:
# example 17-3

from concurrent import futures

MAX_WORKERS = 20


def download_one(cc):
    image = get_flag(cc)
    show(cc)
    save_flag(image, cc.lower() + '.gif')

    return cc


def download_many(cc_list):
    workers = min(MAX_WORKERS, len(cc_list))
    with futures.ThreadPoolExecutor(workers) as executor:
        res = executor.map(download_one, sorted(cc_list))
        
    return len(list(res))


if __name__ == '__main__':
    main(download_many)

BR BDEGDEIDCNFRMXPK RUNGINTRCDETIRJPVNUSPH                  
20 flags downloaded in 0.23s


###### Threaded version - using ThreadPoolExecutor.submit and futures.as_completed

In [7]:
def download_many(cc_list):
    cc_list = cc_list[:5]
    with futures.ThreadPoolExecutor(max_workers=3) as executor:
        to_do = []
        for cc in sorted(cc_list):
            future = executor.submit(download_one, cc)
            to_do.append(future)
            msg = 'Scheduled for {}: {}'
            print(msg.format(cc, future))
            
        results = []
        for future in futures.as_completed(to_do):
            res = future.result()
            msg = '{} result: {!r}'
            print(msg.format(future, res))
            results.append(res)
            
    return len(results)

In [9]:
if __name__ == '__main__':
    main(download_many)

Scheduled for BR: <Future at 0x2b97e20ba58 state=running>
Scheduled for CN: <Future at 0x2b97e20bf98 state=running>
Scheduled for ID: <Future at 0x2b97e20b6d8 state=running>
Scheduled for IN: <Future at 0x2b97cb24da0 state=pending>
Scheduled for US: <Future at 0x2b97e1cbf28 state=pending>
ID BRCN<Future at 0x2b97e20b6d8 state=finished returned str> result: 'ID'  
<Future at 0x2b97e20ba58 state=finished returned str> result: 'BR'
<Future at 0x2b97e20bf98 state=finished returned str> result: 'CN'
IN <Future at 0x2b97cb24da0 state=finished returned str> result: 'IN'
US <Future at 0x2b97e1cbf28 state=finished returned str> result: 'US'

5 flags downloaded in 1.01s


###### more example about ThreadPoolExecutor.map

In [11]:
from time import sleep, strftime
from concurrent import futures


def display(*args):
    print(strftime('[%H:%M:%S]'), end=' ')
    print(*args)
    
def loiter(n):
    msg = '{}loiter({}): doing nothing for {}s...'
    display(msg.format('\t'*n, n, n))
    sleep(n)
    msg = '{}loiter({}): done.'
    display(msg.format('\t'*n, n))
    return n * 10

def main():
    display('Script starting.')
    executor = futures.ThreadPoolExecutor(max_workers=3)
    results = executor.map(loiter, range(5))
    display('results:', results)
    display('Waiting for individual results:')
    for i, result in enumerate(results):
        display('result {}: {}'.format(i, result))
        
main()

[18:24:24] Script starting.


TypeError: __init__() got an unexpected keyword argument 'max_worker'