# I 迭代器

## 1. 函数名的运用
- 函数名是一个特殊的变量，与括号（） 配合可以执行函数的变量。

### 1）函数名的内存地址

In [3]:
def func1():
    print("Hello World!")

print(func1)

<function func1 at 0x000001F24FB3F670>


### 2）函数名可以赋值给其他变量

In [5]:
def func2():
    print(func2)

# 把函数当成一个值赋给另一个变量
a = func2

# 函数调用 func2()
a()

<function func2 at 0x000001F24FE4BB80>


### 3）函数名可以当做容器类的元素

In [6]:
def func3():
    print(func3)

In [7]:
func_list = [func1, func2, func3]

for func in func_list:
    func()

Hello World!
<function func2 at 0x000001F24FE4BB80>
<function func3 at 0x000001F24FE4B940>


### 4）函数名可以当做函数的参数

In [10]:
def func41():
    print("this is func41")

def func42(func):
    print("func42 start")
    
    # 执行传递的func
    func()
    
func42(func41)

func42 start
this is func41


### 5）函数可以作为函数的返回值

In [11]:
def func_1():
    print("this is func_1")
    
    def func_2():
        print("this is func_2")
    
    return func_2

# 执行func_1，返回的是func_2
# 此时，fn 返回的是func_2
fn = func_1()

this is func_1


In [13]:
# 执行 func_2
fn()

this is func_2


In [12]:
fn

<function __main__.func_1.<locals>.func_2()>

## 闭包（closure）
- 闭包就是内层函数对外层函数（非全局）的变量的引用。

In [14]:
def func1():
    name = "messi"
    
    def func2():
        print(name)
        # 闭包
        
    func2()
    
    
func1()

messi


### 1）检测闭包
- 可以使用 `func.__closure__` 来检测函数是否是闭包。
- 若返回 cell 则为闭包；返回None则不是闭包

In [17]:
def func1():
    msg = "check closure"
    
    def func2():
        print(msg)
        # 闭包

    func2()
    print(func2.__closure__)
    
    
func1()

check closure
(<cell at 0x000001F24FD728B0: str object at 0x000001F24FE8DE30>,)


以上实现方式存在一个问题：只能先执行func1才能执行func2，如果想在外边调用，可以将内部的函数名当做参数，作为外部函数的返回值，这样可以返回外部函数的调用者。

In [20]:
def outer():
    
    msg = "this is outer"
    
    def inner():
        print("run inner")
        print("call msg:", msg)
        
    return inner


# 访问外部函数，获取内部函数的函数地址
fn = outer()

# 访问外部函数
fn()

run inner
call msg: this is outer


<font color=red>**在闭包中，如果变量被销毁了，则内部函数将不能正常执行。所以Python规定：如果在内部函数访问了外部函数中的变量，那么这个变量将一直存在于内存中。这样做的好处是：闭包的作用就是让一个变量能够常驻内存，供后面的程序使用。**</font>

## 3. 迭代器

### 1）可迭代对象（iterable）
- str
- list
- dict
- tuple
- set

### 2）dir查看对象的方法和函数
- ` '__iter__'` 表示这个类型为可迭代对象

In [21]:
msg = 'display obj method and function'

dir(msg)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',


### 3）isinstence()函数查看对象类型

- `collections` 模块实现了特定目标的容器，以提供Python标准内建容器 dict , list , set , 和 tuple 的替代选择。
- docs: https://docs.python.org/zh-cn/3/library/collections.html

---
- `isinstance()` 函数来判断一个对象是否是一个已知的类型，类似 `type()`。
- docs:https://www.runoob.com/python/python-func-isinstance.html
- isinstance() 与 type() 区别：
    - type() 不会认为子类是一种父类类型，不考虑继承关系。
    - isinstance() 会认为子类是一种父类类型，考虑继承关系。
- 如果要判断两个类型是否相同推荐使用 isinstance()。

---
- `isinstance(object, classinfo)`
    - `object` -- 实例对象。
    - `classinfo` -- 可以是直接或间接类名、基本类型或者由它们组成的元组。

In [36]:
a = 100
print(isinstance(a, (int,str,list)))

True


In [26]:
from collections import Counter

In [24]:
from collections.abc import Iterable
from collections.abc import Iterator

In [22]:
lst = [2,0,2,1,4,1,5]

In [30]:
# 查看是不是可迭代对象
print(isinstance(lst, Iterable))

True


In [31]:
# 查看是不是迭代器
print(isinstance(lst, Iterator))

False


**<font color=red>如果对象中有 `__iter__()`函数,则认为这个对象遵守可迭代协议.就可以获取到相应的迭代器.</font>**

In [35]:
# 获取迭代器
lst_iter = lst.__iter__()

print(lst_iter)
print(isinstance(lst_iter, Iterator))

<list_iterator object at 0x000001F250F754C0>
True


`__iter__()` 是获取对象的迭代器.迭代器中的 `__next__()` 获取一个迭代器的元素

### 4）使用while循环和迭代器模拟for循环
- for循环机制：使用__next__() 获取迭代器，每次获取元素都通过__next__()实现；当遇到StopIteration则结束循环。

In [39]:
lst = [2021,4,15,18,30]

# 获取迭代器
l = lst.__iter__()
''
while True:
    try:
        i = l.__next__()
        print(i)
        
    except StopIteration:
        break

2021
4
15
18
30


### 5）迭代器 类
- 迭代器类型的定义：
- 内部包含 __iter__() 和 __next__() 方法
- `__iter__`方法返回对象本身，即self
- `__next__`方法返回下一个数据，如果没有数据了，则抛出StopIteration异常！

### **可迭代对象：如果一个类中有 `__iter__()` 方法且返回一个【迭代器对象】，则称以这个类创建的对象为可迭代对象。**
### **可迭代对象可以使用for进行循环，在循环的内部其实是先执行 `__iter__()` 方法，获取其迭代器对象，然后在内部执行这个迭代器对象的 `__next__()` 方法 ，逐步取值。**

In [83]:
# 迭代器类
class Iter(object):
    def __init__(self, num):
        self.num = num
        self.counter = -1
    
    def __iter__(self):
        return self
    
    def __next__(self):
        self.counter += 1
        if self.counter == self.num:
            
            raise StopIteration()
            
        return self.counter

In [88]:
class Foo(object):
    def __init__(self, num):
        self.num = num
    def __iter__(self):
        # 返回一个迭代器类
        return Iter(self.num)

In [90]:
# 可迭代对象
obj_iter = Foo(10)

# 循环可迭代对象
for item in obj_iter:
    print(item)

0
1
2
3
4
5
6
7
8
9


## Summary

- Iterable：可迭代对象，内部包含 `__iter__()` 函数
- Iterator：迭代器，内部包含 `__iter__()` 和 `__next__()` 函数

迭代器的特点：
1. 节省内存
2. 惰性机制
3. 不能反复，只能向下执行

<font color=red>**可以把迭代的内容当做子弹。获取到迭代器__iter__()就把子弹都装入弹夹，然后发射就是通过__next__()把子弹（元素）打出去.**</font>

## ---------------------------------------------------------------------------------

# II 生成器

python中获取生成器的两种方法：
1. 通过生成器函数
2. 各种推导式


In [4]:
def func1():
    print("run func")
    
    return 2021

func1()

run func


2021

## 1. 生成器

### 1）定义

In [5]:
# 添加 yield 变为生成器

def func2():
    print("run func")
    
    yield 2021

# 这个时候函数不会执⾏，而是创建一个生成器
func2()

<generator object func2 at 0x0000022754082430>

### 生成器的本质就是迭代器，可以通过迭代器的方式直接使用生成器！

In [16]:
# 开始执行数据，yield与return一样，也是返回数据
run_func2 = func2().__next__()
print(run_func2)

run func
2021


### 2) 与return的区别
- yield是分段执行一个函数，可以出现多次
- return 是直接停止这个函数，return可以出现多次但是执行到第一个就结束

In [17]:
def func3():
    print('run print 1, then run yield 1 ↓')
    
    yield 'run yield 1'
    
    print('run print 2, then run yield 1 ↓')
    
    yield 'run yield 2'  
    
    print('run print 3, then run yield 1 ↓')
    
    yield 'run yield 3'   

In [26]:
func3_iter = func3()

In [27]:
func3_iter.__next__()

run print 1, then run yield 1 ↓


'run yield 1'

In [28]:
func3_iter.__next__()

run print 2, then run yield 1 ↓


'run yield 2'

In [29]:
func3_iter.__next__()

run print 3, then run yield 1 ↓


'run yield 3'

In [30]:
func3_iter.__next__()

StopIteration: 

### 3）生成器的作用

节省内存！

<font color=blue>**可以想象成做包子卖包子的问题，如果不使用生成器，相当于一次性做出指定数量的包子，放在保温箱保存，等着人来买，既占地方又会导致口感不好；如果使用生成器，就相当于，一边做一边卖，既不占地方又能保证包子的口感。**</font>

In [35]:
def make1(n):
    steamed = []
    
    for i in range(1, n+1):
        steamed.append("包子"+str(i))
    
    return steamed



def make2(n):
    
    for i in range(1, n+1):
        
        yield "包子"+str(i)

In [36]:
eat1 = make1(10)
eat1

['包子1', '包子2', '包子3', '包子4', '包子5', '包子6', '包子7', '包子8', '包子9', '包子10']

In [38]:
# 构造生成器
eat2 = make2(10)
# 开始执行
eat2.__next__()

'包子1'

In [39]:
eat2.__next__()

'包子2'

In [40]:
eat2.__next__()

'包子3'

### 4）send() 方法与 next() 方法对比

- <font color=blue>`send()` 方法是将括号中的内容传给了【上一个 yield】，然后【yield 接收的值就可以赋值给变量】</font>
- send()和next()都可以使得生成器向下走一次
- 在第一执行生成器时，不能直接使用send()，但可以使用send(None)

In [41]:
def make3(n):
    
    for i in range(1, n+1):
        
        a = yield "包子"+str(i)
        print("正在做：", a)
        
        b = yield "馒头"+str(i)
        print("正在做：", b)

In [51]:
eat3 = make3(10)

In [52]:
eat3.__next__()

'包子1'

In [53]:
eat3.__next__()

正在做： None


'馒头1'

In [54]:
eat3.send("窝窝头")

正在做： 窝窝头


'包子2'

In [55]:
eat3.send("煎饼")

正在做： 煎饼


'馒头2'

In [56]:
eat3.__next__()

正在做： None


'包子3'

In [57]:
eat3.__next__()

正在做： None


'馒头3'

### 5）for循环获取生成器内部元素

In [58]:
eat2 = make2(10)

for ele in eat2:
    print(ele)

包子1
包子2
包子3
包子4
包子5
包子6
包子7
包子8
包子9
包子10


## 2. yield from
- yield from 可以直接把可迭代对象中的每一个数据作为生成器的结果进行返回。

In [65]:
def sell1():
    goods = ["老冰棍", "北冰洋", "健力宝", "康师傅"]
    
    yield from goods

In [66]:
buy1 = sell1()
for ele in buy1:
    print(ele)

老冰棍
北冰洋
健力宝
康师傅


**yield from 是将列表中的每一个元素返回, 所以两个yield from 不会产生交替效果**

In [72]:
def sell2():
    goods1 = ["老冰棍", "北冰洋", "健力宝", "康师傅"]
    goods2 = ["大大卷", "干脆面", "大刀肉", "魔芋爽"]
    
    yield from goods1
    print('-' * 16)
    yield from goods2

In [73]:
buy2 = sell2()
for ele in buy2:
    print(ele)

老冰棍
北冰洋
健力宝
康师傅
----------------
大大卷
干脆面
大刀肉
魔芋爽


## 3. 推导式

### 1）列表推导式

In [74]:
lst1 = [i for i in range(1, 10)]
lst1

[1, 2, 3, 4, 5, 6, 7, 8, 9]

### 2）筛选模式

In [76]:
lst2 = [j for j in range(1, 10) if j % 2 == 0]
lst2

[2, 4, 6, 8]

### 3）生成器推导式：与列表推导式的语法基本一致，只是把 `[]` 换成 `()`！

In [77]:
gen = (i for i in range(11, 20))

for ele in gen:
    print(ele)

11
12
13
14
15
16
17
18
19


In [79]:
# 筛选
gen = (i for i in range(11, 20) if i % 2 == 0)

print(gen)

for ele in gen:
    print(ele)

<generator object <genexpr> at 0x00000227552BB200>
12
14
16
18


**列表推导式与生成器推导式的区别：**
1. 列表推导式一次性加载，比较耗内存；而生成器表达式几乎不占用内存，使用时才分配内存；
2. 得到的值不一样，列表推导式得到的是一个列表；而生成器推导式得到的是一个生成器！

<font color=red>**可以想象成，张三想吃鸡蛋，列表推导式就如同张三去超市买一篮子鸡蛋，放家里边；生成器就如同张三买只母鸡，等母鸡下蛋，下一个吃一个。**</font>

### 4）字典推导式

In [81]:
lst1 = ['jj', 'jay', 'eason']
lst2 = ['林俊杰', '周杰伦', '陈奕迅']

dict_comp = {lst1[i]:lst2[i] for i in range(len(lst1))}
dict_comp

{'jj': '林俊杰', 'jay': '周杰伦', 'eason': '陈奕迅'}

### 5）集合推导式
- 集合的特点：无序，不重复，自带去重功能。

In [82]:
lst = [1,1,2,2,3,3,4,4,5,5]

lst_set = {i for i in lst}
lst_set

{1, 2, 3, 4, 5}

没有元组推导式

# Reference
> 1. https://pythonav.com/wiki/detail/1/11/
> 2. https://pythonav.com/wiki/detail/1/12/