<a href="https://colab.research.google.com/github/hwtan3055/Daily-Study-Notebook/blob/main/Python%E5%AD%A6%E4%B9%A0%E6%8C%87%E5%8D%97%20/Python%E5%9F%BA%E7%A1%80/02Python%E8%BF%AD%E4%BB%A3%E5%99%A8%E4%B8%8E%E7%94%9F%E6%88%90%E5%99%A8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 一、Python推导式
Python 推导式是一种强大且简洁的语法，适用于生成列表、字典、集合和生成器。

虽然推导式很方便，但是要注意可读性

### 1、列表推导式
按照复杂程度的不同，有2种格式：
+ `[表达式 for 变量 in 列表] `
+ `[表达式 for 变量 in 列表 if 条件]`

由于python有条件表达式：`value_if_true if condition else value_if_false`，所以第一种列表推导式可以扩展为以下写法
+ `[表达式 if 条件 else 表达式2 for 变量 in 列表 ]`

In [3]:
x = [1,2,3,4]
x2 = [i**2 for i in x]  # 对每个元素做平方生成新列表 [1, 4, 9, 16]
x3 = [i for i in x if i%2==0]   # 筛选列表中的偶数形成新列表 [2, 4]
x4 = ["even" if i%2==0 else "odd" for i in x]   # 打奇偶标记，生成新列表 ['odd', 'even', 'odd', 'even']

print(x2,x3,x4)

[1, 4, 9, 16] [2, 4] ['odd', 'even', 'odd', 'even']


### 2、字典推导式
`{ key_expr: value_expr for value in collection }`

或

`{ key_expr: value_expr for value in collection if condition }`

In [4]:
# 字典推导式举例
scores = [85, 92, 78, 45, 60, 95]
result = {
    f"student_{i}": ("pass" if score >= 60 else "fail", score)
    for i, score in enumerate(scores)
}
print(result)

{'student_0': ('pass', 85), 'student_1': ('pass', 92), 'student_2': ('pass', 78), 'student_3': ('fail', 45), 'student_4': ('pass', 60), 'student_5': ('pass', 95)}


### 3、集合推导式
`{ expression for item in Sequence }`
或
`{ expression for item in Sequence if conditional }`

## 二、Python迭代器和生成器
### 1、迭代器模式
迭代器模式 是一种行为设计模式，它提供了一种方法，使得可以顺序访问一个聚合对象（如列表、集合、字典等）中的各个元素，而又不需要暴露该对象的内部表示。

**为什么需要迭代器模式？**如果没有迭代器模式：
+ 遍历方式与数据结构强耦合，集合类型的底层实现可能是数组、链表、树，都对应着不同的遍历方式。甚至一个集合如果底层实现的数据结构发生更改，所有遍历的代码都要重写
+ 代码重复：每个需要遍历的地方都要写一遍遍历逻辑
+ 违反单一职责原则：一个集合类不应该同时负责存储数据和遍历数据。集合的核心职责是高效地管理数据，而遍历是另一个独立的职责。

迭代器模式的核心目的就是解决上述问题，它将遍历的职责分离出来，让客户端可以用统一的方式处理不同的聚合对象。

#### 2、Python 可迭代对象
一个Python对象要成为可迭代对象，最关键的特点是：它必须实现 `__iter__()` 方法，或者实现 `__getitem__()` 方法

（1） 实现 `__iter__()` 方法：

**工作流程：**当使用 for 循环遍历一个可迭代对象时，Python解释器会首先自动调用该对象的 __iter__() 方法来获取一个迭代器，然后反复调用迭代器的 __next__() 方法来获取下一个值，直到抛出 StopIteration 异常为止。

（2）实现 `__getitem__()` 方法：

如果一个类没有实现 `__iter__()` 方法，但实现了 `__getitem__()` 方法，并且该方法接受从0开始的整数索引（即 obj\[0], obj\[1]... 是有效的），那么Python会尝试按索引顺序遍历它。

**工作流程：**Python会从索引0开始，依次尝试 obj\[0], obj\[1], obj\[2]...，直到索引超出范围并引发 IndexError 异常，遍历停止。

注意，是`__getitem__()` 方法为一个对象提供了按下表索引和切片的能力

In [16]:
# 使用__getitem__遍历的例子
class Iterable_case1:
  def __init__(self):
    self.data = [1,2,3]
  def __getitem__(self, index):
    return self.data[index]

case1 = Iterable_case1()
for i in case1:
  print(i)

print(case1[1:])

1
2
3
[2, 3]


In [17]:
class Iter_case2:
  def __init__(self,Iterable_case):
    self.Iterable_case = Iterable_case
    self.index = 0
  def __next__(self):
    if self.index >= len(self.Iterable_case.data):
      raise StopIteration # 越界要抛出迭代停止的异常
    result = self.Iterable_case.data[self.index]
    self.index += 1
    return result

class Iterable_case2:
  def __init__(self):
    self.data = [1,2,3]
  def __iter__(self):
    return Iter_case2(self)

case2 = Iterable_case2()
for i in case2:
  print(i)

print(case2[1:])  # 不具备切片能力

1
2
3


TypeError: 'Iterable_case2' object is not subscriptable

**可迭代对象的用处：**
+ 可以被for循环
+ 可以被解包
+ 可以用list()、set()等方法转化为基本数据结构

In [19]:
# 演示解包：
a,b,c = case1
print(a,b,c)  # 1 2 3
# 演示转化为基本数据结构
print(list(case1))

1 2 3
[1, 2, 3]


#### 3、生成器

当我们有创建大列表的需求，如创建一个包含100万个元素的列表，而我们对它的使用方法仅仅是遍历，那么不仅占用很大的存储空间，后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器：generator。

**创建生成器的方法：**

（1）最简单的方法：推导式`(expression for item in Sequence [if condition])`

（2）常规方法：当一个函数里面有yield语句的时候，调用该函数就会得到一个生成器对象。每调用一次next方法，就会继续执行，直到遇到yield中断，返回yield生成的值，直到函数返回。

注意：生成器是迭代器的一种！

In [22]:
generator = (i*i for i in [1,2,3,4,5])
print(type(generator))

def fib(max):
  a,b,n = 0,1,0
  while n<max:
    yield b
    a,b = b,a+b
    n+=1
  return "done"

fib_gen = fib(5)
print(type(fib_gen))
for i in fib_gen:
  print(i)

<class 'generator'>
<class 'generator'>
1
1
2
3
5


#### 4、迭代器
迭代器对象从集合的第一个元素开始访问，直到所有的元素被访问完结束。迭代器只能往前不会后退。

迭代器有两个基本的方法：iter() 和 next()。

**这里可能会有一个问题，迭代器不是有next()方法就可以了嘛？为什么也必须要有iter方法：**

解决这个问题需要先明确两个概念：

+ 有`__iter__()`方法的对象是可迭代对象
+ 有`__iter__()`和`__next__()`方法的才是迭代器，所以迭代器一定是可迭代对象；

观察一下python最通用的数据结构list是不是可迭代对象，是不是迭代器：

In [25]:
my_list = [1, 2, 3]

print(hasattr(my_list, '__iter__'))  # True - 有 __iter__ 方法
print(hasattr(my_list, '__next__'))  # False - 没有 __next__ 方法

list_iter = iter(my_list)
print(hasattr(list_iter, '__iter__'))  # True - 有 __iter__ 方法
print(hasattr(list_iter, '__next__'))  # True - 有 __next__ 方法

new_iter = iter(list_iter)
print(id(new_iter) == id(list_iter))  # True - 迭代器返回的迭代器指向自己

True
False
True
True
True


从以上代码中获取的信息：
+ （1）list是一个可迭代对象，但它没有next方法，所以它不是一个迭代器
+ （2）iter(list)的返回值是一个迭代器对象
+ （3）对该迭代器对象继续使用iter获取迭代器，指向的是迭代器自己！

以上问题的答案：这是python刻意为之的一种设计选择，这是为了让迭代器可以在任何可以传入可迭代对象的地方使用。这样就不需要对可迭代对象和迭代器做区分。

In [26]:
def process_items(items):
    for item in items:  # 这里只关心对象是否可迭代
        print(item)

list_obj = [1, 2, 3]
iterator = iter(list_obj)

process_items(list_obj)   # ✓ 可以
process_items(iterator)   # ✓ 也可以！

1
2
3
1
2
3


In [27]:
# 迭代器的使用——for循环的底层原理
a = [1,2,3,4,5]
iter_a = iter(a)
while True:
  try:
    print(next(iter_a))
  except StopIteration:
    break

1
2
3
4
5
