# 一、切片

### 取 list 或 tuple 的部分元素是一种非常常见的操作（切片时， list 和 tuple 的操作是相同的）。ex：

In [6]:
L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']

# 取列表 L 的前三个元素并打印出来
# 1.方法一：一个一个取（很笨拙，取前N个元素的话，代码会很长，效率太低）
print(L[0],L[1],L[2])  

# 2.方法二：用循环，想取多少取多少，但是代码需要好几行，不够简洁
a = []
n = 3
for i in range(3):
    a.append(L[i])
print(a)

# 3.方法三：使用切片，一行代码完成 取连续的N个元素 的操作
## L[0:3]表示：从索引0开始取，直到索引3为止，但不包括索引3。即索引0，1，2，正好是3个元素（如果第一个索引是0，还可以省略）
print(L[0:3])
print(L[:3])      # 同上面的代码结果一样

# 4.Python支持L[-1]取倒数第一个元素，那么它同样支持倒数切片
print(L[-3:])             # 取倒数的三个元素,-3,-2,-1

Michael Sarah Tracy
['Michael', 'Sarah', 'Tracy']
['Michael', 'Sarah', 'Tracy']
['Michael', 'Sarah', 'Tracy']
['Tracy', 'Bob', 'Jack']


In [10]:
# 按间隔取列表中的元素：生成一个 1-100 的长度为100的列表，取其中奇数位置上的元素，即：1,3，...97,99位置上的元素
test_list = list(range(1,101))
print(test_list[::2])

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99]


# 二、迭代

### 如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）。

### 在Python中，迭代是通过for ... in ...来完成的。虽然list和tuple这种数据类型有下标，其他很多的数据类型没有下标，但是，只要是可迭代对象，无论有无下标，都可以迭代，比如dict就可以迭代：

In [12]:
test_d = {'name':'QingCai','age':3,'address':'KunMing','province':'Yunnan'}
# dict的存储不是按照list的方式顺序排列,所以,迭代出的结果顺序很可能不一样.默认情况下,dict迭代的是key
for key in test_d:  
    print(test_d[key])

QingCai
3
KunMing
Yunnan


In [14]:
# 如果要迭代value,可以用for value in d.values();如果要同时迭代key和value;可以用for k, v in d.items()
for value in test_d.values():
    print(value)

for key, value in test_d.items():
    print("{}:{}".format(key,value))

QingCai
3
KunMing
Yunnan
name:QingCai
age:3
address:KunMing
province:Yunnan


In [15]:
# 由于字符串也是可迭代对象，因此，也可以作用于for循环
for s in 'ABCDEF':
    print(s)

A
B
C
D
E
F


### 综上所述:当我们使用for循环时,只要作用于一个可迭代对象,for循环就可以正常运行,而我们不太关心该对象究竟是list还是其他数据类型.
### 在python中,可通过collections模块的Iterable类型来判断一个对象是否可进行迭代

In [19]:
from collections import Iterable
print('asdfadgg是可迭代对象：',isinstance('asdfadgg',Iterable))
print('[1,2,3,4,5]是可迭代对象：',isinstance([1,2,3,4,5],Iterable))
print('121345是可迭代对象：',isinstance(121345,Iterable))

asdfadgg是可迭代对象： True
[1,2,3,4,5]是可迭代对象： True
121345是可迭代对象： False


### list要实现下标循环怎么办？Python内置的enumerate函数可以把一个list变成索引-元素对，这样就可以在for循环中同时迭代索引和元素本身：

In [20]:
for i,value in enumerate(['a','b','c','d','e']):
    print(i,value)

0 a
1 b
2 c
3 d
4 e


# 三、列表生成式

### 列表生成式是Python内置的非常简单却强大的可以用来创建list的生成式。ex: 创建列表[1,2,3,4,5,6,7,8]

In [23]:
list(range(1,9))

[1, 2, 3, 4, 5, 6, 7, 8]

In [26]:
list(range(1,50))             # 获取 1-50之间的奇数

[1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31,
 32,
 33,
 34,
 35,
 36,
 37,
 38,
 39,
 40,
 41,
 42,
 43,
 44,
 45,
 46,
 47,
 48,
 49]

### 如果要生成[1x1, 2x2, 3x3, ..., 10x10]，如何做？

In [31]:
# 方法一：老办法
b = []
for i in range(1,11):
    b.append(i**2)
print(b)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


In [30]:
# 方法二：循环太繁琐，而列表生成式则可以用一行语句代替循环生成上面的lis:
[i**2 for i in range(1,11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [34]:
# 写列表生成式时,把要生成的元素 x*x 放到前面,后面跟for循环,可以把list创建出来,十分有用.
# for循环后面还可以加上if判断,这样我们就可以筛选出仅偶数的平方.ex:
[x*x for x in range(1,11) if x%2==0]

[4, 16, 36, 64, 100]

In [38]:
# 还可使用多层循环，但是三层及以上就很少见了
print([m+n for m in 'ABC' for n in 'XYZ'])           # 可对每一个 m 和 n 进行其他的操作
print([(m+n).lower() for m in 'ABC' for n in 'XYZ']) # 将输出的英文字符串全部转换为小写输出.只用纯字母的字符串才可以使用lower()和upper()函数

['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
['ax', 'ay', 'az', 'bx', 'by', 'bz', 'cx', 'cy', 'cz']


In [44]:
print([(m+n+p).lower().title() for m in 'ABC' for n in 'XYZ' for p in 'you']) # 仅首字母大小，其余均小写

['Axy', 'Axo', 'Axu', 'Ayy', 'Ayo', 'Ayu', 'Azy', 'Azo', 'Azu', 'Bxy', 'Bxo', 'Bxu', 'Byy', 'Byo', 'Byu', 'Bzy', 'Bzo', 'Bzu', 'Cxy', 'Cxo', 'Cxu', 'Cyy', 'Cyo', 'Cyu', 'Czy', 'Czo', 'Czu']


# 四、生成器

### 通过列表生成式，我们可以直接创建一个列表。由于受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。所以，如果列表元素可以按照$某种算法$推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器：generator

### 1、创建generator，方法一：把一个列表生成式的$[ ]$改成$( )$

In [69]:
L = [x * x for x in range(10) if x%2==0]
print(L)
g = (x * x for x in range(10) if x%2==0)
print(g)

[0, 4, 16, 36, 64]
<generator object <genexpr> at 0x000000FCB9989150>


#### 创建 L 和 g 的区别仅在于最外层的$[]$和$()$，L是一个list，而g是一个generator。读取 L 和 g 中元素的方式也有所不同，要读取 generator 中的元素，需要使用$next()$函数

In [62]:
next(g)

0

In [63]:
next(g)

4

In [64]:
next(g)

16

In [65]:
next(g)

36

In [66]:
next(g)

64

In [67]:
next(g)

StopIteration: 

#### generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误.当然,上面这种不断调用next(g)实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:

In [70]:
for value in g:
    print(value)

0
4
16
36
64


#### 所以,我们创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。比如,著名的斐波拉契数列（Fibonacci）,除第一个和第二个数外,任意一个数都可由前两个数相加得到：1, 1, 2, 3, 5, 8, 13, 21, 34, ...斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:

In [80]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        print(b)
        a, b = b, a + b
        n = n + 1
    return 'done'

In [81]:
# 上面的函数可以输出斐波那契数列的前N个数
fib(5)            # 输出斐波那契数列前5个数

1
1
2
3
5


'done'

#### 仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的$推算规则$,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator.也就是说,上面的函数和generator仅一步之遥.
#### 要把fib函数变成generator,只需要把print(b)改为yield b就可以了

### 2、创建generator，方法二：如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator

In [84]:
def fib_genetator(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b         # print(b)
        a, b = b, a + b
        n = n + 1
    return 'done'

In [85]:
fib_g = fib_genetator(5)

In [86]:
next(fib_g)

1

In [87]:
next(fib_g)

1

In [88]:
next(fib_g)

2

In [89]:
next(fib_g)

3

In [90]:
next(fib_g)

5

In [91]:
next(fib_g)

StopIteration: done

#### 在上述代码中,最难理解的就是generator和函数的执行流程不一样.函数是顺序执行,遇到return语句或者最后一行函数语句就返回.而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行.第一次执行到 yield b时,返回此时b的值并暂停该程序；第二次执行代码时,从a,b = b,a+b开始执行,循环到 yield b时,返回此时b的值并在此暂停...如此循环到条件不在满足时停止

# 五、迭代器

### 我们已经知道，可以直接作用于for循环的数据类型有以下几种：
### 一类是集合数据类型，如list、tuple、dict、set、str等；
### 一类是generator，包括生成器和带yield的generator function。
### 这些可以直接作用于for循环的对象统称为可迭代对象：Iterable。
### 可以使用isinstance()判断一个对象是否是Iterable对象

In [92]:
from collections import Iterable

In [93]:
isinstance([], Iterable)

True

In [94]:
isinstance({}, Iterable)

True

In [95]:
isinstance('abc', Iterable)

True

In [96]:
isinstance((x for x in range(10)), Iterable)

True

In [97]:
isinstance(100, Iterable)

False

### 但生成器不但可以作用于for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值了.可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator.
### 可以使用isinstance()判断一个对象是否是Iterator对象

In [98]:
from collections import Iterator

In [99]:
isinstance((x for x in range(10)), Iterator)

True

In [100]:
isinstance([], Iterator)

False

In [101]:
isinstance({}, Iterator)

False

In [102]:
isinstance('abc', Iterator)

False

#### 生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator。
#### 把list、dict、str等Iterable变成Iterator可以使用iter()函数

In [103]:
isinstance(iter([]), Iterator)

True

In [104]:
isinstance(iter('abc'), Iterator)

True

### 小结:
#### 凡是可作用于for循环的对象都是Iterable类型；
#### 凡是可作用于next()函数的对象都是Iterator类型，它们表示一个惰性计算的序列；
#### 集合数据类型如list、dict、str等是Iterable但不是Iterator，不过可以通过iter()函数获得一个Iterator对象。
#### Python的for循环本质上就是通过不断调用next()函数实现的