# 1. 序列类型概述  
容器序列  
　　 list、 tuple 和 collections.deque 这些序列能存放不同类型的数据。  
扁平序列  
　　 str、 bytes、 bytearray、 memoryview 和 array.array，这类序列只能容纳一种类型。  
可变序列  
　　 list、 bytearray、 array.array、 collections.deque 和 memoryview。  
不可变序列
　　 tuple、 str 和 bytes。  

# 2. 列表推导和生成

列表推导试使用[]作为语句  

Tips：  
* 只用列表推导来创建新的列表，并且尽量保持简短
* Python 会忽略代码里 []、 {} 和 () 中的换行，可以省略续行符\
* filter/map函数基本可是使用列表推导式替代

In [225]:
color = ('r','g','b')
size = ('l','xl','xxl')

生成2个列表的所有组合

In [226]:
color_size = [(c, s) for c in color for s in size]
print(color_size)

[('r', 'l'), ('r', 'xl'), ('r', 'xxl'), ('g', 'l'), ('g', 'xl'), ('g', 'xxl'), ('b', 'l'), ('b', 'xl'), ('b', 'xxl')]


带筛选条件生成组合

In [227]:
rg_size = [(c, s) for c in color if c in ('r','g') for s in size]
print(rg_size)

[('r', 'l'), ('r', 'xl'), ('r', 'xxl'), ('g', 'l'), ('g', 'xl'), ('g', 'xxl')]


列表生成器  
生成器表达式的语法跟列表推导差不多，只不过把方括号换成圆括号而已。

In [228]:
c_s_iter = ((c, s) for c in color for s in size)
print(c_s_iter)
for item in c_s_iter:
    print(item)

<generator object <genexpr> at 0x0000000004F43FC0>
('r', 'l')
('r', 'xl')
('r', 'xxl')
('g', 'l')
('g', 'xl')
('g', 'xxl')
('b', 'l')
('b', 'xl')
('b', 'xxl')


# 3. 元组  
Tips：  
* % 格式运算符能被匹配到对应的元组元素上。
* for 循环可以分别提取元组里的元素，也叫作拆包（ unpacking）
* 我们不总是对元组里所有的数据都感兴趣， _ 占位符能帮助处理
* 用 namedtuple 构建的类的实例所消耗的内存跟元组是一样的

元组可是使用拆包平行赋值  
Tips：  
* 元组拆包可以应用到任何可迭代对象上
* 被可迭代对象中的元素数量必须要跟接受这些元素的元组的空档数一致。除非我们用 * 来表示忽略多余的元素
* 用\*来处理剩下的元素,\* 前缀只能用在一个变量名前面，但是这个变量可以出现在赋值表达式的任意位置
* \_占位符能帮助处理不感兴趣位置的元素

In [229]:
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
city, _, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
city,*_ = ('Tokyo', 2003, 32450, 0.66, 8014)
*others, area = ('Tokyo', 2003, 32450, 0.66, 8014)

具名元组  
collections.namedtuple 是一个工厂函数，它可以用来构建一个带字段名的元组和一
个有名字的类——这个带名字的类对调试程序有很大帮助。

In [230]:
from collections import namedtuple
# help(namedtuple)

In [231]:
Point = namedtuple('Point','x y')
p1 = Point(0,0)
p2 = Point(1,2)
print(p1, p2)

Point(x=0, y=0) Point(x=1, y=2)


具名元组和普通元组具有相同的特性和操作，并且具名元组可以通过属性访问

In [232]:
print((p2.x**2 + p2.y**2)**0.5)

2.23606797749979


# 4. 切片  
Tips:  
* 切片和区间会忽略最后一个元素
* s[a:b:c] 的形式对 s 在 a 和 b 之间以 c 为间隔取值。
* 使用slice切片对象对切片赋值
* 对 seq[start:stop:step] 进行求值的时候， Python 会调用seq.\_getitem\_(slice(start, stop, step))

In [233]:
a = list(range(10))
a[1:5:2]

[1, 3]

多维切片会以元组的形式调用\_getitem\_ 如下错误说明此情况

In [234]:
# a[1:4,:]

使用切片对象

In [235]:
sl = slice(1,10,2)
a[sl]

[1, 3, 5, 7, 9]

使用slice.indices可以根据len计算一个适合的slice

In [236]:
slice_ = slice(1,20,2)
slice_.indices(len(a))

(1, 10, 2)

# 5. 对序列使用+/*

通常 + 号两侧的序列由相同类型的数据所构成，在拼接的过程中，两个被操作的序列都不会被修改， Python 会新建一个包含同样
类型数据的序列来作为拼接的结果。

In [237]:
a = [1,2,3]
b = [4,5,6]
a+b

[1, 2, 3, 4, 5, 6]

相加的必须是相同类型

In [238]:
# a + (4,5,6)

把一个序列复制几份然后再拼接起来，更快捷的做法是把这个序列乘以一个整数。  
Tips:  
你想用my_list = [[]] * 3 来初始化一个由列表组成的列表，但是你得到的列表里包含的 3 个元素其实是 3 个引用，而且这 3 个引用指向的都是同一个列表。

In [239]:
a*3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

In [240]:
ll = [[1,2]]
lll = ll*3
print(lll)

[[1, 2], [1, 2], [1, 2]]


In [241]:
ll[0][0]=2
print(lll)

[[2, 2], [2, 2], [2, 2]]


# 6. 序列增量赋值

增量赋值运算符 += 和 \*= 的表现取决于它们的第一个操作对象。  
+= 背后的特殊方法是 \__iadd\__ （用于“就地加法”）。但是如果一个类没有实现这个方法的话， Python 会退一步调用 \__add\__ 。  
若是可变对象一般是原地操作，不可变对象会创建新的对象赋值给原引用。

In [242]:
l = [1,2,3]
print(id(l))
l*=2
print(id(l))

83592392
83592392


In [243]:
t = (1,2,3)
print(id(t))
t*=2
print(id(t))

83422232
82584488


str 是一个例外，因为对字符串做 += 实在是太普遍了，所以 CPython 对它做了优化。为 str 初始化内存的时候，程
序会为它留出额外的可扩展空间，因此进行增量操作的时候，并不会涉及复制原有字符串到新位置这类操作。

下面是元组内存放可变对象时的奇怪错误，可以看到抛出了异常并且元组内可变对象也改变了

In [244]:
t = (1,2,[3,4])
# t[2]+=[5]

In [245]:
t

(1, 2, [3, 4])

* 不要把可变对象放在元组里面。
* 增量赋值不是一个原子操作。我们刚才也看到了，它虽然抛出了异常，但还是完成了操作。

# 7. list.sort和sorted

list.sort 方法会就地排序列表，也就是说不会把原列表复制一份。  
sorted，它会新建一个列表作为返回值。这个方法可以接受任何形式的可迭代对象作为参数，甚至包括不可变序列或生成器

In [246]:
help(list.sort)

Help on method_descriptor:

sort(...)
    L.sort(key=None, reverse=False) -> None -- stable sort *IN PLACE*



In [247]:
help(sorted)

Help on built-in function sorted in module builtins:

sorted(iterable, /, *, key=None, reverse=False)
    Return a new list containing all items from the iterable in ascending order.
    
    A custom key function can be supplied to customize the sort order, and the
    reverse flag can be set to request the result in descending order.



In [248]:
import random
a = [random.random() for i in range(10)]
print(a)

[0.30132111816664287, 0.7929735349820122, 0.9775556705178039, 0.3821434936870234, 0.252595908848107, 0.9661908046426023, 0.14930423939253645, 0.06227748641507447, 0.9878212072397357, 0.08245033284713732]


In [249]:
b = sorted(a)
print(a)
print(b)

[0.30132111816664287, 0.7929735349820122, 0.9775556705178039, 0.3821434936870234, 0.252595908848107, 0.9661908046426023, 0.14930423939253645, 0.06227748641507447, 0.9878212072397357, 0.08245033284713732]
[0.06227748641507447, 0.08245033284713732, 0.14930423939253645, 0.252595908848107, 0.30132111816664287, 0.3821434936870234, 0.7929735349820122, 0.9661908046426023, 0.9775556705178039, 0.9878212072397357]


In [250]:
a.sort()
print(a)

[0.06227748641507447, 0.08245033284713732, 0.14930423939253645, 0.252595908848107, 0.30132111816664287, 0.3821434936870234, 0.7929735349820122, 0.9661908046426023, 0.9775556705178039, 0.9878212072397357]


In [251]:
fruits = ['grape', 'raspberry', 'apple', 'banana']
sorted(fruits)

['apple', 'banana', 'grape', 'raspberry']

以长度排序

In [252]:
sorted(fruits, key=len)

['grape', 'apple', 'banana', 'raspberry']

以最后一个字符的倒序排序

In [253]:
sorted(fruits, key = lambda item:item[-1], reverse=True)

['raspberry', 'grape', 'apple', 'banana']

# 8. 用bisect来管理已排序的序列

In [254]:
import bisect
dir(bisect)

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'bisect',
 'bisect_left',
 'bisect_right',
 'insort',
 'insort_left',
 'insort_right']

In [255]:
help(bisect.bisect_right)

Help on built-in function bisect_right in module _bisect:

bisect_right(...)
    bisect_right(a, x[, lo[, hi]]) -> index
    
    Return the index where to insert item x in list a, assuming a is sorted.
    
    The return value i is such that all e in a[:i] have e <= x, and all e in
    a[i:] have e > x.  So if x already appears in the list, i points just
    beyond the rightmost x already there
    
    Optional args lo (default 0) and hi (default len(a)) bound the
    slice of a to be searched.



In [256]:
a = [random.randint(0,10) for i in range(10)]
a.sort()
print(a)

[1, 1, 2, 3, 3, 4, 4, 5, 7, 7]


bisect.bisect等价于bisect_right，第一个参数为已排序序列，返回index，index之前的元素均<=第二个参数

In [257]:
bisect.bisect(a,4)

7

In [258]:
help(bisect.bisect_left)

Help on built-in function bisect_left in module _bisect:

bisect_left(...)
    bisect_left(a, x[, lo[, hi]]) -> index
    
    Return the index where to insert item x in list a, assuming a is sorted.
    
    The return value i is such that all e in a[:i] have e < x, and all e in
    a[i:] have e >= x.  So if x already appears in the list, i points just
    before the leftmost x already there.
    
    Optional args lo (default 0) and hi (default len(a)) bound the
    slice of a to be searched.



bisect_left，第一个参数为已排序序列，返回index，index之前的元素均<第二个参数

In [259]:
bisect.bisect_left(a,4)

5

bisect 可以用来建立一个用数字作为索引的查询表格，比如说把分数和成绩 对应起来

In [260]:
def grade(score, breakpoints=(60, 70, 80, 90), grades='FDCBA'):
    i = bisect.bisect(breakpoints, score)
    return grades[i]
[grade(score) for score in [33, 99, 77, 70, 89, 90, 100]]

['F', 'A', 'C', 'C', 'B', 'A', 'A']

用bisect.insort插入新元素

In [261]:
help(bisect.insort_right)

Help on built-in function insort_right in module _bisect:

insort_right(...)
    insort_right(a, x[, lo[, hi]])
    
    Insert item x in list a, and keep it sorted assuming a is sorted.
    
    If x is already in a, insert it to the right of the rightmost x.
    
    Optional args lo (default 0) and hi (default len(a)) bound the
    slice of a to be searched.



bisect.insort_right 与 bisect.bisect_right基本一致，不同点是在相应位置插入元素

In [262]:
a = [i for i in range(10)]
bisect.insort(a, 5)
print(a)

[0, 1, 2, 3, 4, 5, 5, 6, 7, 8, 9]


lo和hi2个参数限制了查找范围，默认lo为0，hi为len函数返回值

In [263]:
a = [i for i in range(10)]
bisect.insort(a, 5, lo=0, hi=3)
print(a)

[0, 1, 2, 5, 3, 4, 5, 6, 7, 8, 9]


# 9. 列表外其他选择

虽然列表既灵活又简单，但面对各类需求时，我们可能会有更好的选择。比如，要存放
1000 万个浮点数的话，数组（ array）的效率要高得多，因为数组在背后存的并不是
float 对象，而是数字的机器翻译，也就是字节表述。这一点就跟 C 语言中的数组一
样。  
再比如说，如果需要频繁对序列做先进先出的操作， deque（双端队列）的速度应该会更快。  
如果在你的代码里，包含操作（比如检查一个元素是否出现在一个集合中）的
频率很高，用 set（集合）会更合适。 set 专为检查元素是否存在做过优化。但是它
并不是序列，因为 set 是无序的。

- 数组array.array

In [264]:
from array import array
# help(array)

In [265]:
floats = array('d', (random.random() for i in range(10**7))) 

In [266]:
len(floats)

10000000

In [267]:
with open('floats.bin','wb') as f:
    floats.tofile(f)

In [268]:
# help(array.fromfile)

In [269]:
floats2 = array('d')
with open('floats.bin','rb') as f: 
    floats2.fromfile(f,10**7)
len(floats2)

10000000

可以查看数组存储的typecode

In [270]:
floats.typecode

'd'

- 内存视图memoryview  
memoryview 是一个内置类，它能让用户在不复制内容的情况下操作同一个数组的不同切片。 

In [271]:
# help(memoryview)

In [272]:
numbers = array('h', [-2, -1, 0, 1, 2])
memv = memoryview(numbers)

memoryview.cast 会把同一块内存里的内容打包成一个全新的 memoryview 对象给你。

In [273]:
memv_oct = memv.cast('B')
print(memv_oct.tolist())

[254, 255, 255, 255, 0, 0, 1, 0, 2, 0]


- 双向队列和其他形式队列

collections.deque 类（双向队列）是一个线程安全、可以快速从两端添加或者删除元
素的数据类型。而且如果想要有一种数据类型来存放“最近用到的几个元素”， deque 也是
一个很好的选择。这是因为在新建一个双向队列的时候，你可以指定这个队列的大小，如
果这个队列满员了，还可以从反向端删除过期的元素，然后在尾端添加新的元素。

queue  
　　提供了同步（线程安全）类 Queue、 LifoQueue 和 PriorityQueue，不同的线程可
以利用这些数据类型来交换信息。这三个类的构造方法都有一个可选参数 maxsize，它
接收正整数作为输入值，用来限定队列的大小。但是在满员的时候，这些类不会扔掉旧的
元素来腾出位置。相反，如果队列满了，它就会被锁住，直到另外的线程移除了某个元素
而腾出了位置。这一特性让这些类很适合用来控制活跃线程的数量。

multiprocessing  
　　这个包实现了自己的 Queue，它跟 queue.Queue 类似，是设计给进程间通信用的。
同时还有一个专门的 multiprocessing.JoinableQueue 类型，可以让任务管理变得更
方便。

asyncio  
　　 Python 3.4 新提供的包，里面有 Queue、 LifoQueue、 PriorityQueue 和
JoinableQueue，这些类受到 queue 和 multiprocessing 模块的影响，但是为异步编
程里的任务管理提供了专门的便利。

heapq  
跟上面三个模块不同的是， heapq 没有队列类，而是提供了 heappush 和 heappop
方法，让用户可以把可变序列当作堆队列或者优先队列来使用。

In [274]:
import heapq
# help(heapq)

将一个list原地转换为符合小顶堆

In [275]:
a = [random.randint(0,10) for i in range(10)]
heapq.heapify(a)
print(a)
for i in range(10):
    print(heapq.heappop(a))

[2, 3, 2, 6, 5, 8, 9, 7, 8, 5]
2
2
3
5
5
6
7
8
8
9
