# 1 Tuple（元组）

tuple是长度固定，不可改变的序列。创建元祖的方法是用逗号：

In [1]:
tup = 4, 5, 6
tup

(4, 5, 6)

如果想要创建一个更复杂的tuple的话，还是要用括号，括号之间还是用逗号：

In [4]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

把其他序列或迭代器转换为序列：

In [5]:
tuple([4, 0, 2])

(4, 0, 2)

In [6]:
tup = tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

存放在tuple中的object本身无法更改：

In [7]:
tup = tuple(['foo', [1, 2], True])
tup[2] = False

TypeError: 'tuple' object does not support item assignment

但是如果tuple内部的object是可更改的，那么我们可以试着更改一下：

In [8]:
tup[1].append(3)
tup

('foo', [1, 2, 3], True)

用+来合并多个tuple：

In [10]:
(4, None, 'for') + (6, 0) + ('bar', )

(4, None, 'for', 6, 0, 'bar')

`*` 相当于copy多份，也可以用在list上：

In [11]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

## Unpacking tuples(取出元组)

In [12]:
tup = (4, 5, 6)
a, b, c = tup

In [13]:
b

5

In [14]:
tup = 4, 5, (6, 7)
a, b, (c, d) = tup

In [15]:
d

7

用下面的方法来交换变量的名字:

In [16]:
tmp = a
a = b 
b = tmp

但是在python里，交换能更简洁一些：

In [18]:
b, a = a, b

这种unpacking通常用在迭代序列上：

In [19]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

In [20]:
for a, b, c in seq:
    print('a={0}, b={1}, c={2}'.format(a, b, c))

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


另一种更高级的unpacking方法是用于只取出tuple中开头几个元素，剩下的元素直接赋给`*rest`：

In [22]:
values = 1, 2, 3, 4, 5
a, b, *rest = values

In [23]:
a, b

(1, 2)

In [24]:
rest

[3, 4, 5]

rest部分是你想要丢弃的，名字本身无所谓，通常用下划线来代替：

In [25]:
a, b, *_ = values

## Tuple methods(元组方法)

因为tuple的大小和内容都不能改变，所以方法也很少。`count`用来计算某个值出现的次数，list中也有这个方法：

In [26]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

# 2 List (列表)

列表的灵活性就很强了，大小和内容都可以变：

In [32]:
a_list = [2, 3, 7, None]
tup = ('foo', 'bar', 'baz')

In [33]:
b_list = list(tup)
b_list

['foo', 'bar', 'baz']

In [34]:
b_list[1] = 'peekaboo'
b_list

['foo', 'peekaboo', 'baz']

list函数通常用来具现化迭代器或生成器：

In [35]:
gen = range(10)
gen # 这是一个迭代器，所以无法看到里面的内容

range(0, 10)

In [36]:
list(gen) # 具现化后就可以看到了

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## 添加和移除元素

In [37]:
b_list.append('dwarf')
b_list

['foo', 'peekaboo', 'baz', 'dwarf']

insert可以把元素插入到特定的位置：

In [38]:
b_list.insert(1, 'red')
b_list

['foo', 'red', 'peekaboo', 'baz', 'dwarf']

需要注意的是insert方法运算量比append大。所以如果想要在序列的开头和结尾添加元素的话，可以使用collections.deque，这是一种双结尾的队列

insert的反向操作较pop, 能移除序列中特定位置的元素：

In [39]:
b_list.pop(2)

'peekaboo'

In [40]:
b_list

['foo', 'red', 'baz', 'dwarf']

remove可以通过值移除指定的element，如果同一个值在序列中多次出现，只移除第一个：

In [41]:
b_list.append('foo')
b_list

['foo', 'red', 'baz', 'dwarf', 'foo']

In [42]:
b_list.remove('foo')
b_list

['red', 'baz', 'dwarf', 'foo']

检查一个值是否在list中，用in：

In [43]:
'dwarf' in b_list

True

In [44]:
'dwarf' not in b_list

False

## 合并list

用 + 号：

In [45]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

通过entend方法，可以添加多个元素：

In [46]:
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])
x

[4, None, 'foo', 7, 8, (2, 3)]

注意：用+法来做合并是一个运算量较大的操作，因为要创建一个新的list并复制。如果操作的是一个很大的list，用extend会更好一些：

In [None]:
everything = []
for chunk in list_of_lists:
    everything.extend(chunk)
    
# 上面的代码要比下面的快

everything = []
for chunk in list_of_lists:
    everything = everything + chunk

这里总结一下，首先是append和extend的区别。
- append是把元素添加到一个list里
- extend是把两个list结合在一起

然后是extend和+的区别
- `+`是创建了一个新的list并返回，运算量大
- extend是在原本的list上做了更改，运算量小

## 排序

用sort函数

In [47]:
a = [7, 2, 5, 1, 3]
a.sort()
a

[1, 2, 3, 5, 7]

sort函数有一些比较方便的选项。比如设置一个sort key，这个key也是一个函数（funciton）。比如我们想要按string的长度来排序：

In [48]:
b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort(key=len)
b

['He', 'saw', 'six', 'small', 'foxes']

## Binary search and maintaining a sorted list （二分搜索和维持一个排好序的list）

内建的bisect模块可以实现二分搜索。`bisect.bisect`是用来寻找插入的位置，而`bisect.insort`则实际插入元素到指定的位置：

In [49]:
import bisect
c = [1, 2, 2, 2, 3, 4, 7]

In [50]:
bisect.bisect(c, 2)

4

In [51]:
bisect.bisect(c, 5)

6

In [52]:
bisect.insort(c, 6)
c

[1, 2, 2, 2, 3, 4, 6, 7]

注意：bisect模块不会检查list是否是排好序的，所以用这个模块之前要先把list排序。

## Slicing (切片)

[start:stop], 输出的结果包含开头，不包含结尾。所以输出的结果的数量是stop-start

In [53]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]
seq[1:5] 

[2, 3, 7, 5]

可以赋值：

In [54]:
seq[3:4] = [6, 3]

In [55]:
seq # 把元素7变成了6, 3

[7, 2, 3, 6, 3, 5, 6, 0, 1]

可以不用写开头或结尾：

In [57]:
seq[:5]

[7, 2, 3, 6, 3]

In [58]:
seq[3:]

[6, 3, 5, 6, 0, 1]

负索引表示倒数开始多少个的意思：

In [59]:
seq[-4:]

[5, 6, 0, 1]

In [60]:
seq[-6:-2]

[6, 3, 5, 6]

两个冒号后面的数代表步长，就是隔几个元素取一次：

In [138]:
seq

[7, 2, 3, 6, 3, 5, 6, 0, 1]

In [137]:
seq[::2]

[7, 3, 3, 6, 1]

用-1能反转一个list或tuple：

In [139]:
seq[::-1]

[1, 0, 6, 5, 3, 6, 3, 2, 7]

切片方式：

![](../MarkdownPhotos/chp03/屏幕快照 2017-10-25 下午1.59.36.png)



# 3 Built-in Sequence Functions(内建的序列函数)

## enumerate（枚举）
这个通常用于迭代序列。一个比较直白的方法是：

In [None]:
i = 0
for value in collection:
    # do something with value
    i += 1

但enumerate能返回一个(i, value)的tuple：

In [None]:
for i, value in enumerate(collection):
    # do something with value

enumerate通常用来把一个list中的位置和值映射到一个dcit字典里：

In [62]:
some_list = ['foo', 'bar', 'baz']
mapping = {}

for i, v in enumerate(some_list):
    mapping[v] = i

In [63]:
mapping

{'bar': 1, 'baz': 2, 'foo': 0}

## sorted

sorted函数返回一个新的排好序的序列，而之前提到的.sort方法是直接更改原有的序列，不产生新序列：

In [64]:
sorted([7, 1, 2, 6, 0, 3, 2])

[0, 1, 2, 2, 3, 6, 7]

In [65]:
sorted('horse race')

[' ', 'a', 'c', 'e', 'e', 'h', 'o', 'r', 'r', 's']

## zip

用于"pairs"(成对)。把多个序列中每个对应的元素变成一对，最后返回一个含有tuple的list：

In [66]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']

In [68]:
zipped = zip(seq1, seq2)
zipped

<zip at 0x104bc26c8>

In [69]:
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

zip可以接收任意长度的序列，最后返回的结果取决于最短的序列：

In [70]:
seq3 = [False, True]
list(zip(seq1, seq2, seq3))

[('foo', 'one', False), ('bar', 'two', True)]

zip的一个常见用法是同时迭代多个序列，可以和enumerate搭配起来用：

In [71]:
for i, (a, b) in enumerate(zip(seq1, seq2)):
    print('{0}: {1}, {2}'.format(i, a, b))

0: foo, one
1: bar, two
2: baz, three


如果给我们一个压缩过的序列，我们可以将其解压：

In [72]:
pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'), 
            ('Schilling', 'Curt')]

In [73]:
first_names, last_names = zip(*pitchers)

In [74]:
first_names

('Nolan', 'Roger', 'Schilling')

In [75]:
last_names

('Ryan', 'Clemens', 'Curt')

## reversed

reverse可以倒叙迭代序列：

In [76]:
list(reversed(range(10)))

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

注意，revered是一个generator（生成器，之后会详细讲），所以必须需要list来具现化

# 4 dict（字典）

字典也被叫做hash map 或 associative array。结构就是key-value pairs.创建方式是用`{}`:

In [77]:
empty_dict = {}

In [78]:
d1 = {'a': 'some value', 'b': [1, 2, 3, 4]}

In [79]:
d1

{'a': 'some value', 'b': [1, 2, 3, 4]}

dict像list一样可以插入：

In [81]:
d1[7] = 'an integer'
d1

{'b': [1, 2, 3, 4], 7: 'an integer', 'a': 'some value'}

可以检查dict是否有某个key：

In [83]:
'b' in d1

True

可以用del或pop删除值：

In [84]:
d1[5] = 'some value'
d1

{'b': [1, 2, 3, 4], 7: 'an integer', 5: 'some value', 'a': 'some value'}

In [85]:
del d1[5]

In [86]:
d1

{'b': [1, 2, 3, 4], 7: 'an integer', 'a': 'some value'}

In [87]:
d1['dummy'] = 'another value'
d1

{'b': [1, 2, 3, 4],
 'dummy': 'another value',
 7: 'an integer',
 'a': 'some value'}

In [88]:
ret = d1.pop('dummy')

In [89]:
ret

'another value'

In [90]:
d1

{'b': [1, 2, 3, 4], 7: 'an integer', 'a': 'some value'}

keys和values方法能返回dict中key-value组合的迭代器，不过并不安什么顺序。如果想让keys和values每次打印的顺序相同的话：

In [91]:
list(d1.keys())

['b', 7, 'a']

In [92]:
list(d1.values())

[[1, 2, 3, 4], 'an integer', 'some value']

可以用update来合并两个dict：

In [93]:
d1.update({'b': 'foo', 'c': 12})

In [94]:
d1

{'b': 'foo', 'c': 12, 7: 'an integer', 'a': 'some value'}

这个update是更改了原有的dict，不会返回新的dict

## Creating dicts from sequences（从序列中生成dict）

假设我们想把两个序列按照key-value的方式生成一个dict，我们可能会这样写：

In [None]:
mapping = []
for key, value in zip(key_list, value_list):
    mapping[key] = value

因为dict其实就是2-tuple的组合，所以dict函数能接受一组2-tuple：

In [96]:
mapping = dict(zip(range(5), reversed(range(5))))

In [97]:
mapping

{0: 4, 1: 3, 2: 2, 3: 1, 4: 0}

## Default value(默认值)

如果dict中某个key存在的话，就返回该value，否则的话，就返回一个默认值：

In [None]:
if key in some_dict:
    value = some_dict[key]
else:
    value = default_value

不过dict中的get和pop方法能设置默认值，即能把上面的代码简写为：

In [None]:
value = some_dict.get(key, default_value)

如果key不存在的话，get方法默认会返回None，而pop则会引发一个错误。

通过设定值，一个常用的场景是一个dict中的value也是其他集合，比如list。举例说明，我们想要把一些单词按首字母归类：

In [98]:
words = ['apple', 'bat', 'bar', 'atom', 'book']
by_letter = {}

In [99]:
for word in words:
    letter = word[0]
    if letter not in by_letter:
        by_letter[letter] = [word]
    else:
        by_letter[letter].append(word)

In [100]:
by_letter

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

而setdefault方法则是专门为这个用途存在的，上面的循环可以写为：

In [None]:
for word in words:
    letter = word[0]
    by_letter.setdefault(letter, []).append(word)

使用setdefault() 初始化字典键值. 使用字典的时候经常会遇到这样一种应用场景：动态更新字典，像如上面代码，如果key不在dictionary 中那么就添加它并把它对应的值初始为空列表[] ，然后把元素append到空列表中。

内建的collections模块有一个有用的class，defaultdict，这个能让上述过程更简单。创建方法是传递一个type或是函数：



In [101]:
from collections import defaultdict
by_letter = defaultdict(list)
for word in words:
    by_letter[word[0]].append(word)

## Valid dict key types(有效的key类型)

通常key的类型是不可更改的常量类型（int，float，string）或tuple。专业的叫法是hashability。可以查看一个object是否是hashable，只要是hashable的，就可以当做dict中的key。这里用hash函数查看：

In [102]:
hash('string')

-522944812555367519

In [104]:
hash((1, 2, (2, 3)))

1097636502276347782

In [105]:
hash(1, 2, [2, 3]) # 失败，因为list是可变的

TypeError: hash() takes exactly one argument (3 given)

要想把list当做key的话，可以把list转变为tuple：

In [106]:
d = {}
d[tuple([1, 2, 3])] = 5

In [107]:
d

{(1, 2, 3): 5}

## 5 Set 集合

set是无序且元素不重复的。就像是key唯一，且没有value的字典。两种方式可以创建，一个是用set函数，一个是用花括号：

In [108]:
set([2, 3, 2, 1, 4, 4, 3])

{1, 2, 3, 4}

In [109]:
{2, 3, 2, 1, 4, 4, 3}

{1, 2, 3, 4}

集合的操作既然也支持，比如并集，交集，差集：

In [110]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}

In [111]:
# 并集
a.union(b)

{1, 2, 3, 4, 5, 6, 7, 8}

In [112]:
a | b

{1, 2, 3, 4, 5, 6, 7, 8}

In [113]:
# 交集
a.intersection(b)

{3, 4, 5}

In [114]:
a & b

{3, 4, 5}

一些集合操作
![](../MarkdownPhotos/chp03/屏幕快照 2017-10-25 下午2.01.37.png)


上面这些逻辑操作都是直接更改set本身。如果是一个很大的set，下面的操作会更有效率：

In [115]:
c = a.copy()
c |= b
c

{1, 2, 3, 4, 5, 6, 7, 8}

In [116]:
d = a.copy()
d &= b
d

{3, 4, 5}

set的元素必须是不可更改的。如果想要list一样的元素，只能变为tuple：

In [117]:
my_data = [1, 2, 3, 4]
my_set = {tuple(my_data)}
my_set

{(1, 2, 3, 4)}

我们可以查看一个子集与父集的关系：

In [118]:
a_set = {1, 2, 3, 4, 5}

In [119]:
{1, 2, 3}.issubset(a_set)

True

In [120]:
a_set.issuperset({1, 2, 3})

True

# 6 List, Set, and Dict Comprehensions(推导式)

list comprehension(列表推导式）是python里最受喜爱的一个特色。我们能简洁地构造一个list：

    [expr for val in collection if condiction]
相当于：

    result = []
    for val in collection:
        if condition:
            result.append(expr)
            
比如，给定一个list，里面有很多string，我们只要留下string长度超过2的，并将其转换为大写：

In [121]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']

In [122]:
[x.upper() for x in strings if len(x) > 2]

['BAT', 'CAR', 'DOVE', 'PYTHON']

dict推导式：

`dict_comp = {key-expr: value-expr for value in collection if condition}`

set的推导式：

`set_comp = {expr for value in collection if condition}`

基于上面的例子，我们想要一个集合来保存string的长度：

In [123]:
unique_length = {len(x) for x in strings}
unique_length

{1, 2, 3, 4, 6}

用map让表达更功能化一些：

In [124]:
set(map(len, strings))

{1, 2, 3, 4, 6}

一个简单而的字典表达式例子，string和其在list中对应的index：

In [125]:
loc_mapping = {val: index for index, val in enumerate(strings)}

In [126]:
loc_mapping

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

## Nested list comprehensions（嵌套列表表达式）

假设我们有一个list，list中又有不同的list表示英语和西班牙语的姓名：

In [127]:
all_data = [['John', 'Emily', 'Michael', 'Mary', 'Steven'], 
            ['Maria', 'Juan', 'Javier', 'Natalia', 'Pilar']]

我们想要按语言来组织这些名字。可以用一个for loop：

In [131]:
names_of_interest = []
for names in all_data:
    enough_es = [name for name in names if name.count('e') >= 2]
    names_of_interest.extend(enough_es)

names_of_interest

['Steven']

但是我们key用嵌套列表表达式写得更简洁一些：

In [128]:
result = [name for names in all_data for name in names if name.count('e') >= 2]

In [129]:
result

['Steven']

for部分是根据嵌套的顺序来写的，从外层的loop到内层的loop。这里一个例子是把tuple扁平化成一个整数列表：

In [132]:
some_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
flattened = [x for tup in some_tuples for x in tup]
flattened

[1, 2, 3, 4, 5, 6, 7, 8, 9]

一定要记住顺序是和我们写for loop一样的：

In [133]:
flatteded = []

for tup in some_tuples:
    for x in tup:
        flattened.append(x)

列表表达式里再有一个列表表达式也是可以的，可以生成a list of lists：

In [135]:
[[x for x in tup] for tup in some_tuples]

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]