# 数据结构

这章会深入介绍一些前面已经了解过的只是，同时也增加一些新知识。

## Lists类型

list类型的所有方法如下：

- list.append(x)
    
    给list增加一项，相当于a[len(a):] = [x]
    
- list.extend(iterable)

    将iterable对象所有元素添加到list中，相当于a[len(a):] = iterable
    
- list.insert(i, x)

    在给定的位置增加一个元素
    
- list.remove(x)

    移除元素值为x的第一个元素，没有没有这样的项，则抛出ValueError异常。
    
- list.pop([i])  # []表示可选项

    取出给定位置的元素，并且返回这些元素。没有没有元素，则返回并删除list中最后一个元素。
    
- list.clear()

    删除所有的元素，相当于 del a[:]
    
- list.index(x [, start[, end]])

    返回第一个元素值为x的元素索引。没有则抛出ValueError异常。可选项制定搜索的范围。
    
- list.count(x)

    返回x出现的次数
    
- list.sort(key=None, reverse=False)

    以in place方式对list进行排序，key制定排序值，reverse制定排序顺序。
    
- list.reverse()

    以in place方式将元素逆序排放
    
- list.copy()

    返回list的浅拷贝，相当于a[:]
    
    
注意到insert, remove和sort函数只修改了list的值，并没有返回。其返回值是None，这是python里面对于mutable数据结构的设计原则。

### 5.1.1 将list当作栈使用

栈：后进先出。push->append, pop->pop

### 5.1.2 将list当作队列使用

队列: 先进先出。然而，list用作队列效率不够高。append和pop速度快，但是insert或者将第一个元素pop会很慢，因为其他元素都需要移动。

为了实现队列，采用collections.deque。

In [5]:
from collections import deque
queue = deque(['Eric', 'John', 'Michael'])
queue.append('terry')
queue.append('Graham')
print(queue)

print(queue.popleft())
print(queue.pop())

deque(['Eric', 'John', 'Michael', 'terry', 'Graham'])
Eric
Graham


### 5.1.3 List解析式

List comprehensions提供了一种简洁的方式来创建list。

In [7]:
squares = list(map(lambda x: x ** 2, range(10)))
print(squares)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [8]:
squares = [x**2 for x in range(10)]
print(squares)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [9]:
# 注意到，第一个for是外层循环
[(x, y) for x in [1, 2, 3] for y in [3, 1, 4] if x != y]

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

### 5.1.4 嵌套列表解析

In [10]:
matrix = [[1, 2, 3, 4],
            [5, 6, 7, 8],
            [9, 10, 11, 12]]
# 先考虑最外层是什么，然后考虑外层的每一个元素
[[row[i] for row in matrix] for i in range(4)]

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [11]:
# 应该更多使用内置函数
list(zip(*matrix))

[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)]

## 5.2 del 声明

del能够通过给定索引删除list中的元素，支持slice操作。

In [16]:
a = list(range(10))

del a[0]

del a[2:4]

del a[:]

del a

## 5.3 元组和序列

元组可以嵌套，是immutable类型。但其元素可以是mutable类型。


In [19]:
a = 0, [1,2,2]
print(a)
a[1].append(3)
print(a)

# 零个元素和一个元素的元组声明
empty = ()
singleton = 'hello',

(0, [1, 2, 2])
(0, [1, 2, 2, 3])


## 5.4 集合

集合是一个无序的集，其中没有重复的元素。基本用来成员测试和减少重复的项。集合对象同样支持数学运算如并集，交集，差集，补集等。

大括号和set()函数用来创建集合。但是注意，创建空集合时只能使用set(),不能使用{}（这是字典）。同样支持列表解析式。

In [20]:
a = set('abracadabra')
b = set('alacazam')
print(a)
print(b)
print(a - b)
print(a | b)
print(a & b)
print(a ^ b)

{'c', 'd', 'r', 'a', 'b'}
{'l', 'c', 'm', 'z', 'a'}
{'d', 'r', 'b'}
{'l', 'c', 'd', 'r', 'm', 'z', 'a', 'b'}
{'a', 'c'}
{'d', 'r', 'm', 'z', 'l', 'b'}


In [21]:
a = {x for x in 'abracadabra' if x not in 'abc'}
print(a)

{'d', 'r'}


## 5.5 字典

字典是通过关键字索引的，任何immutable类型都能成为关键字。元组也能成为关键字，如果只包含字符串，数字或者元组。如果直接或间接包含任何的mutable类型，则不能用作关键字。

可以认为字典是键值对。键在一个字典中是唯一的，{}可以创建一个空字典。每一项键值对通过逗号分开，这也是字典输出的格式。

主要的功能是通过键保存或者查询值。del可以用来删除键值对。如果键已经存在，赋值会覆盖之前的值。如果访问不存在的键，则会报错。

执行list(d)会返回字典的键的列表，以插入的顺序。如果你想排序，则可以执行sorted(d)。判断单个键是否在字典中，可以采用in操作符。

In [22]:
# 使用dict方法构建字典
d = dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
print(d)

d = dict(sape=4139, guido=4127, jack=4098)
print(d)

{'sape': 4139, 'guido': 4127, 'jack': 4098}
{'sape': 4139, 'guido': 4127, 'jack': 4098}


In [23]:
# 使用字典解析式
{x: x**2 for x in (2, 4, 6)}

{2: 4, 4: 16, 6: 36}

## 5.6 循环技术

同时在两个或多个序列上循环，每个循环项可以通过zip函数整合。

In [24]:
questions = ['name', 'quest', 'favorite color']
answers = ['lancelot', 'the holy grail', 'blue']
for q, a in zip(questions, answers):
    print('What is your {0}?  It is {1}.'.format(q, a))

What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.


In [25]:
# 逆序循环
for i in reversed(range(1, 11, 2)):
    print(i)

9
7
5
3
1


如果循环中需要改变list的内容，那么创建一个新的list是一种更简单和安全的做法。

## 5.7 条件判断

在while和if语句中的条件判断可以包含任何的操作符。

in/ not in, is/ not is(这只对mutable有用)。所有比较操作符优先级相同，低于算术操作符。

比较可以是链式的，如a<b==c，则是判断a小于b并且b等于c

比较结果可以通过布尔操作符组合，and, or 以及not。这些优先级比比较操作符更低。而在这三者中，not优先级最高，or优先级最低。表达式复杂时，最好通过括号来表明意图。

布尔操作符and和or称为短路操作符，从左往右运算，当结果确定时则停止运算。

In [26]:
string1, string2, string3 = '', 'Trondheim', 'Hammer Dance'
non_null = string1 or string2 or string3

In [27]:
non_null

'Trondheim'

In [28]:
# 赋值不能在表达式内部进行！
a = 10
if a = 11:
    print(a)

SyntaxError: invalid syntax (<ipython-input-28-ff9ca35f0873>, line 2)

## 5.8 比较序列和其他类型

序列里面的元素依次比较。