# 5.1 [列表]

列表方法：
- list.append(x) ——在列表末尾，增加一个元素x，等价于`a[len(list):] = [x]`
- list.extend(iterable) ——在列表最后，用一个iterable对象进行扩展，等价于`a[len(list):] = iterable`
- list.insert(i, x) ——指定索引位置插入元素x
- list.remove(x) ——删除第一个值为x的元素，如果此元素不存在，则报错
- list.pop(\[i\]) ——删除指定索引位置的元素，并**返回该元素**，默认删除最后一个
- list.clear() ——元素清空
- list.index(x\[, start[, end]]) ——返回指定范围[start, end]内指定元素x在整个列表第一次出现的位置索引
- list.count(x) ——计算元素x出现的次数
- list.sort(key=None, reverse=False) ——元素排序
- list.reverse() ——元素逆序
- list.copy() ——浅拷贝，等价于`a[:]`

**注意** Python的一个设计原则是：可变数据结构对象的增删查改方法，如`insert、remove、sort方法`，会直接修改对象，并不会返回一个可打印值(返回值为None)。

In [12]:
fruits = ['apple', 'banana', 'pear', 'orange', 'apple', 'banana', 'blabla']

In [13]:
fruits.count('apple')

2

In [14]:
fruits.index('apple',1,)

4

In [15]:
fruits.reverse()
fruits

['blabla', 'banana', 'apple', 'orange', 'pear', 'banana', 'apple']

In [16]:
fruits.append('tomato')

In [17]:
fruits.sort()
fruits

['apple', 'apple', 'banana', 'banana', 'blabla', 'orange', 'pear', 'tomato']

## 5.1.1 栈（别把List不当Stacks）
栈的特点**后进先出**，使用列表方法`append()`和`pop()`，可以很容易的实现。

In [19]:
stack = [3, 4, 5]

In [20]:
stack.append(6)
stack.append(7)
stack

[3, 4, 5, 6, 7]

In [21]:
stack.pop()
stack

[3, 4, 5, 6]

## 5.1.2 队列(别把List不当Queues)
队列的特点**先进先出**，使用列表方法`append()和pop(0)`,也可以实现,但效率不高。

推荐使用可以两头删、插的`collections.deque`。

In [24]:
from collections import deque
queue = deque(['Eric', 'John', 'Michael'])

In [26]:
queue.append('Terry')
queue.append('Silly')
queue

deque(['Eric', 'John', 'Michael', 'Terry', 'Silly'])

In [27]:
queue.popleft()
queue

deque(['John', 'Michael', 'Terry', 'Silly'])

In [29]:
queue.pop()
queue

deque(['John', 'Michael', 'Terry'])

In [33]:
import collections
help(collections)

Help on package collections:

NAME
    collections

DESCRIPTION
    This module implements specialized container datatypes providing
    alternatives to Python's general purpose built-in containers, dict,
    list, set, and tuple.
    
    * namedtuple   factory function for creating tuple subclasses with named fields
    * deque        list-like container with fast appends and pops on either end
    * ChainMap     dict-like class for creating a single view of multiple mappings
    * Counter      dict subclass for counting hashable objects
    * OrderedDict  dict subclass that remembers the order entries were added
    * defaultdict  dict subclass that calls a factory function to supply missing values
    * UserDict     wrapper around dictionary objects for easier dict subclassing
    * UserList     wrapper around list objects for easier list subclassing
    * UserString   wrapper around string objects for easier string subclassing

PACKAGE CONTENTS
    abc

SUBMODULES
    _collections

## 5.1.3 列表生成式

生成一个列表，有几种做法：

In [34]:
# 普通青年版
squares1 = []
for i in range(10):
    squares1.append(i**2)

squares1

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [36]:
# 装B青年版
squares2 = list(map(lambda i : i**2, range(10)))
squares2

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [37]:
# 文艺青年版
squares = [i**2 for i in range(10)]
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

列表生成式可以很优雅，也可以很复杂

In [41]:
from math import pi
[str(round(pi, i)) for i in range(1,10) if i%2 == 0]

['3.14', '3.1416', '3.141593', '3.14159265']

## 5.1.4 嵌套列表生成式

In [34]:
matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]

In [35]:
# 通常，如果想把一个3x4的矩阵（多维列表），转换成4x3，做法如下：
matrix_out = []
for i in range(4):
    matrix_in = []
    for row in matrix:
        matrix_in.append(row[i])
    matrix_out.append(matrix_in)
matrix_out        

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [37]:
# 如果使用嵌套列表生成式，可以很简洁。
[[row[i] for row in matrix] for i in range(4)]

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

但是Python里，更提倡使用内建方法(built-in function).

In [38]:
list(zip(*matrix))

[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)]

# 5.2 del语句
之前提到过，列表方法`list.pop([i])`根据给定索引，删除列表元素，并返回该值。

与之不同，del语句可以根据给定索引，删除列表元素或直接删除整个列表对象，返回None.

引用已经被删除的对象，会报错。

In [62]:
a = [1,2,3,4,5,6,7]

In [63]:
del a[1]

In [64]:
del a

In [65]:
a

NameError: name 'a' is not defined

# 5.3 (元组)和序列
之前提到的列表和字符串，有很多空性，比如索引、切片操作，因为它们都是序列数据类型。

Python还有另外一种序列类型——元组。

外表上看，(元组)和\[列表\]的区别是一个用圆括号(tuples)一个用方括号\[list\]，但更重要的区别是，**列表是可变对象，元组不可变**。

**小明：**老师，我有个问题，那要是元组里面嵌套一个列表，这个元组是可变对象，还是不可变的？

**老师：**你给我滚出去。

In [67]:
# 元组嵌套列表，会不会让情况变得复杂？
tp = (1,2,[3,4,5],6)
tp[2][1] = 44
print(tp)

(1, 2, [3, 44, 5], 6)


**需要特别指出的是，空元组或只有一个元素的元组。但写法比较特别。**

In [1]:
# 只有一个元素的元组，元素后面有个逗号
tp1 = ()
integer = (1)
tp2 = (1,)
print(type(tp1),type(tp2),type(integer))

<class 'tuple'> <class 'tuple'> <class 'int'>


关于用途或者使用场景，虽然元组和序列长得很像，但元组常包含一些异构的序列元素，通常用解包、索引的方式来访问，而列表元素通常是同构的，通常用迭代方式访问。

In [1]:
#关于tuple packing和tuple unpacking举个有趣的小例子。
t = '1234', 'xyz', 'Python'
print(t)
x, y, z = t
print(x, y, z)

('1234', 'xyz', 'Python')
1234 xyz Python


**多赋值** 多值赋值实际上就只是元组打包和序列解包的组合。

# 5.4 {集合}

集合作为一种用{sets}包裹的数据结构，其特点是元素无序且不重复。经常用来对数据进行去重。支持数学上的集合运算，如并|、交&、差-、对称差^。

创建一个集合有两种方法：{sets}或者set(),但是，如果要创建一个空集合，只能使用set()。

In [6]:
# 空的花括号，会创建一个空字典。
sets1 = {1,1,2,2,'a','a'}
sets2 = set('abcdedcba&banana')
print('banana' in sets2)
print(sets1, sets2)

dic = {}
print(type(dic), dic)

False
{1, 2, 'a'} {'e', 'n', 'd', 'c', 'b', 'a', '&'}
<class 'dict'> {}


In [15]:
sets1 - sets2   # A-B差集：只存在于A

{1, 2}

In [16]:
sets2 - sets1   # B-A差集：只存在于B

{'&', 'b', 'c', 'd', 'e', 'n'}

In [12]:
sets1 | sets2    # 并集：合并

{'&', 1, 2, 'a', 'b', 'c', 'd', 'e', 'n'}

In [13]:
sets1 & sets2    # 交集：相交

{'a'}

In [14]:
sets1 ^ sets2    # 对称差: 你有，或者我有，但是不能同时有

{'&', 1, 2, 'b', 'c', 'd', 'e', 'n'}

**最后，Phthon也支持集合生成式**

In [17]:
a = {x for x in 'abracadabra' if x not in 'abc'}
print(a)

{'r', 'd'}


# 5.5 {'字':'典'｝

花括号包住的**键值对**，是字典的常见形象。key是索引，必须唯一，value是值(废话)。

任何不可变对象都可以作为字典的key，数字、字符串或者元组(不可变对象时)都常作为字典的键来使用。

通常使用key来操作字典的value，使用不存在的key，会报错。

In [18]:
tel = {'jack':4016, 'john':4255, 'jason':4111}

In [19]:
tel['john'] = 4000

In [20]:
del tel['jason']

In [21]:
tel['jason']

KeyError: 'jason'

In [22]:
'guido' in tel

False

In [23]:
list(tel)

['jack', 'john']

In [24]:
tel

{'jack': 4016, 'john': 4000}

除了使用{dict}方式来创建字典或空字典{},还可以使用dict().

In [25]:
dict([('jojo',1),('winne',2),('alice',3)])

{'alice': 3, 'jojo': 1, 'winne': 2}

In [26]:
dict(sape=4139, guido=4127, jack=4098)

{'guido': 4127, 'jack': 4098, 'sape': 4139}

虽然Python也支持字典生成式，但好像没并有多大卵用。

In [27]:
{x: x**2 for x in (2, 4, 6)}

{2: 4, 4: 16, 6: 36}

# 5.6 循环

使用**items()**方法，可以在遍历**字典**时，同时读取关键字和与之相对应的值。

In [4]:
dic1 = {x : x**3 for x in range(5)}

In [5]:
for k,v in dic1.items():
    print(k, v)

0 0
1 1
2 8
3 27
4 64


使用**enumerate()**函数，可以在遍历**序列**时，同时读取位置索引和与之相对应的值。

In [21]:
list1 = [i for i in range(5,12)]

In [22]:
for i,v in enumerate(list1):
    print(i, ':' ,v)

0 : 5
1 : 6
2 : 7
3 : 8
4 : 9
5 : 10
6 : 11


**Notice:** **enumerate()**函数是Python系统函数，不是对象方法，所以别这样使用：list.enumerate()，会报错的。

虽然函数和方法并没什么本质区别 ^_^

使用**zip()**方法，可以同时**遍历并组合**两个或多个**序列**。

In [23]:
firstname = ['jack', 'bruce', 'jianlin']
lastname = ['Ma', 'Lee', 'Wang']
for x, y in zip(firstname, lastname):
    print(x,y)

jack Ma
bruce Lee
jianlin Wang


使用**reversed()**函数，可以逆序一个序列。

In [24]:
for i in reversed(range(2,18,2)):
    print(i)

16
14
12
10
8
6
4
2


使用**sorted()**函数，可以对一个序列进行排序，返回值为排序后的序列，但原序列并不会改变。

In [25]:
basket = ['apple', 'pear', 'apple', 'applepie','orange']

In [31]:
# 考虑一下，为什么我在这里没有直接使用  for i in sorted(basket)
for i in sorted(set(basket)):
    print(i)

apple
applepie
orange
pear


We suguest you to create a new list instead of change a list.

# 5.7 