## 第2章 Python序列

* 序列是程序设计中经常用到的数据存储方式，几乎每一种程序设计语言都提供了类似的数据结构，如C和Basic中的一维、多维数组等。
* Python提供的序列类型在所有程序设计语言中是最丰富，最灵活，也是功能最强大的。
* 序列是一系列连续值，它们通常是相关的，并且按一定顺序排列。
* Python中常用的序列结构有列表、元组、字典、字符串、集合以及range等等。
* 除字典和集合之外，列表、元组、字符串等序列均支持双向索引，第一个元素下标为0，第二个元素下标为1，以此类推；最后一个元素下标为-1，倒数第二个元素下标为-2，以此类推。


## 2.1  列表
* 列表是Python中内置可变序列，是若干元素的有序集合，列表中的每一个数据称为元素，列表的所有元素放在一对中括号“[”和“]”中，并使用逗号分隔开；
* 当列表元素增加或删除时，列表对象自动进行扩展或收缩内存，保证元素之间没有缝隙；
* 在Python中，一个列表中的数据类型可以各不相同，可以同时分别为整数、实数、字符串等基本类型，甚至是列表、元组、字典、集合以及其他自定义类型的对象。例如：

In [None]:
a = [10, 20, 30, 40]

In [None]:
['crunchy frog', 'ram bladder', 'lark vomit']

In [None]:
['spam', 2.0, 5, [10, 20]]

In [None]:
b=[['file1', 200,7], ['file2', 260,9]]

In [None]:
b[0][-1]

### 列表方法，见ppt

## 2.1.1 列表创建与删除
* 使用“=”直接将一个列表赋值给变量即可创建列表对象
* 也可以使用list()函数将元组、range对象、字符串或其他类型的可迭代对象类型的数据转换为列表。

In [None]:
a_list = ['a', 'b', 'mpilgrim', 'z', 'example']
a_list

In [None]:
a_list = [] #创建空列表

In [None]:
type((3,5,7,9,11))

In [None]:
a_list = list((3,5,7,9,11))
a_list

In [None]:
a_list

In [None]:
range(1,10,2)

In [None]:
list(range(1,10,2))

In [None]:
list('hello world')

In [None]:
x = list() #创建空列表

In [None]:
type(x)

## 2.1.3 列表的遍历
> for x in a_list

In [None]:
a_list = ['a', 'b', 'mpilgrim', 'z', 'example']
for a in a_list:
    print(a, end=' ')
    print('--', end='')

In [None]:
dogs = ['border collie', 'australian cattle dog', 'labrador retriever']

for dog in dogs:
    print('I like ' + dog + 's.')
    print('No, I really really like ' + dog +'s!\n')
    
print("\nThat's just how I feel about dogs.")

##### 练习：
将你喜欢的水果放入列表变量，然后遍历列表变量，对其中的每一个水果XX，输出"我喜欢XX"

In [None]:
fruits = ['香蕉', '苹果', 'labrador retriever']

for fruit in fruits:
    print('I like ' + fruit + 's.')

## 2.1.1 列表创建与删除

内置函数range()该函数语法为：  
range([start,] stop[, step])  
内置函数range()接收3个参数，第一个参数表示起始值（默认为0），第二个参数表示终止值（结果中不包括这个值），第三个参数表示步长（默认为1），该函数在Python 3.x中返回一个range可迭代对象，在Python 2.x中返回一个包含若干整数的列表。见ppt

In [None]:
list(range(10))

In [None]:
# Python2 only
xrange(10)

In [None]:
set(range(10))

In [None]:
%%timeit -r 1 -n 1
for j in range(100000000):
    1+1

当不再使用时，使用del命令删除整个列表，如果列表对象所指向的值不再有其他对象指向，Python将同时删除该值。

In [None]:
a_list

In [None]:
del a_list

In [None]:
a_list

### 2.1.2 列表元素的增加  
1. 可以使用“+”运算符来实现将元素添加到列表中的功能。虽然这种用法在形式上比较简单也容易理解，但严格意义上来讲，这并不是真的为列表添加元素，而是创建一个新列表，并将原列表中的元素和新元素依次复制到新列表的内存空间。由于涉及大量元素的复制，该操作速度较慢，在涉及大量元素添加时不建议使用该方法。  
1. 使用列表对象的append()方法，原地修改列表，是真正意义上的在列表尾部添加元素，速度较快，也是推荐使用的方法。

In [None]:
aList = [3, 4, 5, 7]
id(aList)

In [None]:
aList = aList + [9]
id(aList)

In [None]:
aList.append(10)
id(aList)

为了比较“+”和append()这两种方法的速度差异，请看以下代码：

In [None]:
%%timeit -n 1 -r 1
result = []
for i in range(100000):
    result = result + [i]

In [None]:
%%timeit -n 1 -r 1
result = []
for i in range(100000):
    result.append(i)

Python采用的是基于值的自动内存管理方式，当为对象修改值时，并不是真的直接修改变量的值，而是使变量指向新的值，这对于Python所有类型的变量都是一样的。

In [None]:
a = [1,2,3]
b = a
b[1] = 5
print(a)

In [None]:
a = [1,2,3]
id(a)

In [None]:
b = a
id(b)

In [None]:
b[1] = 5
a

In [None]:
b = list(a)
id(b)

In [None]:
b[0] = 9

In [None]:
a

对于列表、集合、字典等可变序列类型而言，情况稍微复杂一些。以列表为例，列表中包含的是元素值的引用，而不是直接包含元素值。如果是直接修改序列变量的值，则与Python普通变量的情况是一样的，而如果是通过下标来修改序列中元素的值或通过可变序列对象自身提供的方法来增加和删除元素时，序列对象在内存中的起始地址是不变的，仅仅是被改变值的元素地址发生变化。

In [None]:
a = [1,2,4]
b = [1,2,3]
a == b

In [None]:
id(a) == id(b)

In [None]:
id(a[0]) == id(b[0])

In [None]:
a = [1,2,3]
id(a)

In [None]:
a.append(4)
id(a)

In [None]:
a.remove(3)
a

In [None]:
id(a)

In [None]:
a[0] = 5
a

In [None]:
id(a)

(3) 使用列表对象的extend()方法可以将另一个迭代对象的所有元素添加至该列表对象尾部。通过extend()方法来增加列表元素也不改变其内存首地址，属于原地操作。例如，继续上面的代码执行下面的代码。

In [None]:
a.extend([7,8,9])
a

In [None]:
id(a)

In [None]:
aList

In [None]:
aList.extend([11,13])
aList

In [None]:
aList.extend((15,17))
aList

（4）使用列表对象的insert()方法将元素添加至列表的指定位置。

In [None]:
help(list.insert)

In [None]:
aList.insert(3,6)
aList

应尽量从列表尾部进行元素的增加与删除操作。列表的insert()可以在列表的任意位置插入元素，但由于列表的自动内存管理功能，insert()方法会涉及到插入位置之后所有元素的移动，这会影响处理速度，类似的还有后面介绍的remove()方法以及使用pop()函数弹出列表非尾部元素和使用del命令删除列表非尾部元素的情况。

In [None]:
%%timeit -n 1 -r 1
a = []
for i in range(10000):
    a.insert(0, i)
print(a[1:5])

In [None]:
%%timeit -n 1 -r 1
a = []
for i in range(10000):
    a.append(i)
print(a[1:5])

使用乘法来扩展列表对象，将列表与整数相乘，生成一个新列表，新列表是原列表中元素的重复。

In [None]:
aList = [3,5,7]
bList = aList
id(aList)

In [None]:
id(bList)

In [None]:
aList = aList*3

In [None]:
aList

In [None]:
bList

In [None]:
id(aList)

In [None]:
id(bList)

### 2.1.3 列表元素的删除
使用del命令删除列表中的指定位置上的元素。前面已经提到过，del命令也可以直接删除整个列表，这里不再赘述。

In [None]:
a_list = [3,5,7,9,11]


In [None]:
del a_list[1]
a_list

2）使用列表的pop()方法删除并返回指定（默认为最后一个）位置上的元素，如果给定的索引超出了列表的范围则抛出异常。

In [None]:
a_list = list((3,5,7,9,11))
a_list

In [None]:
a_list.pop

In [None]:
help(list.pop)

In [None]:
a_list.pop(1)

In [None]:
a_list

（3）使用列表对象的remove()方法删除首次出现的指定元素，如果列表中不存在要删除的元素，则抛出异常。

In [None]:
a_list = [3,5,7,9,7,11]
a_list.remove(7)
a_list

In [None]:
a_list.remove(7)
a_list

有时候可能需要删除列表中指定元素的所有重复，大家会很自然地想到使用“循环+remove()”的方法，但是具体操作时很有可能会出现意料之外的错误，代码运行没有出现错误，但结果却是错的，或者代码不稳定，对某些数据处理结果是正确的，而对某些数据处理结果却是错误的。例如，下面的代码成功地删除了列表中的重复元素，执行结果是完全正确的。

In [None]:
x = [1,2,1,2,1,2,1,2,1]
for i in x:
    if i == 1:
      x.remove(i)

In [None]:
x

然而，上面这段代码的逻辑是错误的，尽管执行结果是正确的。例如下面的代码同样试图删除列表中所有的“1”，代码完全相同，仅仅是所处理的数据发生了一点变化，然而当循环结束后却发现并没有把所有的“1”都删除，只是删除了一部分。

In [None]:
x = [1,2,1,2,1,1,1]
id(x)

In [None]:
y = list(x)
id(y)

In [None]:
x = [1,2,1,2,1,1,1]
for i in x[:]:
    if i == 1:
      x.remove(i)

In [None]:
x

两组数据的本质区别在于，第一组数据中没有连续的“1”，而第二组数据中存在连续的“1”。出现这个问题的原因是列表的自动内存管理功能。前面已经提到，在删除列表元素时，Python会自动对列表内存进行收缩并移动列表元素以保证所有元素之间没有空隙，增加列表元素时也会自动扩展内存并对元素进行移动以保证元素之间没有空隙。每当插入或删除一个元素之后，该元素位置后面所有元素的索引就都改变了。正确的代码：

In [None]:
x = [1,2,1,2,1,1,1]  
for i in x[::]:  
    if i == 1:  
        x.remove(i)
x

In [None]:
x = [1,2,1,2,1,1,1]  
for i in range(len(x)-1,-1,-1): 
    if x[i]==1:  
        del x[i]
x

In [None]:
x = [1,2,1,2,1,1,1]  
list(range(len(x)-1,-1,-1))

In [None]:
x = [1,2,1,2,1,1,1] 
for i in range(x.count(1)):
    x.remove(1)
x

### 2.1.4 列表元素访问与计数
* 使用下标直接访问列表元素,序列元素的下标分为正向下标和反向下标
* 正向下标为 0,1,2,3,4,len(aList)-1
* 反向下标为-1,-2,-3,-len(aList)

In [None]:
aList = [3, 4, 5, 7, 9, 11, 13, 15, 17]
aList[3]

In [None]:
len(aList)

In [None]:
aList[-1]

In [None]:
aList[-9] == aList[0]

In [None]:
aList[3] = 5.5
aList

In [None]:
aList[15]

使用列表对象的index方法获取指定元素首次出现的下标

In [None]:
aList

In [None]:
aList.index(9)

In [None]:
aList.index(100)

使用列表对象的count方法统计指定元素在列表对象中出现的次数

In [None]:
aList = [7, 4, 5, 5.5, 5, 11, 7, 15, 7]

In [None]:
aList.count(5)

如果需要判断列表中是否存在指定的值，可以使用前面介绍的count()方法，如果存在则返回大于0的数，如果返回0则表示不存在。或者，使用更加简洁的“in”关键字来判断一个值是否存在于列表中，返回结果为“True”或“False”。

In [None]:
aList

In [None]:
3 in aList

In [None]:
16 in aList

In [None]:
bList = [[1], [2], [3]]

In [None]:
3 in bList

In [None]:
3 not in bList

In [None]:
not (3 in bList)

In [None]:
[3] in bList

In [None]:
help(zip)

In [None]:
aList = [3, 5, 7, 9, 11]
bList = ['a', 'b', 'c', 'd']
z = zip(aList, bList)
z

In [None]:
next(z)

In [None]:
aList = [3, 5, 7, 9, 11]
bList = ['a', 'b', 'c', 'd']
(3, 'a') in zip(aList, bList)

In [None]:
for a, b in zip(aList, bList):
    print(a,'--->', b)

### 2.1.6 切片操作

* 切片是Python序列的重要操作之一，适用于列表、元组、字符串、range对象等类型。
* 切片使用2个冒号分隔的3个数字来完成，第一个数字表示切片开始位置（默认为0），第二个数字表示切片截止（但不包含）位置（默认为列表长度），第三个数字表示切片的步长（默认为1），当步长省略时可以顺便省略最后一个冒号。可以使用切片来截取列表中的任何部分，得到一个新列表，也可以通过切片来修改和删除列表中部分元素，甚至可以通过切片操作为列表对象增加元素。
* 与使用下标访问列表元素的方法不同，切片操作不会因为下标越界而抛出异常，而是简单地在列表尾部截断或者返回一个空列表，代码具有更强的健壮性。

In [None]:
aList = [3, 4, 5, 6, 7, 9, 11, 13, 15, 17]

In [None]:
aList[::]

In [None]:
aList[::-1]

In [None]:
aList[::2]

In [None]:
aList[1::2]

In [None]:
aList[3::]

In [None]:
aList[3:6]

In [None]:
aList[3:6:1]

In [None]:
aList[0:100:1]

In [None]:
aList[100:]

可以使用切片来原地修改列表内容

In [None]:
aList = [3, 5, 7]
aList[len(aList):]

In [None]:
aList[len(aList):] = [9]
aList

In [None]:
aList[:3] = [1, 2, 3]
aList

In [None]:
aList[:3] = []
aList

In [None]:
aList = list(range(10))
aList

In [None]:
[0] * 5

In [None]:
aList[::2] = [0]*(len(aList)//2)
aList

使用del与切片结合来删除列表元素

In [None]:
aList = [3,5,7,9,11]
del aList[:3]
aList

切片返回的是列表元素的浅拷贝

In [None]:
aList = [3, 5, 7]
bList = aList #bList与aList指向同一个内存
bList

In [None]:
id(aList),id(bList)

In [None]:
bList[1] = 8

In [None]:
aList

In [None]:
aList == bList

In [None]:
aList is bList

In [None]:
id(aList), id(bList)

In [None]:
aList = [3, 5, 7]
bList = aList[::] #浅复制
bList

In [None]:
id(aList),id(bList)

In [None]:
bList[1] = 8

In [None]:
aList

In [None]:
aList == bList

In [None]:
aList is bList

In [None]:
id(aList), id(bList)

BAIDU Python 深拷贝与浅拷贝  
Python标准库中有个 copy 模块，用于对象之间的拷贝，其中常用的两个函数：copy 和 deepcopy；  
copy.copy() 是浅拷贝，只拷贝了父对象，不会拷贝父对象中的子对象；deepcopy 是深拷贝，可以认为是完全的复制过去了；  

In [None]:
l = ['a', 'b', 'c', [1, 2, 3]]
import copy
a = copy.copy(l)
b = copy.deepcopy(l)
a.append('e')
b.append('f')
print(a, b, l)
a[3][2] = 'x'
b[3][2] = 'y'
print(a, b, l)

### 2.1.7 列表排序
使用列表对象的sort方法进行原地排序，支持多种不同的排序方法

In [None]:
aList = [3, 4, 5, 6, 7, 9, 11, 13, 15, 17]
import random

In [None]:
aList

In [None]:
random.shuffle(aList)
aList

In [None]:
help(list.sort)

In [None]:
aList.sort()
aList

In [None]:
help(list.sort)

In [None]:
aList.sort(reverse=True)
aList

In [None]:
f = lambda x:len(str(x))

In [None]:
f([1,2,3])

In [None]:
aList

In [None]:
aList.sort(key = lambda x:len(str(x)))
aList

使用内置函数sorted对列表进行排序并返回新列表

In [None]:
bList = sorted(aList, reverse=True)

In [None]:
aList

In [None]:
print(bList)

In [None]:
aList

In [None]:
sorted(aList, reverse=True)

使用列表对象的reverse方法将元素原地逆序

In [None]:
aList = [3, 4, 5, 11, 13, 15, 17, 6, 7, 9]
aList.reverse()
aList

使用内置函数reversed方法对列表元素进行逆序排列并返回迭代对象

In [None]:
aList = [3, 4, 5, 6, 7, 9, 11, 13, 15, 17]
newList = reversed(aList)
newList

In [None]:
list(newList)

In [None]:
# 如无输出内容，迭代对象已遍历结束，需要重新创建迭代对象
for i in newList:
    print(i, end=' ')

### 2.1.8 用于序列操作的常用内置函数
cmp(列表1，列表2)：对两个列表进行比较，若第一个列表大于第二个，则结果为1，相反则为-1，元素完全相同则结果为0，类似于==运算符，和is、is not不一样。

In [None]:
(1, 2, 3) < (1, 2, 4)

In [None]:
import operator
# cmp Python 3 已不再支持
# cmp((1, 2, 3) , (1, 2, 4))
operator.lt((1, 2, 3) , (1, 2, 4))

In [None]:
[1, 2, 3] == [1, 2, 4]

In [None]:
'ABC' < 'C' < 'Pascal' < 'Python'

In [None]:
cmp( 'Pascal', 'Python')

In [None]:
(1, 2, ('aa', 'ab')) < (1, 2, ('abc', 'a'), 4)

在Python 3.x中，不再支持cmp()函数，可以直接使用关系运算符来比较数值或序列的大小，也可以使用对象的“__le__()”及其相关方法，或者也可以使用其他写法来模拟Python 2.x的内置函数cmp()。

In [None]:
a = [1, 2, 5]
b = [1, 2, 3]
(a>b)-(a<b)

In [None]:
a<=b

In [None]:
a.__le__(b)

In [None]:
a.__gt__(b)

## 2.1.8 用于序列操作的常用内置函数
* len(列表)：返回列表中的元素个数，同样适用于元组、字典、字符串等等。
* max(列表)、 min(列表)：返回列表中的最大或最小元素，同样适用于元组、range。
* sum(列表)：对数值型列表的元素进行求和运算，对非数值型列表运算则出错，同样适用于元组、range。
* zip(列表1,列表2,…):将多个列表对应位置元素组合为元组，并返回包含这些元组的列表。

In [None]:
l = list(range(0,11))
sum(l)

In [None]:
aList = [1,2,3]
bList = [4,5,6]
cList = [7,8,9]
dList = zip(aList, bList, cList)

In [None]:
dList

In [None]:
list(dList)

enumerate(列表):枚举列表元素，返回枚举对象，其每个元素为包含下标和值的元组。该函数对元组、字符串同样有效。

In [None]:
aList = [5, 7, 9, 11, 13]
e = enumerate(aList)
e

In [None]:
e

In [None]:
list(e)

In [None]:
dogs = ['border collie', 'australian cattle dog', 'labrador retriever']
print("Results for the dog show are as follows:\n")
for index, dog in enumerate(dogs):
    place = str(index)
    print("Place: " + place + "\tDog: " + dog.title())

In [None]:
aList = [1,2,3]
bList = [4,5,6]
cList = [7,8,9]
dList = zip(aList, bList, cList)

In [None]:
list(enumerate(zip(aList, bList, cList)))

In [None]:
for item in enumerate(dList):
    print(item)

In [None]:
import random
[random.randint(1,100) for i in range(10)]

In [None]:
type(dList)

列表推导式可以说是Python程序开发时应用最多的技术之一。前面章节曾经使用列表推导式来快速生成包含多个随机数的列表，可以看出，列表推导式使用非常简洁的方式来快速生成满足特定需求的列表，代码具有非常强的可读性。例如：

In [None]:
aList = [x*x for x in range(10)]
aList

In [None]:
#相当于
aList = []
for x in range(10):
    aList.append(x*x)
aList

使用列表推导式实现嵌套列表的平铺

In [None]:
vec = [[1,2,3], [4,5,6], [7,8,9]] 

In [None]:
[num for elem in vec for num in elem] 

In [None]:
#相当于
aList = []
for elem in vec:
    for num in elem:
        aList.append(num)
aList

In [None]:
import os
os.listdir('.')

In [None]:
import os
[filename for filename in os.listdir('.') \
 if filename.endswith('.py')]

In [None]:
aList = [-1,-4,6,7.5,-2.3,9,-11]
[i for i in aList if i>0]

例如，已知有一个包含一些同学成绩的字典，计算成绩的最高分、最低分、平均分，并查找所有最高分同学，代码可以这样编写：

In [None]:
scores = {"Zhang San": 45, \
          "Li Si": 78, \
          "Wang Wu": 40, \
          "Zhou Liu": 96, \
          "Zhao Qi": 65, \
          "Sun Ba": 90, \
          "Zheng Jiu": 78, 
          "Wu Shi": 99, 
          "Wu Shi 2": 99,
          "Dong Shiyi": 60}

In [None]:
type(scores)

In [None]:
scores.values()

In [None]:
scores.items()

In [None]:
scores.keys()

In [None]:
highest = max(scores.values())
lowest = min(scores.values())
highest, lowest

In [None]:
average = sum(scores.values())*1.0/len(scores)
average

In [None]:
highestPerson = [name for name, score in scores.items() \
                 if score == highest]
highestPerson

在列表推导式中使用多个循环，实现多序列元素的任意组合，并且可以结合条件语句过滤特定元素

In [None]:
[(x, y) for x in range(3) for y in range(3)]

In [None]:
[(x, y) for x in [1, 2, 3] for y in [3, 1, 4] if x != y]

使用列表推导式实现矩阵转置

In [None]:
matrix = [ [1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]] 
[[row[i] for row in matrix] for i in range(4)] 

In [None]:
matrix = [ [1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]

In [None]:
len(matrix[0])

In [None]:
[ [ row[i]  for row in matrix] for i in range(0, 4)]

In [None]:
# 相当于 list(zip(matrix[0],matrix[1],matrix[2]))
list(zip(*matrix))

列表推导式中可以使用函数或复杂表达式

In [None]:
def f(v):
    if v%2 == 0:
        v = v**2
    else:
        v = v+1
    return v

In [None]:
def f(v):
    return v**2 if v%2 == 0 else v+1

In [None]:
f(4)

In [None]:
print([f(v) for v in [2, 3, 4, -1] if v>0])

In [None]:
print([(v**2 if v%2 == 0 else v+1) \
       for v in [2, 3, 4, -1] if v>0])

列表推导式支持文件对象迭代 

In [None]:
fp = open('student.txt', 'r')
lines = [line for line in fp]
fp.close()
lines

In [None]:
fp = open('student.txt', 'r')
lines = fp.readlines()
fp.close()
lines

使用列表推导式生成100以内的所有素数

In [None]:
import math

In [None]:
[ p for p in range(2, 100) \
 if 0 not in \
 [ p % d for d in range(2, int(math.sqrt(p))+1)] ]

In [None]:
def isprime(x):
    for i in range(2, int(math.sqrt(x)) + 1):
        if (x % i) == 0:
            return False
    return True

In [None]:
[x for x in  range(2, 100) if isprime(x)]

#### 练习
生成一个列表，列表中元素分别是1~100内，前1个、前2个、前3个、...、前100个元素的和，如[1,3,6,10,...]

In [None]:
aList = list(range(1, 101))
[sum(aList[0:i]) for i in range(1, 101)]

## 2.2 元组
元组和列表类似，但属于不可变序列，元组一旦创建，用任何方法都不可以修改其元素。  
元组的定义方式和列表相同，但定义时所有元素是放在一对圆括号“（”和“）”中，而不是方括号中。  

使用“=”将一个元组赋值给变量。元组需要用括号括起来，如果只有一个元素，一个元素后要加,

In [None]:
a_str = 'a'
type(a_str)

In [None]:
a_tuple = ('a',)
type(a_tuple)

In [None]:
type(a_tuple[0])

In [None]:
a_tuple = ('a', 'b', 'mpilgrim', 'z', 'example')
a_tuple

In [None]:
a=3,
a

In [None]:
x = () #空元组
x

使用tuple函数将其他序列转换为元组

In [None]:
tuple('abcdefg')

In [None]:
tuple(range(10))

In [None]:
aList = [-1, -4, 6, 7.5, -2.3, 9, -11]
aTuple = tuple(aList)
aTuple

In [None]:
aTuple[1] = 5

In [None]:
s = tuple() #空元组
s

使用del删除元组对象，不能删除元组元素

In [None]:
s = ('a', 'b', 'c', 'd', 'e', 'f', 'g')
s[0]

In [None]:
del s[0]

## 2.2.2 元组与列表的区别
* 元组中的数据一旦定义就不允许更改。
* 元组没有append()、extend()和insert()等方法，无法向元组中添加元素；
* 元组没有remove()或pop()方法，也无法对元组元素进行del操作，不能从元组中删除元素。
* 内建的tuple( )函数接受一个列表参数，并返回一个包含同样元素的元组，而list( )函数接受一个元组参数并返回一个列表。从效果上看，tuple( )冻结列表，而list( )融化元组。

## 2.2.2 元组的优点
* <font color=red>元组的速度比列表更快</font>。如果定义了一系列常量值，而所需做的仅是对它进行遍历，那么一般使用元组而不用列表。
* <font color=red>元组对不需要改变的数据进行“写保护”</font>将使得代码更加安全。
* 一些元组可用作字典键（特别是包含字符串、数值和其它元组这样的不可变数据的元组）。<font color=red>列表永远不能当做字典键使用</font>，因为列表不是不可变的。

## 2.2.3 序列解包
可以使用序列解包功能对多个变量同时赋值

In [None]:
x,y,z = 1,2,3
x,y,z

In [None]:
v_tuple = (False, 3.5, 'exp')
(x, y, z) = v_tuple
x,y,z

In [None]:
a=[1,2,3]
b,c,d=a
b,c,d

In [None]:
s={'a':1,'b':2,'c':3}
s.keys()

In [None]:
tuple(s)

In [None]:
b,c,d=s
b,c,d

In [None]:
b,c,d=s.values()
b,c,d

In [None]:
keys=['a','b','c','d']
values=[1,2,3,4]
zip(keys,values)

In [None]:
for k,v in zip(keys,values):
    print(k,v)

In [None]:
aList = [1,2,3]
bList = [4,5,6]
cList = [7,8,9]
dList = zip(aList, bList, cList)
for index, value in enumerate(dList):
    print(index, ':', value)

## 2.2.4 生成器推导式
* 生成器推导式与列表推导式非常接近，只是生成器推导式使用圆括号而不是列表推导式所使用的方括号。
* 与列表推导式不同的是，生成器推导式的结果是一个生成器对象，而不是列表，也不是元组。使用生成器对象的元素时，可以根据需要将其转化为列表或元组，也可以使用生成器对象的next()方法（Python 2.x）或__next__()方法（Python 3.x）进行遍历，或者直接将其作为迭代器对象来使用。
* 不管用哪种方法访问其元素，当所有元素访问结束以后，如果需要重新访问其中的元素，必须重新创建该生成器对象。


In [None]:
g = ((i+2)**2 for i in range(10))
g

In [None]:
type(g)

In [None]:
g.__next__()

In [None]:
next(g)

## 2.3 字典
* 字典是键值对的无序可变集合。
* 定义字典时，每个元素的键和值用冒号分隔，元素之间用逗号分隔，所有的元素放在一对大括号“｛”和“｝”中。
* 字典中的每个元素包含两部分：键和值，向字典添加一个键的同时，必须为该键增添一个值。
* 字典中的键可以为任意不可变数据，比如整数、实数、复数、字符串、元组等等。
* 字典中的键不允许重复。
* globals()返回包含当前作用域内所有全局变量和值的字典
* locals()返回包含当前作用域内所有局部变量和值的字典

In [None]:
type(globals())

## 2.3.1 字典创建与删除
使用=将一个字典赋值给一个变量

In [None]:
a_dict = {'server': 'db.diveintopython3.org', 'database': 'mysql'}
a_dict

In [None]:
x = {} #空字典
x

使用dict利用已有数据创建字典：

In [None]:
keys = ['a','b','c','d']
values = [1,2,3,4]
dictionary = dict(zip(keys,values))
dictionary

In [None]:
dictionary['d']

In [None]:
dictionary['b']=100

In [None]:
dictionary

In [None]:
x = dict() #空字典

使用dict根据给定的键、值创建字典

In [None]:
d=dict(name='Dong',age=37)
d

In [None]:
a = dict(one=1, two=2, three=3)
b = {'one': 1, 'two': 2, 'three': 3}
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three': 3, 'one': 1, 'two': 2})
a == b == c == d == e

以给定内容为键，创建值为空的字典

In [None]:
adict=dict.fromkeys(['name','age','sex'])
adict

## 2.3.2 字典元素的读取
以键作为下标可以读取字典元素，若键不存在则抛出异常

In [None]:
aDict={'name':'Dong', 'sex':'male', 'age':37}
aDict['name']

In [None]:
aDict['tel']

In [None]:
'tel' in aDict

使用字典对象的get方法获取指定键对应的值，并且可以在键不存在的时候返回指定值。

In [None]:
print(aDict.get('address'))

In [None]:
print(aDict.get('address', '地址未知'))

In [None]:
aDict['address'] = '杭州下沙'
print(aDict.get('address', '地址未知'))

In [None]:
aDict

In [None]:
aDict.get('score',[])

In [None]:
aDict

In [None]:
aDict['score'] = aDict.get('score',[])
aDict['score'].append(98)
aDict['score'].append(97)
aDict

## 2.3.2 字典元素的读取
* 使用字典对象的items方法可以返回字典的键、值对列表
* 使用字典对象的keys方法可以返回字典的键列表
* 使用字典对象的values方法可以返回字典的值列表

In [None]:
aDict={'name':'Dong', 'sex':'male', 'age':37}
aDict.items()

In [None]:
for item in aDict.items():
    print(item)

In [None]:
for key, value in aDict.items():
    print(key, value)

In [None]:
for key in aDict:
    print(key)

In [None]:
aDict.keys()

In [None]:
aDict.values()

## 2.3.3 字典元素的添加与修改
当以指定键为下标为字典赋值时，若键存在，则可以修改该键的值；若不存在，则表示添加一个键、值对。

In [None]:
aDict['age'] = 38
aDict

In [None]:
aDict['address'] = '`'
aDict

使用字典对象的update方法将另一个字典的键、值对添加到当前字典对象

In [None]:
aDict.update({'a':'a','b':'b'})
aDict

* 使用del删除字典中指定键的元素
* 使用字典对象的clear方法来删除字典中所有元素
* 使用字典对象的pop 方法删除并返回指定键的元素
* 使用字典对象的popitem方法删除并返回字典中的一个元素

In [None]:
aDict

In [None]:
del aDict['b']

In [None]:
aDict.popitem()

In [None]:
aDict

## 2.3.4 字典应用案例

实现一个字典程序

In [None]:
endict = {'abandon':'vt.丢弃；放弃，抛弃',
'abide':'vt.遵守 vt.忍受',
'ability':'n.能力；能耐，本领',
'able':'adj.有能力的；能干的',
'abnormal':'a.不正常的；变态的',
'aboard':'adv.上船(飞机、车)',
'abolish':'vt.废除，取消',
'about':'prep.关于；在…周围',
'above':'prep.在…上面；高于',
'abroad':'ad.(在)国外；到处',
'absence':'n.缺席，不在场；缺乏',
'absent':'a.不在场的；缺乏的',
'absolute':'a.绝对的；纯粹的',
'absolutely':'ad.完全地；绝对地',
'absorb':'vt.吸收；使专心',
'absorption':'n.吸收；专注',
'abstract':'adj.抽象的；深奥的',
'absurd':'a.不合理的，荒唐的',
'abundance':'n.丰富，充裕',
'abundant':'a.丰富的；大量的',
'abuse':'vt.滥用；虐待 n.滥用',
'academic':'a.学院的；学术的',
'academic':'a.学院的；学术的',
'accelerate':'vt.(使)加快；促进'};

In [None]:
english = input('请输入你要查询的单词：')
if english in endict:
    print("%s : %s" % (english,endict[english]))
else:
    print("找不到单词%s" % english)

In [None]:
endict

In [None]:
fp = open('新东方红宝书.txt', 'r', encoding='utf8')
for line in fp:
    words = line.split(' ')
    if len(words) == 2:
        key,value = words
        endict[key] = value
fp.close()

下面的代码首先生成包含1000个随机字符的字符串，然后统计每个字符的出现次数。

In [4]:
import string
string.digits

'0123456789'

In [5]:
import string
import random
x = string.ascii_letters + string.digits + string.punctuation
x

'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

In [6]:
y = [random.choice(x) for i in range(1000)]
y

['@',
 'B',
 'p',
 ']',
 'X',
 'w',
 '#',
 'I',
 'e',
 '-',
 '#',
 '#',
 'R',
 '3',
 '+',
 '8',
 '7',
 '-',
 'Q',
 'N',
 '`',
 'P',
 '@',
 '=',
 '[',
 'E',
 'l',
 'q',
 's',
 'o',
 'u',
 '<',
 '8',
 '6',
 '?',
 '"',
 'P',
 'L',
 'E',
 'M',
 '"',
 'U',
 '3',
 'e',
 '/',
 '7',
 '2',
 'a',
 'M',
 'c',
 'c',
 '{',
 'y',
 '?',
 'L',
 '(',
 '4',
 'b',
 '5',
 '`',
 'v',
 'F',
 'f',
 'I',
 'r',
 'F',
 'V',
 'u',
 '3',
 '{',
 '@',
 '<',
 '(',
 '_',
 '~',
 '#',
 'j',
 '@',
 '#',
 '4',
 'j',
 'S',
 '/',
 'H',
 'V',
 ':',
 'A',
 ';',
 'E',
 ',',
 'j',
 'n',
 '4',
 '=',
 'y',
 'Q',
 '0',
 'Z',
 '$',
 '(',
 'J',
 'f',
 '~',
 '\\',
 'W',
 ':',
 'G',
 'v',
 'a',
 'v',
 'i',
 '!',
 '^',
 's',
 'R',
 'd',
 'z',
 'i',
 '2',
 ',',
 '<',
 '?',
 'S',
 '!',
 '>',
 'Q',
 '<',
 'y',
 'z',
 'd',
 '[',
 'C',
 '9',
 'w',
 'r',
 'q',
 '<',
 'i',
 '5',
 '9',
 '"',
 'k',
 'y',
 'D',
 't',
 'l',
 '|',
 '.',
 'n',
 '[',
 'F',
 'u',
 '~',
 'k',
 '9',
 ']',
 '=',
 '9',
 'M',
 '@',
 '|',
 '_',
 's',
 '&',
 '.',
 'j',
 '&

In [10]:
z = ''.join(y)
z

'@Bp]Xw#Ie-##R3+87-QN`P@=[Elqsou<86?"PLEM"U3e/72aMcc{y?L(4b5`vFfIrFVu3{@<(_~#j@#4jS/HV:A;E,jn4=yQ0Z$(Jf~\\W:Gvavi!^sRdzi2,<?S!>Q<yzd[C9wrq<i59"kyDtl|.n[Fu~k9]=9M@|_s&.j&JhEi8@)o>+[181bAiy4,zkAn532T`ph9u=yP;x=N1GrX/;az~7o$c??U[qO"u}lC1u\'(5Un|<[C&^UT&AE88x\')#]XG8Np5jS7[l*rpzPrQQ(:}RJ8d%,^ty7MPe3GE+e\\5X;+44j_6eoBjdSbJ914n-o~D.O{FO0AH|gE@vzRkL=^_RJ_ouLguMBy;U@0~uTGAWjdf8Y}S:urovEl~vL~*#^=4s}v5{RRmZz%5@EnMs/xfJh#_@<GF^]$Fx#sU>#M$K\'CBJM;gU`h=+Y|6{`!J(F55ZnR??M,B:YAWN2B$v!V3om#9XX;CM6,\\$V@6\\%Q;Bb*M\\qcEVE[o[]wRqpC-c3UcSBeh,2OMzakfmsoo-iWO1k%1pEwHj6/HMY;.oZIPQ+Kl+Nx3;k@-jj>.x\'-rM[f0PG"jhYDK19_@zmF41jXY`D8+if!mVv|ZY1-CDH+}tj7UbJ{gv(XRGoP9]n1~d"Xu#e#2L(MvjjMzos;/XQ}c+MvNCI?WSS2}2_\'8em]STei+<):r]EVdfswe9!]a0I&D,dzBek#*XTu4r"q6l8]JC#e*K^@-057TIt0OJ#aw%mfU"C7YfB?i]@22hqlhc0D"v.:-zoeyd@OQa)b?,FmYPt>:Nq#0X$IR-S?z-+YRW_W]vc_Thvl1Or\\lUqS1z[^AGtdn%XgND-Jk9N%0nt/Jq<RPDWygZ~#?ZHrwO>)m/<Zf<iMUGyl[NHQL2t#@KDjCn.^`e}z#w"0pj,>oe|S;Uip>R%>m%Y[jkQ-4*a}v&RQl[cACj=!]TZzF__?\'Eo\\7\'%M*haeK$EpN\'ts@2f$\\=

In [14]:
d = dict()
for ch in z:
    d[ch] = d.get(ch, 0) + 1
d

{'!': 7,
 '"': 11,
 '#': 21,
 '$': 9,
 '%': 10,
 '&': 6,
 "'": 9,
 '(': 8,
 ')': 6,
 '*': 7,
 '+': 12,
 ',': 10,
 '-': 14,
 '.': 7,
 '/': 8,
 '0': 11,
 '1': 13,
 '2': 12,
 '3': 8,
 '4': 11,
 '5': 11,
 '6': 7,
 '7': 9,
 '8': 13,
 '9': 11,
 ':': 9,
 ';': 13,
 '<': 11,
 '=': 10,
 '>': 10,
 '?': 13,
 '@': 18,
 'A': 9,
 'B': 10,
 'C': 13,
 'D': 10,
 'E': 15,
 'F': 10,
 'G': 10,
 'H': 7,
 'I': 7,
 'J': 14,
 'K': 6,
 'L': 7,
 'M': 19,
 'N': 11,
 'O': 9,
 'P': 10,
 'Q': 12,
 'R': 15,
 'S': 12,
 'T': 8,
 'U': 13,
 'V': 7,
 'W': 9,
 'X': 13,
 'Y': 11,
 'Z': 10,
 '[': 15,
 '\\': 8,
 ']': 13,
 '^': 10,
 '_': 12,
 '`': 7,
 'a': 9,
 'b': 6,
 'c': 10,
 'd': 10,
 'e': 16,
 'f': 12,
 'g': 7,
 'h': 10,
 'i': 11,
 'j': 20,
 'k': 10,
 'l': 12,
 'm': 10,
 'n': 11,
 'o': 17,
 'p': 10,
 'q': 10,
 'r': 11,
 's': 10,
 't': 9,
 'u': 12,
 'v': 16,
 'w': 8,
 'x': 6,
 'y': 11,
 'z': 16,
 '{': 6,
 '|': 7,
 '}': 9,
 '~': 11}

## 2.3.5 有序字典
Python内置字典是无序的，前面的示例很好地说明了这个问题。如果需要一个可以记住元素插入顺序的字典，可以使用collections.OrderedDict。例如下面的代码：

In [15]:
x = dict() #无序字典
x['c'] = 8
x['b'] = 5
x['a'] = 3
x

{'a': 3, 'b': 5, 'c': 8}

In [16]:
import collections
x = collections.OrderedDict() #有序字典
x['c'] = 8
x['b'] = 5
x['a'] = 3
x

OrderedDict([('c', 8), ('b', 5), ('a', 3)])

## 2.3.6 字典推导式

In [17]:
s = {x:x.strip() for x in ('  he  ', 'she    ', '    I')}
s

{'    I': 'I', '  he  ': 'he', 'she    ': 'she'}

In [18]:
for k, v in s.items():
    print(k, ':', v)

she     : she
    I : I
  he   : he


## 2.4 集合
集合是无序可变序列，使用一对大括号界定，元素不可重复。

## 2.4.1 集合的创建与删除
* 直接将集合赋值给变量
* 使用set将其他类型数据转换为集合
* 使用del删除整个集合

In [19]:
a={3,5}
a

{3, 5}

In [20]:
type(a)

set

In [21]:
a.add(7)
a

{3, 5, 7}

In [22]:
a_set=set(range(8,14))
a_set

{8, 9, 10, 11, 12, 13}

In [23]:
b_set=set([0,1,2,3,0,1,2,3,7,8])
b_set

{0, 1, 2, 3, 7, 8}

In [24]:
c_set = set() #空集合
c_set

set()

当不再使用某个集合时，可以使用del命令删除整个集合。另外，也可以使用集合对象的pop()方法弹出并删除其中一个元素，或者使用集合对象的remove()方法直接删除指定元素，以及使用集合对象的clear()方法清空集合删除所有元素。

In [25]:
x = list(range(-100, 100))
y = [i**2 for i in x]
y

[10000,
 9801,
 9604,
 9409,
 9216,
 9025,
 8836,
 8649,
 8464,
 8281,
 8100,
 7921,
 7744,
 7569,
 7396,
 7225,
 7056,
 6889,
 6724,
 6561,
 6400,
 6241,
 6084,
 5929,
 5776,
 5625,
 5476,
 5329,
 5184,
 5041,
 4900,
 4761,
 4624,
 4489,
 4356,
 4225,
 4096,
 3969,
 3844,
 3721,
 3600,
 3481,
 3364,
 3249,
 3136,
 3025,
 2916,
 2809,
 2704,
 2601,
 2500,
 2401,
 2304,
 2209,
 2116,
 2025,
 1936,
 1849,
 1764,
 1681,
 1600,
 1521,
 1444,
 1369,
 1296,
 1225,
 1156,
 1089,
 1024,
 961,
 900,
 841,
 784,
 729,
 676,
 625,
 576,
 529,
 484,
 441,
 400,
 361,
 324,
 289,
 256,
 225,
 196,
 169,
 144,
 121,
 100,
 81,
 64,
 49,
 36,
 25,
 16,
 9,
 4,
 1,
 0,
 1,
 4,
 9,
 16,
 25,
 36,
 49,
 64,
 81,
 100,
 121,
 144,
 169,
 196,
 225,
 256,
 289,
 324,
 361,
 400,
 441,
 484,
 529,
 576,
 625,
 676,
 729,
 784,
 841,
 900,
 961,
 1024,
 1089,
 1156,
 1225,
 1296,
 1369,
 1444,
 1521,
 1600,
 1681,
 1764,
 1849,
 1936,
 2025,
 2116,
 2209,
 2304,
 2401,
 2500,
 2601,
 2704,
 2809,
 2916,
 30

In [27]:
z = set(y)
z

101

In [28]:
len(z)

101

In [29]:
a={1, 4, 2, 3}

In [30]:
a.pop()

1

In [31]:
a

{2, 3, 4}

In [32]:
a.add(2)
a

{2, 3, 4}

In [33]:
a={1, 4, 2, 3}
a.remove(3) #删除指定元素
a

{1, 2, 4}

## 2.4.2 集合操作
Python集合支持交集、并集、差集等运算

In [63]:
a_set = set(range(8,14))
b_set=set([0,1,2,3,0,1,2,3,7,8])
print("a_set:", a_set, "\tb_set:",b_set)

a_set: {8, 9, 10, 11, 12, 13} 	b_set: {0, 1, 2, 3, 7, 8}


In [35]:
a_set.union(b_set)

{0, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13}

In [36]:
a_set

{8, 9, 10, 11, 12, 13}

In [37]:
b_set

{0, 1, 2, 3, 7, 8}

In [38]:
a_set|b_set

{0, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13}

In [39]:
a_set.intersection(b_set)

{8}

In [40]:
a_set & b_set

{8}

In [41]:
a_set.difference(b_set)

{9, 10, 11, 12, 13}

In [42]:
a_set - b_set

{9, 10, 11, 12, 13}

In [43]:
a_set.symmetric_difference(b_set)

{0, 1, 2, 3, 7, 9, 10, 11, 12, 13}

In [44]:
a_set ^ b_set

{0, 1, 2, 3, 7, 9, 10, 11, 12, 13}

使用集合快速提取序列中单一元素

In [50]:
import random
listRandom = [random.choice(range(200)) for i in range(100)]
listRandom

[173,
 12,
 6,
 84,
 168,
 30,
 164,
 197,
 14,
 42,
 198,
 117,
 111,
 94,
 77,
 74,
 73,
 131,
 137,
 192,
 18,
 119,
 17,
 55,
 75,
 163,
 156,
 112,
 138,
 57,
 161,
 107,
 130,
 37,
 66,
 144,
 143,
 112,
 135,
 2,
 20,
 12,
 82,
 9,
 53,
 23,
 89,
 148,
 0,
 176,
 66,
 41,
 136,
 11,
 59,
 77,
 190,
 53,
 57,
 180,
 93,
 119,
 196,
 156,
 73,
 92,
 7,
 171,
 195,
 128,
 50,
 154,
 190,
 90,
 6,
 177,
 197,
 106,
 88,
 96,
 128,
 94,
 5,
 173,
 36,
 39,
 112,
 44,
 8,
 83,
 159,
 106,
 81,
 149,
 156,
 31,
 188,
 166,
 64,
 16]

In [52]:
noRepeat = []
for i in listRandom:
    if i not in noRepeat:
        noRepeat.append(i)

In [53]:
len(noRepeat)

82

In [54]:
newSet = set(listRandom)
len(newSet)

82

## 2.4.3 集合推导式

In [None]:
s = {x.strip() for x in ('  he  ', 'she    ', '    I')}
s

## 2.5 再谈内置方法sorted()
* 列表对象提供了sort()方法支持原地排序，而内置函数sorted()返回新的列表，并不对原列表进行任何修改。除此之外，sorted()方法还可以对元组、字典进行排序，并且借助于其key和cmp参数（Python 3.x的sorted()方法没有cmp参数）可以实现更加复杂的排序。
* 需要注意的是，Python 2.x中内置方法sorted()的cmp参数会被处理多次，而key参数只会被处理一次，具有更高的速度。

In [None]:
persons = [{'name':'Dong', 'age':37}, {'name':'Zhang', 'age':40}, {'name':'Li', 'age':50}, {'name':'Dong', 'age':43}]
print(persons)

使用key来指定排序依据，先按姓名升序排序，姓名相同的按年龄降序排序

In [None]:
sorted_persons = sorted(persons, key=lambda x:(x['name'], -x['age']))

In [None]:
sorted_persons

In [None]:
from operator import itemgetter
phonebook = {'Linda':'7750', 'Bob':'9345', 'Carol':'5834'}

In [None]:
phonebook_items = list(phonebook.items())
phonebook_items

In [None]:
itemgetter(0)(phonebook_items[0])

In [None]:
sorted(phonebook.items(), key=itemgetter(1)) #按字典中元素值进行排序

In [None]:
sorted(phonebook.items(), key=itemgetter(0)) #按字典中元素的键进行排序

In [None]:
gameresult = [['Bob', 95.0, 'A'], ['Alan', 86.0, 'C'], ['Mandy', 83.5, 'A'], ['Rob', 89.3, 'E']]

In [None]:
sorted(gameresult, key=itemgetter(0, 1)) #按姓名升序，姓名相同按分数升序排序

In [None]:
sorted(gameresult, key=itemgetter(1, 0)) #按分数升序，分数相同的按姓名升序排序

In [None]:
sorted(gameresult, key=itemgetter(2, 0)) #按等级升序，等级相同的按姓名升序排序

In [None]:
gameresult = [{'name':'Bob', 'wins':10, 'losses':3, 'rating':75.0},
              {'name':'David', 'wins':3, 'losses':5, 'rating':57.0},
              {'name':'Carol', 'wins':4, 'losses':5, 'rating':57.0},
              {'name':'Patty', 'wins':9, 'losses':3, 'rating':72.8}]

In [None]:
#按’wins’升序，该值相同的按’name’升序排序
sorted(gameresult, key=itemgetter('wins', 'name')) 

以下代码演示如何根据另外一个列表的值来对当前列表元素进行排序

In [None]:
list1 = ["what", "I'm", "sorting", "by"]
list2 = ["something", "else", "to", "sort"]

In [None]:
pairs = zip(list1, list2)
pairs = sorted(pairs)

In [None]:
pairs

In [None]:
result = [x[1] for x in pairs]
result

## 2.6 其他数据结构
* 在Python中，除了基本序列之外，还有其他一些常用的数据结构，如堆、栈、队列、树、图等等。
* 有些结构Python已经提供，而有些则需要自己利用基本数据结构来实现。
* <font color=red> 这块内容大家先自学 </font>