本章介绍一种内置类型——元组，并展示列表,字典和元组三者如何一起工作。

## 元组是不可变的

元组是值的一个序列。其中的值可以是任何类型，并且按照整数下标索引，所以从这方面看，元组和列表很像。但元组和列表之间存在一个很重要的区别，就是元组是不可变的。

语法上，元组是用逗号分隔的一列值:

In [1]:
t = 'a','b','c','d','e'

但我们表示元组时，一般是用括号括起来:

In [2]:
t = ('a','b','c','d','e')

若要新建只包含一个元素的元组，则需要在后面添加一个逗号:

In [3]:
t1 = 'a',
print(type(t1))

<class 'tuple'>


但用括号括起来的单独的值并不是元组:

In [4]:
t2 = ('a')
print(type(t2))

<class 'str'>


新建元组的另一种形式是使用内置函数`tuple`。不带参数时，它会新建一个空元组:

In [5]:
t = tuple()
print(t)

()


如果参数是一个序列，比如字符串,列表或者元组，结果就是一个包含序列的元素的元组:

In [6]:
t = tuple('lupins')
print(t)

('l', 'u', 'p', 'i', 'n', 's')


大多数列表操作也可以用于元组。方括号操作符可以用下标取得元素:

In [7]:
t = ('a','b','c','d','e')
print(t[0])

a


切片操作符选择一个范围内的元素:

In [8]:
print(t[1:3])

('b', 'c')


但如果尝试修改元组中的一个元素，则会报错:

In [9]:
t[0] = 'A'

TypeError: 'tuple' object does not support item assignment

这是因为元组是不可变的，所以不能修改它的元素。但是可以将一个元组替换为另一个:

In [11]:
t = ('A',) + t[1:]
print(t)

('A', 'b', 'c', 'd', 'e')


这条语句生成新元组，然后使 `t` 引用它。

关系运算符适用于元组和其他序列。Python 从比较每个序列的第一个元素开始。如果它们相等，它就继续比较下一个元素，依此类推，直到它找到不同元素为止。

In [12]:
(0,1,2)<(0,3,4)

True

In [14]:
[0,1,2]<[0,3,4]

True

In [15]:
(0,1,20000)<(0,3,4)

True

## 元组赋值

交换两个变量的值往往很有用。使用传统的赋值方式，需要使用一个临时变量。例如，若要交换 `a` 和 `b`。

In [18]:
a = 1 
b = 2
temp = a
a = b
b = temp

这种解决方案比较笨拙，而在 Python 中我们可以使用**元组赋值**: 

In [20]:
a,b = b,a

左边是一个变量的元组，右边是表达式的元组。每个值会被赋值给相应的变量。右边所有的表达式，都会在任何赋值操作进行之前完成求值。

需要注意，左边变量的个数和右边值的个数必须相同，否则则会报错:

In [22]:
a,b = 1,2,3

ValueError: too many values to unpack (expected 2)

更通用地，右边可以是任意类型的序列(字符串,列表或元组)。例如，想要将电子邮件地址拆分成用户名和域名，可以这么写:

In [24]:
addr = 'monty@python.org'
uname,domain = addr.split('@')

`split` 返回两个元素的列表，第一个元素被复制到 `uname`，第二个到 `domain` 上。

In [25]:
uname

'monty'

In [26]:
domain

'python.org'

## 作为返回值的元组

严格地说，函数只能返回一个值，但我们可以将元组作为返回值，效果和返回多个值差不多。例如，如果将两个整数相除，得到商和余数，那么先计算 `x/y` 再计算 `x%y` 并不高效。更好地方式是同时计算它们。

内置函数 `divmod` 接收两个参数，并返回两个值的元组，即商和余数。可以将结果存为一个元组:

In [27]:
t = divmod(7,3)
print(t)

(2, 1)


还可以使用元组赋值来分别存储结果中的元素:

In [28]:
quot, rem = divmod(7,3)
print(quot)
print(rem)

2
1


下面给出返回一个元组的函数的示例:

In [29]:
def min_max(t):
    return min(t),max(t)

`max` 和 `min` 都是内置函数，分别返回一个序列的最大值和最小值。`min_max` 计算这两个值并将它们作为一个元组返回。

## 可变长参数元组

函数可以接收不定个数的参数。以 `*` 开头的参数名会 **收集(gather)** 所有的参数到一个元组上。例如，`printall` 接收任意个数的参数并打印它们:

In [30]:
def printall(*args):
    print(args)

收集参数可以使用任何你想要的名称，但按惯例通常使用 `args`。给出使用该函数的一个范例:

In [31]:
printall(1,2.0,'3')

(1, 2.0, '3')


收集的反面是**分散(scatter)**。如果想将一个序列的值作为可变长参数传入到函数中，可以使用 `*` 操作符。例如，`divmod` 正好接收两个参数，但它不接收元组:

In [32]:
t = (7,3)
divmod(t)

TypeError: divmod expected 2 arguments, got 1

但若将元组**分散**，就可以用了:

In [33]:
divmod(*t)

(2, 1)

很多内置函数使用可变长参数元组。例如，`max` 和 `min` 都可以接收任意个数的参数:

In [34]:
max(1,2,3)

3

但 `sum` 并不是这样:

In [36]:
sum(1,2,3)

TypeError: sum() takes at most 2 arguments (3 given)

## 列表和元组

`zip` 是一个内置函数，接收两个或多个序列，并返回一个元组列表。每个元组包含来自每个序列中的一个元素。这个函数的名字取自拉链(zipper)，它可以将两行链牙交替连接起来。

下面的例子将字符串和一个列表"拉"到一起:

In [37]:
s = 'abc'
t = [0,1,2]
zip(s,t)

<zip at 0x7f1456f5d480>

结果是一个 **zip** 对象，它是一个迭代访问由元组组成的序列的对象，它知道如何遍历每个元素对。使用 `zip` 最常用的方式是在 `for` 循环中:

`zip` 对象是一种**迭代器**，即用来访问迭代一个序列的对象。迭代器与列表有些方面类似，但与列表不同的是，迭代器不能使用下标来选择对象。

如果需要使用列表的操作符和方法，可以利用 `zip` 对象制作一个列表:

In [39]:
list(zip(s,t))

[('a', 0), ('b', 1), ('c', 2)]

结果是一个由元组组成的列表。在本例中，每个元组包含字符串中的一个字符，以及列表中对应的一个元素。

如果序列之间的长度不同，则结果的长度是所有序列中最短的那个:

In [40]:
list(zip('Anne','Elk'))

[('A', 'E'), ('n', 'l'), ('n', 'k')]

可以在 `for` 循环中使用元组赋值来访问元组的列表，:

In [41]:
t = [('a',0),('b',1),('c',2)]
for letter,number in t:
    print(number,letter)

0 a
1 b
2 c


每次循环中，Python 选择列表中的下一个元组，并将其元素赋值给`letter` 和`number`。

如果组合使用 `zip`,`for` 循环以及元组赋值，可以得到一种很有用的模式，用于同时遍历两个或更多序列。例如，下面的`has_match` 函数接收两个序列，`t1` 和 `t2`，并当存在一个下标 `i`，且保证 `t1[i] == t2[i]` 时返回 `True`：

In [43]:
def has_match(t1,t2):
    for x,y in zip(t1,t2):
        if x == y:
            return True
    return False

如果需要遍历序列中的元素以及它们的下标，可以使用内置函数 `enumerate`:

In [44]:
for index,element in enumerate('abc'):
    print(index,element)

0 a
1 b
2 c


这个枚举的结果是一个枚举对象，这个对象迭代一个对序列，在这个例子中，每个对都包含一个下标(从 0 开始)和一个来自给定序列的元素。

## 字典和元组

字典有一个 `items` 方法可以返回一个元组的序列，其中每个元组是一个键值对:

In [45]:
d = {'a':0,'b':1,'c':2}
t = d.items()
print(t)

dict_items([('a', 0), ('b', 1), ('c', 2)])


其结果是一个 `dict_item` 对象，它是一个迭代器，可以迭代访问每一个键值对。可以使用 `for` 循环来访问:

In [46]:
for key,value in d.items():
    print(key,value)

a 0
b 1
c 2


从反方向出发，可以使用一个元组列表来初始化一个新的字典:

In [48]:
t = [('a',0),('c',2),('b',1)]
d = dict(t)
print(d)

{'a': 0, 'c': 2, 'b': 1}


组合使用 `dict` 和 `zip` 可以得到一个简洁的创建字典的方法:

In [49]:
d = dict(zip('abc',range(3)))
print(d)

{'a': 0, 'b': 1, 'c': 2}


字典方法 `update` 也接收一个元组列表，并将它们作为键值对添加到一个已有的字典中。使用元组作为字典的键很常见(主要是因为不能使用列表)。例如，一个电话号码簿可能需要将姓名对映射到电话号码。定义 `last`,`first` 和 `number`，可以这样写:

In [52]:
last = 'wang'
first = 'dong'
number = '1234'
directory = {}
directory[last,first] = number

在方括号中的表达式是一个元组。另外，我们也可以使用元组赋值来遍历这个字典:

In [53]:
for last,first in directory:
    print(first,last,directory[last,first])

dong wang 1234


这个循环遍历字典 `directory` 的所有键，它们都是元组。它将每一个元组的元素赋值给 `last` 和 `first`，接着打印出名字以及对应的电话号码。

在状态图中，有两种方式可以表达元组。详细的版本和列表一样，显示索引和元素。例如，元组 `('Cleese','John')` 可以如下图所示:

<img src='figures/12-11.jpg'>

<img src='figures/12-12.jpg'>

这里元组使用 Python 的语法作为图形化的简写展示。

## 序列的序列

在很多环境中，不同类型的序列(字符串,列表和元组)都可以互换使用。我们该如何选择使用呢?

字符串比其他序列有更多限制，因为它的元素必须是字符。它们也是不可变的。如果需要修改一个字符串中的字符(而不是新建一个字符串)，可能需要使用字符的列表。

列表比元组更加通用，主要因为它是可变的。但也有一些情况下可能会优先选择元组。

1. 在有些环境，如返回语句中，创建元组比创建列表从语法上说更容易;
2. 如果需要用序列作为字典的键，则必须使用不可变类型，如元组或字符串;
3. 如果要想函数传入一个序列作为参数，使用元组可能会减少潜在的由假名导致的不可预知行为。

因为元组是不可变的，它们不提供类似 `sort` 和 `reverse` 之类的方法，这些方法修改现有的序列。但 Python 也提供了内置函数 `sorted`，可以接收任何序列作为参数，并按排好的顺序返回带有同样元素的新列表。Python 还提供了 `reverse`，可以接收序列作为参数，并返回一个以相反顺序遍历列表的迭代器。

## 调试

列表,字典和元组都被同义看作是一种 **数据结构**。这一章我们开始接触复合数据结构，像元组的列表，或者用元组做键,用列表做值的字典等。复合数据结构很有用，但它容易导致所谓的 **结构错误**，也就是说，数据结构因为错的类型,大小或结构导致的错误。例如，如果你期望得到一个包含单个整数的列表，但提供给你的是一个单个整数(而不是在列表中)，就会出错。

书中提供了一个模块 `structshape`，接收任何数据类型作为参数，并返回一个描述它的形状的字符串。

给出一个简单列表的结果:

In [4]:
from structshape import structshape
t = [1,2,3]
print(structshape(t))

list of 3 int


给出一个列表的列表的结果:

In [7]:
t2 = [[1,2],[3,4],[5,6]]
print(structshape(t2))

list of 3 list of 2 int


如果列表的元素不是同一种类型，`structshape` 会根据它们的类型按顺序分组:

In [8]:
t3 = [1,2,3,4.0,'5','6',[7],[8],[9]]
print(structshape(t3))

list of (3 int, float, 2 str, 3 list of int)


给出元组的列表:

In [9]:
s = 'abc'
lt = list(zip(t,s))
print(structshape(t3))

list of (3 int, float, 2 str, 3 list of int)


下面是一个字典，有 3 个从整数映射到字符串的项:

In [11]:
d = dict(lt)
print(structshape(d))

dict of 3 int->str
