# 2 列表和元组

> **数据结构**：以某种方式（如通过编号）组合起来的数据元素（如数、字符乃至其他数据结构）集合。

&emsp;&emsp;在 Python 中，最基本的数据结构是**序列（sequence）**。序列中的每个元素都有其位置及索引。

## 2.1 序列概述

&emsp;&emsp;Python 内置了多种序列，本章主要讨论最常用的两种：**列表和元组**。

&emsp;&emsp;列表和元组的主要不同在于，列表是可以修改的，而元组不可以。这意味着列表适用于需要中途添加元素的情形，而元组适用于出于某种考虑需要禁止修改序列的情形。

&emsp;&emsp;在需要处理一系列值时，序列很有用。在下面的例子中，使用列表来表示人，其中第一个元素为姓名，而第二个元素为年龄：

In [1]:
gaius = ['Gaius Yao', 22]

&emsp;&emsp;序列还可包含其他序列，因此可创建一个由数据库中所有人员组成的列表：

In [2]:
bruce = ['Bruce Wayne', 42]

In [3]:
database = [gaius, bruce]

In [4]:
database

[['Gaius Yao', 22], ['Bruce Wayne', 42]]

> **注意**：Python 支持一种数据结构的基本概念，名为**容器（container）**。容器基本上就是可包含其他对象的对象。两种主要的容器是序列（如列表和元组）和映射（如字典）。在序列中，每个元素都有编号，而在映射中，每个元素都有名称（也叫键）。映射将在第4章详细讨论。有一种既不是序列也不是映射的容器，它就是集合（set），将在第10章讨论。

## 2.2 通用的序列操作

&emsp;&emsp;有几种操作适用于所有序列，包括**索引**、**切片**、**相加**、**相乘**和**成员资格检查**。另外，Python 还提供了一些内置函数，可用于确定序列的长度以及找出序列中最大和最小的元素。

> **注意：**这里不会介绍**迭代（iteration）**这一重要操作，对序列进行迭代意味着对其每个元素都执行特定的操作。有关迭代的详细信息，请参阅5.5节。

### 2.2.1 索引

&emsp;&emsp;序列中的所有元素都有编号——从0开始递增。可以通过编号来访问各元素：

In [5]:
greeting = 'Hello'

In [6]:
greeting[0]

'H'

> **注意：**字符串就是由字符组成的序列。索引 0 指向第一个元素，这里为字母 H。不同于其他一些语言，Python 没有专门用于表示字符的类型，因此一个字符就是只包含一个元素的字符串。

&emsp;&emsp;这种编号被称为索引（indexing），可使用索引来访问和获取元素。，索引从 0 开始编号，负索引表示序列末尾元素的位置：

In [7]:
greeting[-1]

'o'

&emsp;&emsp;对于字符串字面量（以及其他的序列字面量），可直接对其执行索引操作，无需先将其赋给变量：

In [8]:
'Hello'[1]

'e'

&emsp;&emsp;如果函数调用返回一个序列，可直接对其执行索引操作：

In [9]:
fourth = input('Year:')[3]

Year:2018


In [10]:
fourth

'8'

**代码清单 2-1**

&emsp;&emsp;所示的示例程序要求输入年、月（数1～12）、日（数1～31），再使用相应的月份名等将日期打印出来：

In [11]:
months = [
    'January',
    'February',
    'March',
    'April',
    'May',
    'June',
    'July',
    'August',
    'September',
    'October',
    'November',
    'December'
]

# 一个列表，其中包含数 1～31 对应的结尾
endings = ['st', 'nd', 'rd'] + 17 * ['th'] \
    + ['st', 'nd', 'rd'] + 7 * ['th'] \
    + ['st']
year = input('Year: ')
month = input('Month (1-12): ')
day = input('Day (1-31): ')
month_number = int(month)
day_number = int(day)

# 将表示月和日的数减 1，这样才能得到正确的索引
month_name = months[month_number-1]
ordinal = day + endings[day_number-1]
print(month_name + ' ' + ordinal + ', ' + year)

Year: 2018
Month (1-12): 5
Day (1-31): 4
May 4th, 2018


### 2.2.2 切片

&emsp;&emsp;除使用索引来访问单个元素外，还可使用**切片（slicing）**来访问特定范围内的元素。为此，可使用两个索引来指定切片的边界，并用冒号分隔。其中第一个索引指定的元素包含在切片内，但第二个索引指定的元素不包含在切片内：

In [12]:
tag = '<a href="http://www.python.org">Python web site</a>'

In [13]:
tag[9:30]

'http://www.python.org'

In [14]:
tag[32:-4]

'Python web site'

&emsp;&emsp;如果切片结束于序列末尾，可省略第二个索引；同样，如果切片始于序列开头，可省略第一个索引：

In [15]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [16]:
numbers[-3:]

[8, 9, 10]

In [17]:
numbers[:3]

[1, 2, 3]

&emsp;&emsp;而如果要复制整个序列，可将两个索引都省略：

In [18]:
numbers[:]

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

**代码清单 2-2**

&emsp;&emsp;输入一个URL，并从中提取域名。

In [19]:
url = input('Please enter the URL:')
domain = url[11:-4]

print("Domain name: " + domain)

Please enter the URL:http://www.python.org
Domain name: python


&emsp;&emsp;执行切片操作时，你显式或隐式地指定起点和终点，但通常省略另一个参数，即步长。在下面的例子中，显式地指定步长为 2：

In [20]:
numbers[0:10:2]

[1, 3, 5, 7, 9]

&emsp;&emsp;步长不能为 0，但可以为负数：

In [21]:
numbers[8:3:-1]

[9, 8, 7, 6, 5]

### 2.2.3 序列相加

&emsp;&emsp;可用加法运算 `+` 来拼接序列：

In [22]:
'Hello,' + 'world!'

'Hello,world!'

&emsp;&emsp;但不能拼接不同类型的序列：

In [23]:
try:
    [1, 2, 3] + 'world!'
except Exception as e:
    print('Error!\n{0}'.format(e))

Error!
can only concatenate list (not "str") to list


### 2.2.4 乘法

&emsp;&emsp;将序列与数 x 相乘时，将重复这个序列 n 次来创建一个新序列：

In [24]:
[42] * 10

[42, 42, 42, 42, 42, 42, 42, 42, 42, 42]

&emsp;&emsp;空列表是使用不包含任何内容的两个方括号 `[]` 表示的。如果想要创建一个包含若干元素但无任何有用内容的列表，可以用 `none`：

In [25]:
sequence = [None] * 10

In [26]:
sequence

[None, None, None, None, None, None, None, None, None, None]

### 2.2.5 成员资格

&emsp;&emsp;要检查特定的值是否包含在序列中，可使用运算符 `in`：

In [27]:
permission = 'pwd'

In [28]:
'w' in permission

True

In [29]:
'q' in permission

False

**代码清单2-4**

&emsp;&emsp;检查用户名和 PIN 码是否包含在列表中，若是，则打印字符串 `'Access granted'`。

In [30]:
database = [
    ['albert', '1234'],
    ['dilbert', '4242'],
    ['gaius', '9527'],
    ['jones', '9843']
]
username = input('User name: ')
pin = input('PIN code: ')
if [username, pin] in database: print('Access granted')

User name: Gaius
PIN code: 9527


&emsp;&emsp;内置函数 `len`、 `min` 和 `max` 很有用，其中函数 `len` 返回序列包含的元素个数，而 `min` 和 `max` 分别返回序列中最小和最大的元素：

In [31]:
numbers = [100, 34, 678]

In [32]:
len(numbers)

3

In [33]:
max(numbers)

678

In [34]:
min(numbers)

34

## 2.3 列表：Python 的主力

&emsp;&emsp;方法是与对象（列表、数、字符串等）联系紧密的函数。通常，像下面这样调用方法：
``` python
object.method(arguments)
```

&emsp;&emsp;方法 `append` 用于将一个对象附加到列表末尾：

In [35]:
lst = [1, 2, 3]

In [36]:
lst.append(4)

In [37]:
lst

[1, 2, 3, 4]

&emsp;&emsp;方法 `clear` 就地清空列表的内容：

In [38]:
lst.clear()

In [39]:
lst

[]

&emsp;&emsp;方法 `copy` 复制列表，常规复制只是将另一个名称关联到列表：

In [40]:
a = [1, 2, 3]

In [41]:
b = a

In [42]:
b[1] = 4

In [43]:
a

[1, 4, 3]

&emsp;&emsp;而方法 `copy` 让 a 和 b 指向不同的列表，即将 b 关联到 a 的副本：

In [44]:
a = [1, 2, 3]

In [45]:
b = a.copy()

In [46]:
b[1] = 4

In [47]:
a

[1, 2, 3]

&emsp;&emsp;方法 `count` 计算指定的元素在列表中出现了多少次：

In [48]:
['to', 'be', 'or', 'not', 'to', 'be'].count('to')

2

&emsp;&emsp;方法 `extend` 同时将多个值附加到列表末尾（是扩展原列表，不同于拼接序列是创建一个新列表）：

In [49]:
a = [1, 2, 3]

In [50]:
b = [4, 5, 6]

In [51]:
a.extend(b)

In [52]:
a

[1, 2, 3, 4, 5, 6]

&emsp;&emsp;方法 `index` 在列表中查找指定值第一次出现的索引：

In [53]:
jedi = ['We', 'are', 'the', 'jedi']

In [54]:
jedi.index('jedi')

3

In [55]:
try:
    jedi.index('sith')
except Exception as e:
    print('Error!\n{0}'.format(e))

Error!
'sith' is not in list


&emsp;&emsp;方法 `insert` 用于将一个对象插入列表：

In [56]:
numbers = [1, 2, 3, 5, 6, 7]

In [57]:
numbers.insert(3, 42)

In [58]:
numbers

[1, 2, 3, 42, 5, 6, 7]

&emsp;&emsp;方法 `pop` 从列表中删除一个元素（末尾为最后一个元素），并返回这一元素：

In [59]:
x = [1, 2, 3]

In [60]:
x.pop()

3

> **注意：**`pop` 是唯一既修改列表又返回一个非 `None` 值的列表方法。

&emsp;&emsp;方法 `remove` 用于删除第一个为指定值的元素：

In [61]:
x = ['to', 'be', 'or', 'not', 'to', 'be']

In [62]:
x.remove('be')

In [63]:
x

['to', 'or', 'not', 'to', 'be']

&emsp;&emsp;方法 `reverse` 按相反的顺序排列列表中的元素：

In [64]:
x = [1, 2, 3]

In [65]:
x.reverse()

In [66]:
x

[3, 2, 1]

&emsp;&emsp;方法 `sort` 用于对列表**就地排序**：

In [67]:
x = [4, 6, 2, 1, 7, 9]

In [68]:
x.sort()

In [69]:
x

[1, 2, 4, 6, 7, 9]

> **注意：**`sort` 修改 x 且不返回任何值，因此直接将 x 赋给 y 是不可行的。

&emsp;&emsp;使用函数 `sorted` 可以获取排序后的列表的副本：

In [70]:
x = [4, 6, 2, 1, 7, 9]

In [71]:
y = sorted(x)

In [72]:
y

[1, 2, 4, 6, 7, 9]

In [73]:
x

[4, 6, 2, 1, 7, 9]

&emsp;&emsp;方法 `sort` 接受两个可选参数：`key` 和 `reverse`，分别用于设置为一个用于排序的函数，和选择是否要按相反的顺序对列表进行排序：

In [74]:
x = ['aardvark', 'abalone', 'acme', 'add', 'aerate']

In [75]:
x.sort(key=len)

In [76]:
x

['add', 'acme', 'aerate', 'abalone', 'aardvark']

In [77]:
y = [4, 6, 2, 1, 7, 9]

In [78]:
y.sort(reverse=True)

In [79]:
y

[9, 7, 6, 4, 2, 1]

## 2.4 元组：不可修改的序列

&emsp;&emsp;与列表一样，元组也是序列，唯一的差别在于元组是**不能修改**的（字符串也是不能修改的）。只需将一些值用逗号分隔，就能自动创建一个元组：

In [80]:
1, 2, 3

(1, 2, 3)

&emsp;&emsp;但更常见的做法是将元组用圆括号括起：

In [81]:
(1, 2, 3)

(1, 2, 3)

&emsp;&emsp;空元组的创建只需用两个不包含任何内容的圆括号即可创建：

In [82]:
()

()

&emsp;&emsp;创建单个值的元组只需在值后面增加一个 `,` ： 

In [83]:
42,

(42,)

&emsp;&emsp;函数 `tuple` 的工作原理与 list 很像：它将一个序列作为参数，并将其转换为元组：

In [84]:
tuple([1, 2, 3])

(1, 2, 3)

&emsp;&emsp;元组并不太复杂，且除创建和访问其元素外，可对元组执行的操作不多。元组的创建及其元素的访问方式与其他序列相同：

In [85]:
x = 1, 2, 3

In [86]:
x

(1, 2, 3)

In [87]:
x[:2]

(1, 2)