# 🕮 2: 列表与元组

🖊 本章将引入一个新的概念：`数据结构`。在Python中，最基本的数据结构为`序列（sequence）`，`列表`与`元组`是最常见的序列结构。

本章的内容如下：
+ 2.1 [概述](#2.1-概述)
+ 2.2 [通用的序列操作](#2.2-通用的序列操作)
+ 2.3 [列表：Python的主力](#2.3-列表：Python的主力)
+ 2.4 [元组：不可修改的序列](#2.4-元组：不可修改的序列)

### 2.1 概述

+ 列表和元组的主要不同在于，列表是可以修改的，而元组不可以
+ 几乎在所有情况下都可使用列表来代替元组。一种例外情况是将元组用作字典键，因为字典键是不允许修改的。这将在第4章讨论

In [1]:
#list
usr_1 = ['Edward Gumby', 42]
usr_2 = ['John Smith', 50]
db = [usr_1, usr_2]
print(db)

[['Edward Gumby', 42], ['John Smith', 50]]


+ Python支持一种数据结构的基本概念，名为`容器（container)`
+ 容器基本上就是__可包含其他对象的对象__
+ 3种主要的容器是__`序列`__（如列表和元组），__`映射`__（如字典）和`集合（set）`
+ 映射将在第4章详细讨论，集合将在第10章讨论

### 2.2 通用的序列操作

+ 有几种操作适用于所有序列，包括**`索引`**、**`切片`**、**`相加`**、**`相乘`**和**`成员资格检查`**
+ 另外，Python还提供了一些**内置函数**，可用于确定序列的**`长度`**以及找出序列中**`最大`**和**`最小`**的元素
+ 有一个重要的操作这里不会介绍，它就是**`迭代（iteration）`**, 它意味着对其每个元素都执行特定的操作，迭代将在5.5节中详细介绍。

#### 2.2.1 索引
+ 从`0`开始递增
+ `字符串`也属于序列，因此也可以用索引的方式访问
+ 当使用**负数索引**时，Python将从右（即从最后一个元素）开始往左数，因此`-1`是**最后一个元素**的位置
+ **索引方式适用于所有的序列**
+ 对于字符串字面量（以及其他的序列字面量），可直接对其执行索引操作，无需先将其赋给变量
+ 如果**函数调用返回**一个序列，可直接对其执行索引操作

In [2]:
str = 'Hello, world!'
print(str[0])
print('--------')
print('Hello, world!'[-1])
print('--------')
forth = input("Year:")[3]
print('forth = ' + forth)

H
--------
!
--------
Year:2018
forth = 8


+ [代码清单2-1](../edit/2-1.py)

#### 2.2.2 切片
+ 使用__`切片（slicing）`__来访问**特定范围**内的元素
    - 🌟语法：__`seq[<start> : <end> : <step>]`__
+ 方法一：使用__2__个索引，并使用**`:`**分隔：`seq[a : b]`
    - 注意，使用该方法时，__包括起始索引__，**不包括结束索引**
+ 方法二：使用__1__个索引，用于标识 **起始** 或 **结束** 位置，搭配**`:`**完成切片：`seq[a : ]`或`seq[: b]`
    - 注意，使用该方法时，当索引为__具体数值__时，**包括起始索引**，__不包括结束索引__
+ 方法三：**不使用**索引，仅使用__`:`__可用于复制整个序列：`seq[:]`
+ 当**`步长`**为**负数**时，切片会**从右至左提取内容**

In [4]:
tag = '<a href="http://www.python.org">Python web site</a>'
print("method 1 >>>>>")
print(tag[32 : -4])
print("method 2 >>>>>")
print(tag[: 32])
print(tag[-4 :])
print("method 3 >>>>>")
arr = [1, 2, 3, 4, 5]
print(arr[::2])
print(arr[::-2])
print(arr[:3:-2])

method 1 >>>>>
Python web site
method 2 >>>>>
<a href="http://www.python.org">
</a>
method 3 >>>>>
[1, 3, 5]
[5, 3, 1]
[5]


#### 2.2.3 序列相加
+ 可使用**`+`**来拼接序列
+ 一般而言，不能拼接不同类型的序列

In [6]:
a = [1, "2", 3]
b = [4, 5, 6, 7]
c = "Hello, world!"
print("a + b = ")
print(a + b)
#print("b + c = ")
#print(b + c)

a + b = 
[1, '2', 3, 4, 5, 6, 7]


#### 2.2.4 乘法
+ 将**序列**与**数**`x`相乘时，将**重复**这个序列`x`次来创建一个新序列
+ 空列表：`[]`
+ 元素值为空：`None`

In [8]:
print('Python' * 5)
print([7] * 10)
print([None] * 10)
print([1, 2, 3] * 10)
print([[1, 2, 3]] * 10)

PythonPythonPythonPythonPython
[7, 7, 7, 7, 7, 7, 7, 7, 7, 7]
[None, None, None, None, None, None, None, None, None, None]
[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]
[[1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3], [1, 2, 3]]


+ [代码清单2-3](../edit/2-3.py)

#### 2.2.5 成员资格
+ 要检查特定的值是否包含在序列中，可使用运算符**`in`**，满足返回`true`，不满足返回`false`
+ **布尔运算符**-**布尔值**
+ 布尔表达式将在5.4节详细介绍

In [11]:
usr_list = ['Alice', 'Bob', 'Eve']
s = 'Python'
print(input("Please input your name:") in usr_list)
print(input("Please input sub_str:") in s)

Please input your name:Alice
True
Please input sub_str:th
True


+ [代码清单2-4](../edit/2-4.py)

+ 长度：**`len()`**
+ 最大值：**`max()`**
+ 最小值：**`min()`**
+ 对象比较将在5.4.6节的“比较运算符”部分详细介绍

In [12]:
arr = ['Alice', 'Bob', 'Eve']
#arr = ['Alice', 13]
print(len(arr))
print(max(arr))
print(min(arr))

2


TypeError: '>' not supported between instances of 'int' and 'str'

### 2.3 列表：Python的主力

#### 2.3.1函数list
+ `字符串` -> `列表`
    - **`list(<string>)`**
+ `字符串列表` -> `字符串`
    - **`''.join(<list>)`**

In [13]:
print(list("Alice"))
print(''.join(list("Alice")))

['A', 'l', 'i', 'c', 'e']
Alice


#### 2.3.2 基本的列表操作
本节将介绍一些修改列表的方式
+ 修改列表：给元素赋值
    - 不能给不存在的元素赋值
+ 删除元素
    - 🌟语法：**`del lst[<index>]`**
+ 给切片赋值
    - 通过使用切片赋值，可将切片替换为长度与其不同的序列
    - 使用切片赋值还可在不替换原有元素的情况下插入新元素

In [14]:
l = [0, 4, 5, 7]
print("Origin >>>>>")
print(l)
print("Modify >>>>>")
l[0] = 1
print(l)
print("Delete >>>>>")
del l[-1]
print(l)
print("CutEval >>>>")
l[1: 1] = [2, 3]
print(l)

Origin >>>>>
[0, 4, 5, 7]
Modify >>>>>
[1, 4, 5, 7]
Delete >>>>>
[1, 4, 5]
CutEval >>>>
[1, 2, 3, 4, 5]


#### 2.3.3 列表方法
方法是与对象（列表、数、字符串等）联系紧密的函数。通常，像下面这样调用方法：

`object.method(arguments)`

1. **append**

方法`append`用于将**一个**对象附加到列表末尾

In [15]:
lst = [1, 2, 3]
lst.append(4)
lst.append([5, 6])
print(lst)

[1, 2, 3, 4, [5, 6]]


2. **clear**

方法`clear`就地清空列表的内容

In [16]:
lst = [1, 2, 3]
lst.clear()
print(lst)

[]


3. **copy**

    + 方法`copy`复制列表。`copy`方法是**深拷贝**
    + 常规复制只是将另一个名称关联到列表,即**浅拷贝**
    + 要让a和b指向不同的列表，就必须将b关联到a的副本*（使用`copy`方法）*

In [17]:
a = [1, 2, 3]
b = a
c = a.copy()
b.append('b')
c.append('c')
print('a:')
print(a)
print('b:')
print(b)
print('c:')
print(c)

a:
[1, 2, 3, 'b']
b:
[1, 2, 3, 'b']
c:
[1, 2, 3, 'c']


4. **count**

方法`count`计算指定的元素在列表中出现了多少次

In [20]:
x = [[1, 2], 1, 1, [2, 1, [1, 2]]]
print(x.count(1))
print(x.count([1, 2]))

2
1


5. **extend**

方法`extend`让你能够同时将多个值附加到列表末尾，即支持用一个列表来扩展另一个列表

In [21]:
x = [[1, 2], [3, 4, 5]]
y = [[6, 7], [8, 9], 'y']
x.extend(y)
print(x)

[[1, 2], [3, 4, 5], [6, 7], [8, 9], 'y']


+ 注意：在使用`+`进行列表拼接时，需要分别创建两个进行拼接的列表的副本，因此相比于`a = a + b`，`a.extend(b)`的效率更高

6. **index**

方法`index`在列表中查找指定值第一次出现的索引

In [24]:
lst = ["we ", "are! ", "we ", "are! "]
print(lst.index('are! '))
#print(lst.index('We'))

1


7. **insert**

方法`insert`用于将**一个**对象插入列表

In [25]:
numbers = [1, 2, 3, 4, 5, 6, 7, 9]
numbers.insert(numbers.index(9), 'eight')
print(numbers)

[1, 2, 3, 4, 5, 6, 7, 'eight', 9]


+ 注：上述的很多方法都可通过切片操作完成，但从**效率**和**可读性**上来说，使用列表方法是更好的选择

8. **pop**

方法`pop`从列表中删除一个元素（末尾为最后一个元素），并返回这一元素

In [26]:
x = [1, 2, 3, 4]
print(x.pop())
print(x)

4
[1, 2, 3]


+ `pop`和`append`共同实现了一个数据结构：**栈**
+ 可以用这`pop`搭配`insert(0, <data>)`实现**队列**，不过关于**队列**，Python提供更好的实现，详细参考第10章

9. **remove**

方法`remove`用于删除**第一个**为指定值的元素

In [29]:
lst = [0, 1, 2, 3, 0]
lst.remove(0)
print(lst)
print(lst.remove(0))
print(lst)

[1, 2, 3, 0]
None
[1, 2, 3]


10. **reverse**

方法`reverse`按相反的顺序排列列表中的元素

In [63]:
lst = list("are we who we are ?")
lst.reverse()
print(lst)
print(lst.reverse())
print(lst)

['?', ' ', 'e', 'r', 'a', ' ', 'e', 'w', ' ', 'o', 'h', 'w', ' ', 'e', 'w', ' ', 'e', 'r', 'a']
None
['a', 'r', 'e', ' ', 'w', 'e', ' ', 'w', 'h', 'o', ' ', 'w', 'e', ' ', 'a', 'r', 'e', ' ', '?']


+ 注：如果要按相反的顺序迭代**序列**，可使用函数`reversed()`。这个函数不返回列表，而是返回一个**迭代器**（迭代器将在第9章详细介绍）

In [30]:
lst = [1, 2, 3]
print(list(reversed(lst)))

[3, 2, 1]


11. **sort**

方法`sort`用于对列表就地排序，这意味着和前面几个方法一样，这个方法**没有返回**

In [36]:
x = [9, 8, 7, 6, 5, 4, 3, 2, 1]
y = ["Eve", "Bob", "Alice", "Ace"]
x.sort()
y.sort()
print(x)
print(y)

[1, 2, 3, 4, 5, 6, 7, 8, 9]
['Ace', 'Alice', 'Bob', 'Eve']


+ 注：与`reverse`方法类似，`sort`方法也有对应的通用方法`sorted()`，可以返回排序后的序列
+ 但注意，使用序列通用方法`sorted()`后，返回的数据类型为`list`
+ 从Python2.3起，方法`sort`使用的是**稳定的**排序算法

In [37]:
x = [9, 8, 7, 6, 5, 4, 3, 2, 1]
y = sorted(x)
print(y)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


12. **高级排序**

方法`sort`接受两个可选参数：`key`和`reverse`，这两个参数通常是按名称指定的，称为关键字参数，将在第6章详细讨论
+ 参数`key`类似于参数`cmp`,使用它来为每个元素创建一个键，再根据这些键对元素进行排序
+ 参数`reverse`用以以指出是否要按**相反**的顺序对列表进行排序
+ 函数`sorted()`也接受参数`key`和`reverse`。在很多情况下，将参数`key`设置为一个**自定义函数**很有用。第6章将介绍如何创建自定义函数。

In [38]:
x = ['Alice', 'Bob', 'Eve']
y = [9, 8, 7, 6, 5, 4, 3, 2, 1]
x.sort(key = len)
y.sort(reverse = True)
print(x)
print(y)

['Bob', 'Eve', 'Alice']
[9, 8, 7, 6, 5, 4, 3, 2, 1]


### 2.4 元组：不可修改的序列

元组也是序列，唯一的差别在于元组是**不能修改**的。

元组语法很简单，只要将一些值用`,`分隔，就能自动创建一个元组。一般在使用时会用`()`括起来。

元组的切片也是元组，就像列表的切片也是列表一样。

In [39]:
1, 2, 3

(1, 2, 3)

+ 对于只有一个元素的元组，也**需要**在结尾加上`,`

In [40]:
1,

(1,)

+ `tuple()`函数与`list()`函数相似，它可将一个序列转换为元组

In [41]:
print(tuple([1, 2, 3]))

(1, 2, 3)


# 🞂 つづく