# 列表和元组，到底用哪一个？

https://time.geekbang.org/column/article/94972

## 列表和元组基础

定义： 列表和元组，都是一个可以放置任意数据类型的有序集合。

性质1. python的列表和元组的内部元素数据类型不用一致

In [113]:
l = [1, 2, 'hello', 'world'] # 列表中同时含有int和string类型的元素
l
[1, 2, 'hello', 'world']

tup = ('jason', 22) # 元组中同时含有int和string类型的元素
tup
('jason', 22)

('jason', 22)

列表和元组的区别

- 列表是动态的，长度大小不固定，可以随意地增加、删减或者改变元素（mutable）。
- 而元组是静态的，长度大小固定，无法增加删减或者改变（immutable）。

In [114]:
l = [1, 2, 3, 4]
l[3] = 40 # 和很多语言类似，python中索引同样从0开始，l[3]表示访问列表的第四个元素
l

[1, 2, 3, 40]

In [115]:
tup = (1, 2, 3, 4)
tup[3] = 40

TypeError: 'tuple' object does not support item assignment

如果想对已有的元组做任何改变，只能重新开辟一块新的内存，创建新的元组

In [129]:
tup = (1, 2, 3, 4)
new_tup = tup + (5, ) # 创建新的元组new_tup，并依次填充原元组的值
new_tup

(1, 2, 3, 4, 5)

In [130]:
l = [1, 2, 3, 4]
l.append(5) # 添加元素5到原列表的末尾
l


[1, 2, 3, 4, 5]

## 列表和元组的基本操作和注意事项

1. Python中的列表和元组都支持负数索引。

-1 表示最后一个元素，-2 表示倒数第二个元素，以此类推

In [131]:
l = [1, 2, 3, 4]
l[-1]

4

In [132]:
tup = (1, 2, 3, 4)
tup[-1]

4

2. 除了基本的初始化，索引外，列表和元组都支持切片操作

In [133]:
l = [1, 2, 3, 4]
l[1:3] # 返回列表中索引从1到2的子列表


[2, 3]

In [134]:
tup = (1, 2, 3, 4)
tup[1:3] # 返回元组中索引从1到2的子元组


(2, 3)

3. 列表和元组都可以随意嵌套

In [135]:
l = [[1, 2, 3], [4, 5]] # 列表的每一个元素也是一个列表

tup = ((1, 2, 3), (4, 5, 6)) # 元组的每一个元素也是一个元组

In [136]:
print(l)
print(tup)

[[1, 2, 3], [4, 5]]
((1, 2, 3), (4, 5, 6))


4. 两者也可以通过 list() 和 tuple() 函数相互转换

In [137]:
list((1, 2, 3))

[1, 2, 3]

In [138]:
tuple([1, 2, 3])

(1, 2, 3)

5. 列表和元组常用的内置函数

In [139]:
l = [3, 2, 3, 7, 8, 1]

In [140]:
l.count(3)

2

In [141]:
l.index(7)

3

In [142]:
l.reverse()

In [143]:
l

[1, 8, 7, 3, 2, 3]

In [144]:
l.sort()

In [145]:
l

[1, 2, 3, 3, 7, 8]

In [146]:
tup = (3, 2, 3, 7, 8, 1)

In [147]:
tup.count(3)

2

In [148]:
tup.index(7)

3

In [149]:
list(reversed(tup))

[1, 8, 7, 3, 2, 3]

In [150]:
sorted(tup)

[1, 2, 3, 3, 7, 8]

- count(item) 表示统计列表 / 元组中 item 出现的次数。
- index(item) 表示返回列表 / 元组中 item 第一次出现的索引。
- list.reverse() 和 list.sort() 分别表示原地倒转列表和排序（注意，元组没有内置的这两个函数)。
- reversed() 和 sorted() 同样表示对列表 / 元组进行倒转和排序，reversed() 返回一个倒转后的迭代器（上文例子使用 list() 函数再将其转换为列表）；sorted() 返回排好序的新列表。

## 列表和元组存储方式的差异

In [151]:
l = [1, 2, 3]
l.__sizeof__()

64

In [152]:
tup = (1, 2, 3)
tup.__sizeof__()

48

- 由于列表是动态的，所以它需要**存储指针**，来指向对应的元素（上述例子中，对于 int 型，8 字节）。
- 另外，由于列表可变，所以需要额外存储已经分配的**长度大小**（8 字节），这样才可以实时追踪列表空间的使用情况，当空间不足时，及时分配额外空间

In [153]:
l = []
l.__sizeof__()

40

In [154]:
l.append(1)
l.__sizeof__() # 加入了元素1之后，列表为其分配了可以存储4个元素的空间 (72 - 40)/8 = 4

72

In [155]:
l.append(2)
l.__sizeof__() # 由于之前分配了空间，所以加入元素2，列表空间不变

72

In [156]:
l.append(3)
print(l.__sizeof__())
l.append(4)
print(l.__sizeof__())

72
72


In [157]:
l.append(5)
l.__sizeof__() # 加入元素5之后，列表的空间不足，所以又额外分配了可以存储4个元素的空间

104

为了减小每次增加 / 删减操作时空间分配的开销，Python 每次分配空间时都会额外多分配一些，这样的机制（over-allocating）保证了其操作的高效性：增加 / 删除的时间复杂度均为 O(1)

但是元组不同， 元组长度大小固定，元素不可变，所以存储空间固定

## 列表和元组的性能

1. 根据存储方式的差异，元组要比列表更加轻量级一些，元组的性能速度要略优于列表。
2. python会对静态数据做一些资源缓存：如果一些变量不被使用了，Python 就会回收它们所占用的内存，返还给操作系统，以便其他变量或其他应用使用
3. 但是如果不被使用的元组占用空间不大时，python会缓存这部分内存。

In [158]:
!python3 -m timeit 'x=(1,2,3,4,5,6)'

100000000 loops, best of 3: 0.0149 usec per loop


In [159]:
!python3 -m timeit 'x=[1,2,3,4,5,6]'

10000000 loops, best of 3: 0.0743 usec per loop


4. 索引操作的话，两者的速度差别非常小

In [160]:
!python3 -m timeit -s 'x=[1,2,3,4,5,6]' 'y=x[3]'

10000000 loops, best of 3: 0.0322 usec per loop


In [161]:
!python3 -m timeit -s 'x=(1,2,3,4,5,6)' 'y=x[3]'

10000000 loops, best of 3: 0.0322 usec per loop


5. 如果你想要增加、删减或者改变元素，那么列表显然更优,因为元组要新建一个元组来完成操作

## 列表和元组的使用场景

1. 如果存储的数据和数量不变，比如你有一个函数，需要返回的是一个地点的经纬度，然后直接传给前端渲染，那么肯定选用元组更合适。

In [162]:
def get_location():
    pass
    return (longitude, latitude)

2. 如果存储的数据或数量是可变的，比如社交平台上的一个日志功能，是统计一个用户在一周之内看了哪些用户的帖子，那么则用列表更合适。

In [None]:
viewer_owner_id_list = [] # 里面的每个元素记录了这个viewer一周内看过的所有owner的id
records = queryDB(viewer_id) # 索引数据库，拿到某个viewer一周内的日志

for record in records:
    viewer_owner_id_list.append(record.id)

## 总结

列表和元组都是有序的，可以存储任意数据类型的集合，区别主要在于下面这两点。
- 列表是动态的，长度可变，可以随意的增加、删减或改变元素。列表的存储空间略大于元组，性能略逊于元组。
- 元组是静态的，长度大小固定，不可以对元素进行增加、删减或者改变操作。元组相对于列表更加轻量级，性能稍优。

## 思考题
1. 想创建一个空的列表，我们可以用下面的 A、B 两种方式，请问它们在效率上有什么区别吗？我们应该优先考虑使用哪种呢？可以说说你的理由。

In [164]:
# 创建空列表
# option A
empty_list = list()

# option B
empty_list = []

2. 你在平时的学习工作中，是在什么场景下使用列表或者元组呢？欢迎留言和我分享。

### 评论回复


Geek_59f23e：
1、用list()方法构造一个空列表使用的是class list([iterable])的类型构造器，参数可以是一个iterable，如果没有给出参数，构造器将创建一个空列表[ ]，相比较而言多了一步class调用和参数判断，所以用 [ ] 直接构造一个空列表的方法速度更快，刚查的官方解释，不知道我理解的对不对。。。
2、敲代码的时候我一般元祖用来传参用的比较多，能用元祖的地方尽量不用列表，这样代码性能好些。

作者回复: 
1. 区别主要在于list()是一个function call，Python的function call会创建stack，并且进行一系列参数检查的操作，比较expensive，反观[]是一个内置的C函数，可以直接被调用，因此效率高

2. 嗯嗯