列表和元组概念：
- 都是一个可以放置***任意数据类型***的有序集合

In [1]:
l = [1, 2, 'hello', 'world']  # 列表中同时含有int和string类型的元素
print(l)
tup = ('jason', 22)  # 元组中同时含有int和string类型的元素
print(tup)


[1, 2, 'hello', 'world']
('jason', 22)


列表和元组的区别：
- **列表是动态的**，长度大小不固定，可以随意地增加、删减或者改变元素（mutable）
- **元组是静态的**，长度大小固定，无法增加删减或者改变（immutable）

In [2]:
l = [1, 2, 3, 4]
l[3] = 40  # 和很多语言类似，python中索引同样从0开始
print(l)

tup = (1, 2, 3, 4)
tup[3] = 40
print(tup)


[1, 2, 3, 40]


TypeError: 'tuple' object does not support item assignment

对列表和元组进行改变：
- 元组会**重新开辟一块内存**创建新的元组
- 列表直接在末尾添加即可，不会创建新的列表

In [3]:
tup = (1, 2, 3, 4)
new_tup = tup+(5,)  # 创建新的元组new_tup，并依次填充原元组的值
print(new_tup)

l = [1, 2, 3, 4]
l.append(5)  # 添加元素5到原列表的末尾
print(l)


(1, 2, 3, 4, 5)
[1, 2, 3, 4, 5]


列表和元组基本操作：
- python中的列表和元组都支持负数索引
- python中的列表和元组都支持切片操作
- python中的列表和元组都支持随意嵌套
- python中的列表和元组可以相互转换
- python中的列表和元组的一些函数

In [4]:
l = [1, 2, 3]
print(l[-1])

tup = (1, 2, 3)
print(tup[-2])


3
2


In [5]:
l = [1, 2, 3]
print(l[1:3])  # 返回索引 1到2 的子列表

tup = (1, 2, 3)
print(tup[0:2])  # 返回索引 0到1 的子元组


[2, 3]
(1, 2)


In [6]:
l = [[1, 2, 3], [4, 5, 6]]
print(l, type(l))

tup = ((1, 2, 3), (4, 5, 6))
print(tup, type(tup))


[[1, 2, 3], [4, 5, 6]] <class 'list'>
((1, 2, 3), (4, 5, 6)) <class 'tuple'>


In [8]:
print(list((1, 2, 3)))

print(tuple([1, 2, 3]))


[1, 2, 3]
(1, 2, 3)


- count(item)表示统计列表/元组中item出现的次数
- index(item)表示返回列表/元组中item第一次出现的索引
- list.reverse()和list.sort()分别表示原地倒转列表和排序(元组没有内置的这两个函数)
- reversed()和sorted()同样表示对列表/元组进行倒转和排序，reversed()返回一个倒转后的迭代器(下文例子使用list()函数再将其转换成列表)；
sorted()返回排好序的新列表。

In [11]:
l = [3, 2, 3, 7, 8, 1]
print(l.count(3))

print(l.index(7))

l.reverse()
print(l)

l.sort()
print(l)

tup = (3, 2, 3, 7, 8, 1)
print(tup.count(3))

print(tup.index(7))

print(list(reversed(tup)))

print(sorted(tup))


2
3
[1, 8, 7, 3, 2, 3]
[1, 2, 3, 3, 7, 8]
2
3
[1, 8, 7, 3, 2, 3]
[1, 2, 3, 3, 7, 8]


列表和元组存储方式的差异
- 下面的例子，大概描述了列表空间分配的过程。我们可以看到，为了减小每次增加/删除操作时空间分配的开销，Python每次分配空间时都会额外多分配一些，这样的机制（over-allocating）保证了其操作的高效性：增加/删除的时间复杂度均为O(1)。
- 元组长度大小固定，元素不可变，所以存储空间固定。

In [19]:
l = [1, 2, 3]
print(l.__sizeof__())

tup = (1, 2, 3)
print(tup.__sizeof__())

l = []
print(l.__sizeof__())  # 空列表存储空间为40字节
l.append(1)
print(l.__sizeof__())  # 加了元素1后，为其分配了可以存储4个元素的空间(72-40)/8=4，(int型，8字节)
l.append(2)
print(l.__sizeof__())  # 由于之前分配了空间，所以加入元素2，列表空间不变
l.append(3)
print(l.__sizeof__())  # 同上
l.append(4)
print(l.__sizeof__())  # 同上
l.append(5)
print(l.__sizeof__())  # 加入元素5之后，列表空间不足，所以又额外分配了可以存储4个元素的空间


104
48
40
72
72
72
72
104


列表和元组的性能：
- 结论：元组比列表更加轻量级一些，所以总体上来说，元组的性能速度略优于列表。
- 另外，Python在后台会对静态数据做一些资源缓存。也就是说对于一些静态变量，比如元组，如果不被使用并且占用空间不大，Python会暂时缓存这部分内存不会垃圾回收。这样下次再创建同样大小的元组时可以直接分配之前缓存的内存空间，大大加快程序的运行速度。
- 当然你要是想增加、删减或者改变元素，那么列表显然更优。因为对于元组来说必须要通过新建一个元组才能完成。

In [2]:
import timeit
'''
python中的timeit（）方法， 它用于获取代码的执行时间。该库将代码语句运行一百万次，并提供从集合中花费的最短时间。这是一种有用的方法，有助于检查代码的性能。
timeit.timeit(stmt, setup,timer, number)
stmt：这将采用您要测量其执行时间的代码。默认值为“pass”。
setup：这将包含需要在stmt之前执行的设置详细信息。默认值为“ pass”。
timer：它将具有计时器值，timeit（）已经设置了默认值，我们可以忽略它。
number：stmt将按照此处给出的编号执行。默认值为1000000。'''
# 初始化，元组比列表快5倍
print(timeit.timeit("x=[1,2,3,4,5,6]"))
print(timeit.timeit("x=(1,2,3,4,5,6)"))

# 索引操作，两者差不多
print(timeit.timeit("x=[1,2,3,4,5,6];y=x[3]"))
print(timeit.timeit("x=(1,2,3,4,5,6);y=x[3]"))


0.07073519999999967
0.0177082999999989
0.08675190000000121
0.036543999999999244


列表和元组的使用场景
- 如果存储的数据和数量不变，比如你有一个函数，需要返回的是一个地点的经纬度，然后直接传给前端渲染，那么肯定使用元组更合适。
def get_location():
    ''''''
    return (longitude,latitude)

- 如果存储的数据和数量是可变的，比如社交平台上的日志功能，是统计一个用户在一周之内看了哪些用户的帖子，那么则用列表更合适。
viewer_owner_id_list=[] # 里面的每个元素记录了这个viewer一周内看过的所有owner的id
records=queryDB(viewer_id)# 索引数据库，拿到某个viewer一周内的日志
for record in records:
    viewer_owner_id_list.append(record.id)

总结：
总的来说，列表和元组都是有序的，且可以存储不同数据类型的集合。
- 列表是动态的，长度可变，可以任意的增加、删减或改变元素。列表的存储空间略大于元组，性能略逊于元组。
- 元组是静态的，长度大小固定，不可以对元组进行增加、删减或者改变操作。元组相对于列表更加轻量级，性能稍优。

思考题
- 想创建一个空的列表，我们可以用下面A、B两种方式，请问它们在效率上有什么区别吗？我们应该有限考虑使用哪种呢？可以说说你的理由。

In [None]:
# 创建空列表
# option A
empty_list = list()

# option B
empty_list = []

# 区别主要在于list()是一个function call ，Python的function call 会创建stack，并且形成一系列参数检查的操作，比较expensive。
# 反观[]是一个内置的C函数，可以直接被调用，因此效率高。
