# 数据结构
## 列表和元组
### 基础概念
1. 列表和元组，都是一个可以放置任意数据类型的有序集合
2. Python的列表和元组不要求集合内的数据类型必须一致
3. 列表是动态的，长度大小不固定，可以随意地增加、删除或者改变元素（mutable）
4. 元组是静态的，长度大小固定，无法增加删除或者修改元素(immutable)
5. Python中的列表和元组都支持负索引，即倒序索引
6. 两者都支持切片操作
7. 列表和元组可以随意嵌套
8. 两者的类型可以相互转换，通过`list()` 和 `tuple()`

**如果需要对已有的元组进行修改，只能重新创建一个元组**
### 简单内置函数介绍
1. `count(item)` 表示统计列表 / 元组中 item 出现的次数。 
2. `index(item)` 表示返回列表 / 元组中 item **第一次出现的索引**。 
3. `list.reverse()` 和 `list.sort()` 分别表示原地倒转列表和排序,**元组没有内置的这两个函数**。 
4. `reversed()` 和 `sorted()` 同样表示对列表 / 元组进行倒转和排序，**reversed() 返回一个倒转后的迭代器（list() 函数再将其转换为列表）；sorted() 返回排好序的新列表**。

### 存储方式的差异
**列表是动态的，所以它需要存储指针，来指向对应的元素。**
另外，由于列表可变，所以需要额外存储已经分配的长度大小，这样才可以实时追踪列表空间的使用情况，当空间不足时，及时分配额外空间。

为了减小每次增加 / 删减操作时空间分配的开销，Python 每次分配空间时都会额外多分配一些，这样的机制（over-allocating）保证了其操作的高效性：增加 / 删除的时间复杂度均为 O(1)。 但是对于元组，情况就不同了。元组长度大小固定，元素不可变，所以存储空间固定。 看了前面的分析，你也许会觉得，这样的差异可以忽略不计。但是想象一下，如果列表和元组存储元素的个数是一亿，十亿甚至更大数量级时，你还能忽略这样的差异吗？

### 元组和列表的性能对比

通过学习列表和元组存储方式的差异，我们可以得出结论：**元组要比列表更加轻量级一些，所以总体上来说，元组的性能速度要略优于列表。** 另外，**Python 会在后台，对静态数据做一些资源缓存（resource caching）。通常来说，因为垃圾回收机制的存在，如果一些变量不被使用了，Python 就会回收它们所占用的内存，返还给操作系统**，以便其他变量或其他应用使用。 但是**对于一些静态变量，比如元组，如果它不被使用并且占用空间不大时，Python 会暂时缓存这部分内存**。这样，下次我们再创建同样大小的元组时，Python 就可以不用再向操作系统发出请求，去寻找内存，而是可以直接分配之前缓存的内存空间，这样就能大大加快程序的运行速度。
下面的例子，是计算初始化一个相同元素的列表和元组分别所需的时间。我们可以看到，元组的初始化速度，要比列表快 5 倍。

```linux
python3 -m timeit 'x=(1,2,3,4,5,6)'
20000000 loops, best of 5: 9.97 nsec per loop
python3 -m timeit 'x=[1,2,3,4,5,6]'
5000000 loops, best of 5: 50.1 nsec per loop

```
但如果是索引操作的话，两者的速度差别非常小，几乎可以忽略不计
```linux
python3 -m timeit -s 'x=[1,2,3,4,5,6]' 'y=x[3]'
10000000 loops, best of 5: 22.2 nsec per loop
python3 -m timeit -s 'x=(1,2,3,4,5,6)' 'y=x[3]'
10000000 loops, best of 5: 21.9 nsec per loop
```
### 适合的使用场景
1. 如果**存储的数据和数量不变**，比如你有一个函数，需要返回的是一个地点的经纬度，然后直接传给前端渲染，那么肯定选用**元组更合适**。
2. 如果**存储的数据或数量是可变的**，比如社交平台上的一个日志功能，是统计一个用户在一周之内看了哪些用户的帖子，那么则用**列表更合适**。

In [12]:
# 多种类型的元素
this_list = [1, 2, 'hello', 'you']  
this_tup = (1, 2, 'cat') 

print(f'The type of this_list is:{type(this_list)}, and the value is {this_list}')
print(f'The type of this_tup is:{type(this_tup)}, and the value is {this_tup}')

The type of this_list is:<class 'list'>, and the value is [1, 2, 'hello', 'you']
The type of this_tup is:<class 'tuple'>, and the value is (1, 2, 'cat')


In [13]:
#添加元素到list
this_list.append('nice to meet you')
print(f'After added new item, this_list is: {this_list}')

#修改元素
this_list[1] = 20
print(f'After changed the item, this_list is: {this_list}')

After added new item, this_list is: [1, 2, 'hello', 'you', 'nice to meet you']
After changed the item, this_list is: [1, 20, 'hello', 'you', 'nice to meet you']


In [16]:
#修改元素
this_tup[1] = 'hello'

TypeError: 'tuple' object does not support item assignment

In [18]:
#添加元素到tuple
new_tup = this_tup + ('hello',)

print(f'this_tup is {this_tup}, the new one is {new_tup}')

this_tup is (1, 2, 'cat'), the new one is (1, 2, 'cat', 'hello')


In [20]:
# 负索引
list_last_item = this_list[-1]
tup_last_item = this_tup[-1]

print(f'The last item of list is \'{list_last_item}\', the last item of tup is \'{tup_last_item}\'')

The last item of list is 'nice to meet you', the last item of tup is 'cat'


In [64]:
# 切片
slice_list = this_list[2:4]
print(f'The third and fourth item in this_list is {slice_list}')
print(f'this_list is {this_list}')


slice_tup = this_tup[1:3]
print(f'The seconde and third item in slice_tup is {slice_tup}')
print(f'this_tup is {this_tup}')

The third and fourth item in this_list is ['you', 20]
this_list is ['hello', 'nice to meet you', 'you', 20, 1]
The seconde and third item in slice_tup is (2, 'cat')
this_tup is (1, 2, 'cat')


In [26]:
#多种嵌套
multiple_list = [this_list, this_tup, 0, 'dog', {9:'dock'}]
multiple_tup = (this_list, this_tup, 0, 'dog', {9:'dock'})

print(f'The multiple list and tuple is {multiple_list} ,\n{multiple_tup}')

The multiple list and tuple is [[1, 20, 'hello', 'you', 'nice to meet you'], (1, 2, 'cat'), 0, 'dog', {9: 'dock'}] ,
([1, 20, 'hello', 'you', 'nice to meet you'], (1, 2, 'cat'), 0, 'dog', {9: 'dock'})


In [28]:
#类型转换
translate_to_tup = tuple(this_list)
translate_to_list = list(this_tup)

print(f'The translated tuple and list is {translate_to_tup},{translate_to_list}')

The translated tuple and list is (1, 20, 'hello', 'you', 'nice to meet you'),[1, 2, 'cat']


In [59]:
#内置函数
count_list = this_list.count('you')
count_tup = this_tup.count('you')
print(f'\'you\' is in this_list {count_list} times')
print(f'\'you\' is in this_tup {count_tup} times')


where_is_you = this_list.index('you')
print(f'\'you\' is the {where_is_you + 1}th item in this_list')
try:
    where_is_you = this_tup.index('you')
except ValueError:
    print('There is no \'you\' in this_tup')
else:
    print(f'\'you\' is the {where_is_you + 1}th item in this_tup')


this_list.reverse()  #tuple没有该函数
print(f'After using reverse() method, this_list is {this_list}')

try:
    this_list.sort()  #tuple没有该函数
except TypeError as msg:
    print(msg)
else:
    print(f'After using sort() method, this_list is {this_list}')


reversed_list = reversed(this_list)
print(f'reversed_list is {type(reversed_list)} type')
reversed_tup = reversed(this_tup)
print(f'reversed_tup is {type(reversed_tup)} type')


sorted_list = sorted(this_list)
print(f'sorted_list is {type(sorted_list)} type')
sorted_tup = reversed(this_tup)
print(f'sorted_tup is {type(sorted_tup)} type')

'you' is in this_list 1 times
'you' is in this_tup 0 times
'you' is the 3th item in this_list
There is no 'you' in this_tup
After using reverse() method, this_list is ['hello', 'nice to meet you', 'you', 20, 1]
'<' not supported between instances of 'int' and 'str'
reversed_list is <class 'list_reverseiterator'> type
reversed_tup is <class 'reversed'> type


TypeError: '<' not supported between instances of 'int' and 'str'

In [67]:
# 存储方式的测试
# 对于 int 型，8 字节
l = [1,2,3]
t = (1,2,3)

list_size = l.__sizeof__()
tup_size = t.__sizeof__()
print(f'The length of list is {list_size}')
print(f'The length of list is {tup_size}')
print(f'The list has {list_size - tup_size} items more than the tuple')

The length of list is 72
The length of list is 48
The list has 24 items more than the tuple


In [68]:
l = []
l.__sizeof__() # 空列表的存储空间为40字节


40

In [69]:
l.append(1)  #加入了元素1之后，列表为其分配了可以存储4个元素的空间 (72 - 40)/8 = 4
l.__sizeof__() 

72

In [70]:
l.append(2)  #由于之前分配了空间，所以加入元素2，列表空间不变
l.__sizeof__()

72

In [71]:
l.append(3) 

72

In [72]:
l.append(4) #由于之前分配了空间，所以加入元素2，列表空间不变
l.__sizeof__() 


72

In [73]:
l.append(5)  #加入元素5之后，列表的空间不足，所以又额外分配了可以存储4个元素的空间
l.__sizeof__() 

104

In [74]:
t = ()
t.__sizeof__() # 空元组的存储空间为24字节

24

In [75]:
t = (1)
t.__sizeof__()  #一个int 4字节

28

In [76]:
t = (1,2)
t.__sizeof__()  

40

In [77]:
t = (1,2,3)
t.__sizeof__() 

48

In [80]:
t = (1,2,3,4)
t.__sizeof__()  

56

In [81]:
t = (1,2,3,4,5)
t.__sizeof__()  

64

# 待深入了解
1. 想创建一个空的列表，我们可以用下面的 A、B 两种方式，请问它们在效率上有什么区别吗？我们应该优先考虑使用哪种呢？可以说说你的理由。
   ```python
   # 创建空列表
   # option A
   empty_list = list()

   # option B
   empty_list = []
   ```
2. 详细比较一下sort()和reverse()的区别
3. 了解列表和元组在创建过程中的具体流程
