## Python核心与实战

## 列表和元组:    
* 列表和元组，都是**一个可以放置任意数据类型的有序集合。**
* **列表是动态的**，长度大小不固定，可以随意地增加、删减或者改变元素（mutable）。
* **元组是静态的,不可变的。**，长度大小固定，无法增加删减或者改变（immutable）。
    * 如需对已有的元组做任何“改变”，则需要重新开辟一块内存，创建新的元组。


    
> 元组要比列表更加轻量级一些，所以总体上来说，元组的性能速度要略优于列表

In [6]:
l = [1, 2, 'hello', 'world'] # 列表中同时含有 int 和 string 类型的元素
l

 
tup = ('jason', 22) # 元组中同时含有 int 和 string 类型的元素
tup


('jason', 22)

In [8]:
l = [1, 2, 3, 4]
l[3] = 40 # 和很多语言类似，python 中索引同样从 0 开始，l[3] 表示访问列表的第四个元素
print(l)

 
tup = (1, 2, 3, 4)
tup[3] = 40

[1, 2, 3, 40]


TypeError: 'tuple' object does not support item assignment

In [13]:
tup = (1, 2, 3, 4)
new_tup = tup + (5,) # 创建新的元组 new_tup，并依次填充原元组的值
# 如上构建一个只有一个元素的元组，需要加一个逗号
print(new_tup)

 
l = [1, 2, 3, 4]
l.append(5) # 添加元素 5 到原列表的末尾
l


(1, 2, 3, 4, 5)


[1, 2, 3, 4, 5]

* Python 中的列表和元组都支持负数索引

In [16]:
l = [1,2,3,4,5]
print(l[-1])

tup = (1,2,3,4,5)
print(tup[-2])

5
4


* 列表和元组都支持切片操作

In [19]:
l = [1,2,3,4,5]
print(l[1:4])   #返回1到3的子列表

tup = (1,2,3,4,5)
print(tup[2:5])    # 返回2到4的子列表

[2, 3, 4]
(3, 4, 5)


* 列表和元组都可以随意嵌套

In [None]:
l = [[1,2,3], [4,5]]    # 列表的每一个元素也是一个列表
print(l)

tup = ((1,2,3), (4,5,6))    #元组的每一个


* 两者也可以通过 list() 和 tuple() 函数相互转换

In [1]:
list((1,2,3,4))

[1, 2, 3, 4]

In [2]:
tuple([1,2,3,4])

(1, 2, 3, 4)

* 内置函数：
    * count(item) 表示统计列表 / 元组中 item 出现的次数。
    * index(item) 表示返回列表 / 元组中 item 第一次出现的索引。
    * list.reverse() 和 list.sort() 分别表示原地倒转列表和排序（注意，元组没有内置的这两个函数)。
    * reversed() 和 sorted() 同样表示对列表 / 元组进行倒转和排序，但是会返回一个倒转后或者排好序的新的列表 / 元组。

In [3]:
l = [3,2,3,7,8,1]
l.count(3)

2

In [4]:
l.index(1)

5

In [5]:
l.reverse()

In [6]:
l

[1, 8, 7, 3, 2, 3]

In [7]:
l.sort()

In [8]:
l

[1, 2, 3, 3, 7, 8]

In [17]:
a = reversed(l)

In [18]:
list(a)

[8, 7, 3, 3, 2, 1]

In [19]:
sorted(l)

[1, 2, 3, 3, 7, 8]

* **为了减小每次增加 / 删减操作时空间分配的开销，Python 每次分配空间时都会额外多分配一些，这样的机制（over-allocating）保证了其操作的高效性：增加 / 删除的时间复杂度均为 O(1)。**
* 元组长度大小固定，元素不可变，所以存储空间固定。


* Python 会在后台，对静态数据做一些**资源缓存（resource caching）**。通常来说，因为垃圾回收机制的存在，如果一些变量不被使用了，Python 就会回收它们所占用的内存，返还给操作系统，以便其他变量或其他应用使用。

* 但是对于一些静态变量，比如元组，如果它不被使用并且占用空间不大时，Python 会暂时缓存这部分内存。这样，下次我们再创建同样大小的元组时，Python 就可以不用再向操作系统发出请求，去寻找内存，而是可以直接分配之前缓存的内存空间，这样就能大大加快程序的运行速度。

* 初始化列表和元组的时间对比:元组比列表要快上5倍

```shell
python3 -m timeit 'x=(1,2,3,4,5,6)'
20000000 loops, best of 5: 9.97 nsec per loop
python3 -m timeit 'x=[1,2,3,4,5,6]'
5000000 loops, best of 5: 50.1 nsec per loop
```

* **索引操作**对比：两者速度差别非常小
```shell
python3 -m timeit -s 'x=[1,2,3,4,5,6]' 'y=x[3]'
10000000 loops, best of 5: 22.2 nsec per loop
python3 -m timeit -s 'x=(1,2,3,4,5,6)' 'y=x[3]'
10000000 loops, best of 5: 21.9 nsec per loop
```

#### 列表和元组的使用场景：
1. 如果存储的数据和数量不变，比如有一个函数，需要返回一个地点的经纬度，然后直接传给前端渲染，则选择元组更合适；
2. 如果存储的数据或数量是可变的，比如社交平台上的一个日志功能，是统计一个用户在一周之内看了哪些用户的帖子，那么则用列表更合适。

#### 总结
列表是动态的，长度可变，可以随意的增加、删减或改变元素。列表的存储空间略大于元组，性能略逊于元组。

元组是静态的，长度大小固定，不可以对元素进行增加、删减或者改变操作。元组相对于列表更加轻量级，性能稍优。

In [30]:
empty_list = list()
print(type(empty_list))
print(empty_list.__sizeof__())
print(empty_list)

<class 'list'>
40
[]


In [31]:
empty_list = []
print(type(empty_list))
print(empty_list.__sizeof__())
print(empty_list)

<class 'list'>
40
[]


```python
# 创建空列表
# option A
empty_list = list()
 
# option B
empty_list = []
```
> 上面两种创建列表方式的区别主要在于list()是一个function call，Python的function call会创建stack，并且进行一系列参数检查的操作，比较expensive，反观[]是一个内置的C函数，可以直接被调用，因此效率高。

## 字典、集合

* 字典是一系列由键（key）和值（value）配对组成的元素的集合。
* 相比于列表和元组，字典的性能更优，特别是对于查找、添加和删除操作，字典都能在常数时间复杂度内完成。
* 而集合和字典基本相同，唯一的区别，就是集合没有键和值的配对，是一系列无序的、唯一的元素组合。

In [32]:
d1 = {'name':'soufal','age': 20,}

In [38]:
d1 = {'name': 'jason', 'age': 20, 'gender': 'male'}
d2 = dict({'name': 'jason', 'age': 20, 'gender': 'male'})
d3 = dict([('name', 'jason'), ('age', 20), ('gender', 'male')])
d4 = dict(name='jason', age=20, gender='male') 
d1 == d2 == d3 ==d4

True

In [39]:
s1 = {1, 2, 3}
s2 = set([1, 2, 3])
s1 == s2

True

In [37]:
'soufal' in d1

False

* 字典访问可以直接索引键，如果不存在，就会抛出异常.


In [49]:
d = {'name': 'jason', 'age': 20}
d['name']


'jason'

In [50]:

d['location']

KeyError: 'location'

In [51]:
# 也可以使用get(key,default),如果键不存在，调用 get() 函数可以返回一个默认值。
d = {'name': 'jason', 'age': 20}
d.get('name')


'jason'

In [52]:

d.get('location', 'haha')

'haha'

* 集合并不支持索引操作，因为集合本质上是一个哈希表，和列表不一样。

In [54]:
s = {1, 2, 3}
s[0]

TypeError: 'set' object is not subscriptable

* 想要判断一个元素(key)在不在字典或集合内，我们可以用 value in dict/set 来判断。

In [59]:
s = {1, 2, 3}
1 in s

True

In [60]:
4 in s

False

In [61]:
d = {'name': 'jason', 'age': 20}
'name' in d

True

In [62]:
1 in d

False

* 除了创建和访问，字典和集合也同样支持增加、删除、更新等操作。

In [63]:
d = {'name': 'jason', 'age': 20}
d['gender'] = 'male' # 增加元素对'gender': 'male'
d['dob'] = '1999-02-01' # 增加元素对'dob': '1999-02-01'

In [64]:
d

{'name': 'jason', 'age': 20, 'gender': 'male', 'dob': '1999-02-01'}

In [65]:
d['dob'] = '1998-01-01' # 更新键'dob'对应的值 
d.pop('dob') # 删除键为'dob'的元素对

'1998-01-01'

In [66]:
d

{'name': 'jason', 'age': 20, 'gender': 'male'}

In [67]:
s = {1, 2, 3}
s.add(4) # 增加元素 4 到集合

In [68]:
s

{1, 2, 3, 4}

In [69]:
s.remove(4) # 从集合中删除元素 4
s

{1, 2, 3}

> 集合的 pop() 操作是删除集合中最后一个元素，可是集合本身是无序的，你无法知道会删除哪个元素。

* 对于字典，我们通常会根据键或值，进行升序或降序排序

In [70]:
d = {'b': 1, 'a': 2, 'c': 10}
d_sorted_by_key = sorted(d.items(), key=lambda x: x[0]) # 根据字典键的升序排序
d_sorted_by_value = sorted(d.items(), key=lambda x: x[1]) # 根据字典值的升序排序


In [71]:
d_sorted_by_key

[('a', 2), ('b', 1), ('c', 10)]

In [74]:
d_sorted_by_value

[('b', 1), ('a', 2), ('c', 10)]

* 对于集合，其排序和前面讲过的列表、元组很类似，直接调用 sorted(set) 即可，结果会返回一个排好序的列表

In [73]:
s = {3, 4, 2, 1}
sorted(s) # 对集合的元素进行升序排序

[1, 2, 3, 4]