## Python中的常用容器

Python中的容器类型包括`序列类型`, `集合类型`, `映射类型`

### 序列类型

Python中有以下三种基本序列类型, 所谓序列(`Sequence`)即表示容器内的元素是有顺序的.
 * `tuple`(元组): 元组是不可变序列，通常用于储存异构数据的多项集, 当然也可以被用于储存同构数据.
 * `list`(列表): 列表是可变序列，通常用于存放同类项目的集合.
 * `range`: range对象表示不可变的数字序列，通常用于在 for 循环中循环指定的次数

### `tuple`元组

元组是不可变序列，通常用于储存异构数据的多项集(例如映射类型`dict`的`items()`方法的返回值)

In [None]:
# 空元祖可以直接使用 `()` 进行声明, 也可以使用tuple()进行声明
(), type(()), tuple(), type(tuple())

In [None]:
# 单个元素的元组使用`()`的方式声明必须在元素之后增加`,`
print( (1), (1,) )

In [None]:
t1 = (1, 2.33, ("tuple",), ["hello"])

元组中为不可变序列, 具体体现为元组元素__指向__的内存地址不能变, 但是如果元素为可变类型, 那元素的内容可变.

In [None]:
t1[0] = 2

In [None]:
t1[1] = 6.66

In [None]:
t1[2] = ("variadic",)

In [None]:
t1[3].append("world")

In [None]:
print(t1)

### list列表

列表是可变序列，通常用于存放同类项目的集合, 通常用于储存相同类型的数据.当然也可以储存不同类型的数据.

In [None]:
# 与tuple相同, 可以直接使用 [] 或者 list() 来声明一个空数组
print( [], type([]), list(), type(list()) )

In [None]:
# 与tuple不同的是, 在声明单个元素的时候不需要在元素之后多写一个 ,

In [None]:
[1], type([1])

In [None]:
list1 = [1, 2.33, ("tuple",), ["hello"]]

另一个与`tuple`不同的是, `list`中元素指向的内存地址是可变的. 这就意味着我们能修改元素的指向

In [None]:
list1[0] = 2

In [None]:
# 这里同时修改了类型
list1[1] = "6.66"

In [None]:
# 思考是否可以这样修改, 为什么?
list1[2][0] = "variadic"

In [None]:
# 思考是否可以这样修改, 为什么?
list1[2] = "variadic"

In [None]:
list1[3].append("world")

In [None]:
print(list1)

比较常用的是, 我们可以使用`sort`方法来排序列表中的字段

In [None]:
list2 = [1, 2, 0, -1, 9, 7, 6, 5]
list2.sort()
list2

### range对象

对于range对象, 我们之前有简单的介绍过, 这里我们复习一下.

range类型表示不可变的数字序列，一般用于在 for 循环中循环指定的次数。

range 类型相比常规 list 或 tuple 的优势在于一个 range 对象总是占用固定数量的（较小）内存.
不论其所表示的范围有多大（因为它只保存了 start, stop 和 step 值，并会根据需要计算具体单项或子范围的值）

In [None]:
# 只传递一个参数的话, 表示从`0`开始到`X`的序列
list(range(10))

In [None]:
# 如果传递2个参数, 表示从`i`到`j`之间的序列
list(range(2, 8))

In [None]:
# 如果传递了3个参数, 表示从`i`到`j`步长为`k`的序列
list(range(0, 10, 2))

> 扩展阅读, 其实range的简单实现其实看做是一个生成器, 当然实际的range不是一个生成器这么简单

In [None]:
def my_range(stop: int):
    start = 0
    while start != stop:
        yield start
        start += 1
list(my_range(10))

## 容器中的基本操作

### 判断元素是否存在于一个容器中

使用`in`或者`not in`来判断一个元素是否存在于一个容器中

In [None]:
1 in [1, 2, 3], 2 not in [1, 2, 3]

### 容器拼接

在Python中我们可以非常简单的使用`+`进行容器的拼接.

In [None]:
[1, 2, 3] + [4, 5, 6]

In [None]:
(1, 2, 3) + (4, 5, 6)

In [None]:
[1, 2, 3] + list(range(4, 10))

### 重复容器内元素

在Python中可以将一个容器 `*` 一个整数, 可以得到这个容器重复 X 次的结果.

In [None]:
[[]] * 3, [[1, [2, ]]] * 3

In [None]:
list(range(5)) * 3

### 其余操作

* 使用`len()`获取容器的长度
* 使用`min()`获取容器中的最小项
* 使用`max()`获取容器中的最大项
* 使用`s.count(x)`获取容器`s`中`x`出现的次数

In [None]:
len([]), len([()]), len(([], [], [])), len(range(10))

In [None]:
min([1, 2, 3, 4, -1]), max([1, 2, 3, 4, -1])

In [None]:
import random

list3 = []
for _ in range(1000):
    list3.append(random.randint(0, 10))
print(list3.count(6))

## 容器切片(重点)


在Python中, 切片是非常好用且非常常用的一个特性.

* 使用`[i]`获取第`i`项数据(从0开始)
* 使用`[i:j]`获取从`i`到`j`的切片(左闭右开)
* 使用`[i:j:k]`获取`i`到`j`步长为`k`的切片

In [None]:
list4 = list(range(10)); print(list4)

In [None]:
# python中支持使用负数作为索引, 表示从尾部开始取, 注意: 负数的起始值为 -1
list4[-1], list4[-2], list4[-3]

In [None]:
# 获取一个切片, 从第2个元素到底6个元素
list4[2:6]

In [None]:
# 如果不写 i 表示从头部开始取
list4[:5]

In [None]:
# 如果不写 j 表示取到尾部为止
list4[5:]

In [None]:
# 思考: 如果 i 和 j 都不写, 那会打印什么?
list4[:]

In [None]:
# 第三个参数为步长参数, 表示每次隔几个元素取一次值
list4[1:8:2]

In [None]:
# 思考1: 如何反转一个容器?

# 思考2: 如下打印什么
list4[::]

## 集合类型

Python中的集合类型有`set`和`frozenset`(较少使用, 表示创建之后不可修改, 可以简单看做是`tuple`版本的`set`).

`set`对象和`frozenset`对象是由具有唯一性的 hashable 对象所组成的__无序__多项集.

常见的用途包括成员检测、从序列中去除重复项以及数学中的集合类计算，例如交集、并集、差集与对称差集等等。

In [None]:
set1 = set([1, 2, 3, 1, 4, 5, 5, 2])

In [None]:
set1.update([6, 7, 2, 3]); print(set1)

In [None]:
fset1 = frozenset([1, 2, 3, 1, 4, 5, 5, 2])

In [None]:
# 可以使用 dir 来打印一个对象所包含的所有内容
print(dir(fset1))

## 映射类型

在Python中仅有一种映射类型, 即`dict`. 即javascript中的对象, php中的命名数组. 映射属于无序可变对象.

字典的键 几乎 可以是任何值。 非 hashable 的值，即包含列表、字典或其他可变类型的值（此类对象基于值而非对象标识进行比较）不可用作键。 数字类型用作键时遵循数字比较的一般规则：如果两个数值相等 (例如 1 和 1.0) 则两者可以被用来索引同一字典条目。 （但是请注意，由于计算机对于浮点数存储的只是近似值，因此将其用作字典键是不明智的。）

In [None]:
dict1 = {
    "key1": "value1",
    123: 456,
    123.0: 789,
    ("k", "e", "y"): ("k", "e", "y")
}
print(dict1)

In [None]:
# 如果获取字典中不存在的键, 则会发生KeyError错误
dict1["key2"]

In [None]:
# 为了避免这个问题我们可以使用get方法获取字典中的值, 并自定义获取不到的时候返回的默认值
dict1.get("key2", "default value")

In [None]:
# 这里我们可以更近一步, 使用setdefault方法来当获取不到指定键的值的时候自动新增一个默认值, 并且返回默认值
print(dict1.setdefault("key2", "default value and set"))
print(dict1)

In [None]:
# 但是可以给字典中不存在的键赋值
dict1["key3"] = "value3"
print(dict1)

In [None]:
# 在字典上, 我们也可以使用`in`和`not in`判断一个键是否存在于一个字典中
"key1" in dict1, "key2" not in dict1

## 常用的原生扩展容器

Python中的常用原生扩展容易位于包`collections`中

* `namedtuple`命名元组: 简易的纯属性类声明方式, 实际上是一个元组
* `deque`双向链表: 用于解决需要频繁插入删除的业务下原生`list`效率太差的问题
* `OrderedDict`有序字典: 用于解决原生`dict`无序的问题

### namedtuple命名元组

In [None]:
from collections import namedtuple

Pointer = namedtuple('Pointer', 'x y')
Coordinate = namedtuple('Coordinate', 'x, y, z')

start, end = Pointer(0, 0), Pointer(9, 9)
coord1, coord2 =Coordinate(0, 0, 0), Coordinate(9, 9, 9)

print(start, end, coord1, coord2)
print(start.x, start.y)
print(coord2.x, coord2.y, coord2.z)

### deque双向链表

In [None]:
from collections import deque

print(dir(deque()))

### OrderedDict有序字典

In [None]:
from collections import OrderedDict

od = OrderedDict()
od["k1"] = 123
od["k2"] = 123
od["k3"] = 123

for k, v in od.items():
    print(k, v)