## 基础特性
### 字典
- 在 Python3.7+，字典被确定为有序,长度大小可变，元素可以任意地删减和改变。
- 性能方面,对于查找、添加和删除操作，字典都能在常数时间复杂度内完成。
### 集合
- 相较于字典,集合没有键和值的配对，是一系列无序的、唯一的元素组合。

## 初始化
- 字典的key需要是不可变的,所以不可以为列表这类可变的数据结构(key 首先是不重复的，如果 Key 是可以变化的话，那么随着 Key 的变化，这里就有可能就会有重复的 Key)

In [3]:
d1 = {'name': 'ctt', 'age': 31}
d2 = dict({'name': 'ctt', 'age': 31})
d3 = dict([('name', 'ctt'),('age', 31)])
d4 = dict(name='ctt', age=31)
print(d1 == d2 == d3 == d4)

s1 = {1, 2, 3}
s2 = set({1, 2, 3})
print(s1 == s2)

True
True


## 元素访问
- 字典:直接索引访问,如果不存在,抛异常;get(key, default) 函数来进行索引
- 集合:不支持索引操作,如s[0](本质上是哈希表)
- 判断元素是否存在: key in dict / value in set
- 支持增加、删除、更新(集合不支持)、排序(需要可比较) 操作

In [4]:
# dict
d1['gender']

KeyError: 'gender'

In [7]:
d1.get('gender', 'null')

'null'

In [9]:
# dict
print('name' in d1)

# set
print(1 in s1)

True
True


In [33]:
# dict
d1['gender'] = 'female'
d1['age'] = 26
print(d1)
d1.update([('age', 20)])
d1.pop('gender')
print(d1)


# set
s1.update([5, 55, 'ctt'])
print(s1)
s1.add(6)
s1.discard('ctt')
print(s1)
s1.remove(55) # 需要确保元素在集合中,否则报错
print(s1)


{'name': 'ctt', 'age': 26, 'gender': 'female'}
{'name': 'ctt', 'age': 20}
{1, 2, 3, 5, 6, 55, 'ctt'}
{1, 2, 3, 5, 6, 55}
{1, 2, 3, 5, 6}


In [31]:
# dict
d1['age'] = '22'
d1_sorted_by_key = sorted(d1.items(), key = lambda x : x[0])
d1_sorted_by_value = sorted(d1.items(), key = lambda x : x[1])
print(d1_sorted_by_key)
print(d1_sorted_by_value)

# set
print(sorted(s1))


[('age', '22'), ('name', 'ctt')]
[('age', '22'), ('name', 'ctt')]
{1, 2, 3, 5, 6, 55}
[1, 2, 3, 5, 6, 55]
{1, 2, 3, 5, 6}


## 工作原理
- 字典和集合的内部结构都是一张哈希表。
    - 字典: 这张表存储了哈希值（hash）、键和值这 3 个元素。
    - 集合: 哈希表内没有键和值的配对，只有单一的元素
- 为了提高存储空间的利用率，现在的哈希表除了字典本身的结构，会把索引和哈希值、键、值单独分开,兼顾空间效率和有序,输出如下所示:

Indices
----------------------------------------------------
None | index | None | None | index | None | index ...
----------------------------------------------------

Entries
--------------------
hash0   key0  value0
---------------------
hash1   key1  value1
---------------------
hash2   key2  value2
---------------------
        ...
---------------------
    - 3.6之后通过开放寻址法解决哈希冲突
    - 删除: Python 会暂时对这个位置的元素，赋于一个特殊的值，等到重新调整哈希表的大小时，再将其删除。
    - rehash: 着元素的不停插入，当剩余空间小于 1/3 时，Python 会重新获取更大的内存空间，扩充哈希表。不过，这种情况下，表内所有的元素位置都会被重新排放。

In [5]:
l1 = [1, 2, 3, 4]
l2 = l1
print(l1==l2, l1.__sizeof__())
l1.append(5)
print(l1==l2, l1.__sizeof__())

True 72
True 104
