# 集合

集合即非`序列类型`也非`可变类型`（`可变类型`和`序列类型`的概念在 [数据类型]('./types.ipynb') 有讲）

它是一个无序但不重复的数据结构

集合的元素必须是可哈希的，而可哈希的对象必须是不可变的。这是因为集合是基于哈希表实现的，哈希表要求元素是可哈希的以确保高效的插入、查找和删除操作。

不可变的对象在其生命周期中保持不变，因此它们的哈希值也不会改变。这使得可以使用对象的哈希值来确定其在集合中的位置，从而实现高效的集合操作。


## 创建一个集合


In [94]:
# 空集合
set()

# 使用大括号包裹的元素集合
my_set = {"a", 3, (2, "t"), 3}

### 新增元素


In [95]:
# 新增一个元素
my_set.add("add")

# 用于将一个或多个可迭代对象的元素添加到集合中。
# 它可以接受多个参数，并将这些参数中的元素添加集合中。重复的元素不会被重复添加。
my_set.update(["cherry", "durian"], {"grape", "banana"})

my_set

{(2, 't'), 3, 'a', 'add', 'banana', 'cherry', 'durian', 'grape'}

### 删除元素


In [96]:
# 元素不存在时 remove 会引发 KeyError 错误
my_set.remove(3)

# discard 在元素不存在时无提示信息
my_set.discard(3)

# pop 用于从集合中随机移除并返回一个元素。由于集合是无序的，无法确定具体移除的元素是哪个。
# 如果集合为空，调用 pop 方法会引发 KeyError 错误。
print(my_set.pop())

my_set

banana


{(2, 't'), 'a', 'add', 'cherry', 'durian', 'grape'}

In [97]:
len(my_set)

3 in my_set

False

### 清空集合


In [98]:
my_set.clear()

### 集合推导式

推导式详情看这节[推导式 & 生成器表达式]('./comprehension.ipynb')


In [99]:
{x**2 for x in range(1, 6) if x % 2 == 0}

{4, 16}

In [100]:
s1 = set("abracadabra")
s2 = set("alacazam")
# 交
s1 & s2

{'a', 'c'}

In [101]:
# 排除
s1 - s2

{'b', 'd', 'r'}

In [102]:
# 或
s1 | s2

{'a', 'b', 'c', 'd', 'l', 'm', 'r', 'z'}

In [103]:
# 异或
s1 ^ s2

{'b', 'd', 'l', 'm', 'r', 'z'}