# 集合 Set

![](../pictures/集合Set的使用.png)

## 集合Set的特性

- set和dict的结构非常类似, 最关键的不同是, 在Set中只有只有Key, 而没有Value.可以认为Set就是只有keys的而不储存values的字典.

- 因此set中的key和字典中有相同的特性, 1. key必须是不可变的数据类型 2. 不能有相同的重复key存在.

- 因此set非常适合用于去掉重复值的操作.

- 除此之外, set还可以进行数学中的集合运算, 例如交集并集差集等.

In [None]:
s = set()
s

In [None]:
type(s)

In [None]:
a = [1, 2, 3]

In [None]:
# 要创建一个set，需要提供一个list作为输入集合：
s = set(a)
s

In [None]:
d = {1:'a', 2:'b', 3:'c'}
d

## 去除重复值

In [65]:
L = [1, 2, 3, 4, 5, 3, 3, 2, 2, 1, 4, 5, 6, 7, 5]

In [66]:
s = set(L)
s

{1, 2, 3, 4, 5, 6, 7}

In [67]:
list(s)

[1, 2, 3, 4, 5, 6, 7]

要注意的是set是无序的, 虽然这里1, 2, 3是顺序显示的

In [68]:
s = set([2, 1, 3])
s

{1, 2, 3}

## 集合中添加和删除值

可以通过add(key)方法添加元素到set中，但对于已经存在的值不会有效果

In [69]:
s = set([1, 2, 3, 4, 5, 3, 3, 2, 2, 1, 4, 5, 6, 7, 5])
s

{1, 2, 3, 4, 5, 6, 7}

In [70]:
s.add(100)
s

{1, 2, 3, 4, 5, 6, 7, 100}

In [71]:
s.add('test')
s

{1, 100, 2, 3, 4, 5, 6, 7, 'test'}

In [72]:
s.add(4) # 如果元素已经存在, 则不会添加
s

{1, 100, 2, 3, 4, 5, 6, 7, 'test'}

In [73]:
s.remove('test')
s

{1, 2, 3, 4, 5, 6, 7, 100}

In [74]:
# remove(key) 移除值
s.remove(4)
s

{1, 2, 3, 5, 6, 7, 100}

In [75]:
s.remove(66) # remove , 如果删除的值不存在, 则报错

KeyError: 66

In [76]:
s

{1, 2, 3, 5, 6, 7, 100}

In [77]:
s.discard(100)
s

{1, 2, 3, 5, 6, 7}

In [78]:
s.discard(66)
s

{1, 2, 3, 5, 6, 7}

In [79]:
s.pop()

{2, 3, 5, 6, 7}

In [80]:
s

{2, 3, 5, 6, 7}

In [81]:
s.pop()

2

In [82]:
s

{3, 5, 6, 7}

In [83]:
s.pop() #随机删除一个元素

3

In [84]:
s

{5, 6, 7}

## 集合的操作\_交集并集差集补集

In [87]:
s = set([1, 2, 3, 4, 5, 6, 7])
s

{1, 2, 3, 4, 5, 6, 7}

In [85]:
a = set([5, 6, 7, 8, 9, 10])
a

{5, 6, 7, 8, 9, 10}

### 交集

In [91]:
# 用符号 & 找出集合交集
s & a

{5, 6, 7}

In [92]:
s.intersection(a) # 生成一个新的结果, 原来的集合不变

{5, 6, 7}

In [94]:
s.intersection_update(a) # 直接在集合上进行更新

In [95]:
s

{5, 6, 7}

### 并集

In [103]:
s = set([1, 2, 3, 4, 5, 6, 7])
a = set([5, 6, 7, 8, 9, 10])

In [104]:
s | a

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

In [105]:
s.union(a)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

In [106]:
s.update(a)

In [107]:
s

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

### 差集

In [117]:
s = set([1, 2, 3, 4, 5, 6, 7])
a = set([5, 6, 7, 8, 9, 10])

In [118]:
s - a

{1, 2, 3, 4}

In [119]:
a - s

{8, 9, 10}

In [120]:
s.difference(a)

{1, 2, 3, 4}

In [None]:
s.difference_update(a)
s

### 补集

In [121]:
s = set([1, 2, 3, 4, 5, 6, 7])
a = set([5, 6, 7, 8, 9, 10])

In [124]:
s ^ a

{1, 2, 3, 4, 8, 9, 10}

In [125]:
s.symmetric_difference(a)

{1, 2, 3, 4, 8, 9, 10}

In [None]:
s.symmetric_difference_update(a)

### 判断集合是否子集

In [130]:
x = set([1, 2, 3])
y = set([1, 2, 3, 4, 5, 6])

In [131]:
x.issubset(y)

True

In [132]:
k = set([1, 2, 9])

In [133]:
k.issubset(y)

False

### 集合方法整理表格



| 方法                          | 描述                                                         |
| ----------------------------- | ------------------------------------------------------------ |
| add()                         | 为集合添加元素                                               |
| clear()                       | 移除集合中的所有元素                                         |
| copy()                        | 拷贝一个集合                                                 |
| pop()                         | 随机移除元素                                                 |
| remove()                      | 移除指定元素                                                 |
| update()                      | 给集合添加元素                                               |
| difference()                  | 返回多个集合的差集                                           |
| difference_update()           | 移除集合中的元素，该元素在指定的集合也存在。                 |
| discard()                     | 删除集合中指定的元素                                         |
| intersection()                | 返回集合的交集                                               |
| intersection_update()         | 删除集合中的元素，该元素在指定的集合中不存在。               |
| isdisjoint()                  | 判断两个集合是否包含相同的元素，如果没有返回 True，否则返回 False。 |
| issubset()                    | 判断指定集合是否为该方法参数集合的子集。                     |
| issuperset()                  | 判断该方法的参数集合是否为指定集合的子集                     |
| symmetric_difference()        | 返回两个集合中不重复的元素集合。                             |
| symmetric_difference_update() | 移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中。 |
| union()                       | 返回两个集合的并集                                           |
