# 集合

* 无序性：集合中的元素是无序的  
* 唯一性：集合中的任意两个元素都是不相同的，当集合中存在两个同样的元素的时候，Python只会保存其中的一个  
* 确定性：集合中放入的元素只能是不可变的对象

## 创建集合

In [5]:
a = {1, 2, 3, 1, 2, 4}
print(a)

{1, 2, 3, 4}


创建空集合的时候只能用`set`函数来创建，因为在Python中{}创建的是一个空的字典：

In [1]:
a = set()
type(a)

set

In [3]:
a = {}
type(a)

dict

也可以将其他序列转换为集合：

In [2]:
a = set([1, 2, 3, 1])    # 集合会自动去除重复元素 1
print(a)

{1, 2, 3}


In [7]:
a = set('hello')
print(a)

{'e', 'l', 'o', 'h'}


## 集合元素的循环遍历

In [8]:
for i in a:
    print(i)

e
l
o
h


## 集合的运算

### 成员运算

检查元素是否在集合中

In [9]:
set1 = {11, 12, 13, 14, 15}
10 in set1

False

In [10]:
15 in set1

True

In [11]:
20 not in set1

True

### 交

两个集合的交，返回包含两个集合共有元素的集合。  
可以用方法`a.intersection(b)`或者操作`a & b`实现。

In [12]:
set1 = {1, 2, 3, 4, 5, 6, 7}
set2 = {2, 4, 6, 8, 10}

In [13]:
set1 & set2

{2, 4, 6}

In [14]:
set1.intersection(set2)

{2, 4, 6}

### 并

两个集合的并，返回包含两个集合所有元素的集合（去除重复）。  
可以用方法`a.union(b)`或者操作`a | b`实现。

In [15]:
set1 | set2

{1, 2, 3, 4, 5, 6, 7, 8, 10}

In [16]:
set1.union(set2)

{1, 2, 3, 4, 5, 6, 7, 8, 10}

### 差

a 和 b 的差集，返回只在 a 不在 b 的元素组成的集合。  
可以用方法`a.difference(b)`或者操作`a - b`实现。

In [17]:
set1 - set2

{1, 3, 5, 7}

In [18]:
set1.difference(set2)

{1, 3, 5, 7}

In [19]:
set2.difference(set1)

{8, 10}

### 对称差（异或）

a 和b 的对称差集，返回在 a 或在 b 中，但是不同时在 a 和 b 中的元素组成的集合。  
可以用方法`a.symmetric_difference(b)`或者操作`a ^ b`实现（异或操作符）。

In [20]:
set1 ^ set2

{1, 3, 5, 7, 8, 10}

In [23]:
(set1 | set2) - (set1 & set2)

{1, 3, 5, 7, 8, 10}

In [21]:
set1.symmetric_difference(set2)

{1, 3, 5, 7, 8, 10}

In [22]:
set2.symmetric_difference(set1)

{1, 3, 5, 7, 8, 10}

### 比较运算

In [24]:
set1 = {1, 3, 5}
set2 = {1, 2, 3, 4, 5}
set3 = set2

如果集合 b 的任意一个元素都是集合 a 的元素，那么集合 b 称为集合 a 的子集。  
判断 b 是不是 a 的子集，可以用`b.issubset(a)`方法，或者更简单的用操作`b <= a`  

In [25]:
set1.issubset(set2)

True

In [28]:
set3 <= set2

True

如果 b 是 a 的子集且 b 不等于 a，那么 b 就是 a 的真子集，用操作`b < a`判断。  

In [26]:
set1 < set2

True

In [27]:
set3 < set2

False

反过来可以称 a 是 b 的超集，可以用`a.issuperset(b)`或者`a >= b`来判断

In [29]:
set2.issuperset(set1)

True

In [30]:
set2 >= set1

True

## 集合的方法

### add 方法向集合添加单个元素

跟列表的`append`方法类似，用来向集合添加单个元素

In [35]:
set1 = {1, 2, 3, 5}

In [36]:
set1.add(8)
set1

{1, 2, 3, 5, 8}

如果添加的是已有元素，集合不改变：

In [37]:
set1.add(1)
set1

{1, 2, 3, 5, 8}

### update 方法向集合添加多个元素

跟列表的`extend`方法类似，用来向集合添加多个元素。

In [38]:
set1.update([7, 9, 10])
set1

{1, 2, 3, 5, 7, 8, 9, 10}

### remove 方法移除单个元素

In [39]:
set1.remove(3)
set1

{1, 2, 5, 7, 8, 9, 10}

如果移除的元素不存在会报错：

In [40]:
set1.remove(33)

KeyError: 33

### pop方法弹出元素

由于集合没有顺序，不能像列表一样按照位置弹出元素，所以`pop`方法删除并返回集合中任意一个元素，如果集合中没有元素会报错。

In [41]:
set1.pop()
set1

{2, 5, 7, 8, 9, 10}

### discard 方法

作用与 remove 一样，但是当元素在集合中不存在的时候不会报错

In [42]:
set1.discard(10)
set1

{2, 5, 7, 8, 9}

In [44]:
set1.discard(4)
set1

{2, 5, 7, 8, 9}

### isdisjoint方法判断两个集合有没有相同元素

没有相同元素返回`True`，有相同元素返回`False`

In [45]:
set2 = {1}
set3 = {2}

In [46]:
set1.isdisjoint(set2)

True

In [47]:
set1.isdisjoint(set3)

False

### difference_update方法

`a.difference_update(b)`，从a中去除所有属于b的元素

In [48]:
set1 = {1, 2, 3, 4, 5, 6, 7}
set2 = {1, 3, 5}

In [49]:
set1.difference_update(set2)
set1

{2, 4, 6, 7}